آواز پر مبنی UPI ادائیگی کے اشارے: بہتر AI ماڈلز کے لیے تنوع کو حاصل کرنا

اعلی معیار، ثقافتی طور پر متنوع ڈیٹا کے ساتھ آواز پر مبنی UPI ادائیگی کے نظام کو سپورٹ کرنے کے لیے فوری تخلیق اور متنوع آڈیو ریکارڈنگ میں Shaip کی مہارت کا فائدہ اٹھانا۔

آواز پر مبنی upi ادائیگی کا اشارہ

منصوبے کا جائزہ

Shaip نے مختلف UPI ادائیگی کے اشارے تخلیق اور ریکارڈ کرکے آواز پر مبنی ادائیگی کی ایپلی کیشن تیار کرنے کے لیے معروف فنٹیک کمپنی کے ساتھ شراکت کی۔ اس پروجیکٹ میں ادائیگی سے متعلق 2,500 ارادوں میں 87,000 منفرد اشارے اور 13 متنوع اشارے کی تخلیق شامل تھی، جیسے کہ رقم بھیجنا، رقم کی درخواست کرنا، بیلنس انکوائری، اور بل کی ادائیگی۔ متنوع خطوں، پس منظر اور عمر کے گروہوں کے 200 بولنے والوں کے ذریعہ یہ اشارے 45 گھنٹے سے زیادہ ریکارڈ کیے گئے، جس سے لسانی اور ماحولیاتی تنوع کی ایک وسیع صف کو یقینی بنایا گیا۔

پروجیکٹ کا مقصد ایک AI ماڈل کے لیے اعلیٰ معیار کا تربیتی ڈیٹا تیار کرنا تھا جو حقیقی دنیا کی ترتیبات میں UPI ادائیگیوں سے متعلق صوتی کمانڈز کو پہچان سکے اور ان کا جواب دے سکے۔

آواز پر مبنی upi ادائیگی

اہم اعدادوشمار

UPI ادائیگی کے اشارے کے آڈیو اوقات ریکارڈ کیے گئے۔

200

متنوع پس منظر سے تعلق رکھنے والے مقررین (عمر، تعلیم، علاقہ)

45

87,000+ متنوع اشارے کے ساتھ ارادوں کا احاطہ کیا گیا ہے۔

13

زبانیں: انگریزی، مختلف مادری زبانوں کے پس منظر کے بولنے والوں کے ساتھ (کوماونی، بنگالی، ملیالم، گجراتی، ہندی، مراٹھی وغیرہ)

پروجیکٹ کا دائرہ کار

فوری تخلیق

دائرہ کار میں آواز پر مبنی UPI ادائیگی کے نظام کے لیے منفرد اشارے بنانا شامل تھا۔ پرامپٹس کو ایک سے زیادہ ارادوں کا احاطہ کرنے کے لیے ڈیزائن کیا گیا تھا، اس بات کو یقینی بناتے ہوئے کہ وہ ساخت، الفاظ اور ناموں کے لحاظ سے متنوع ہیں۔ کچھ اہم پہلوؤں میں شامل ہیں:

13 کلیدی مقاصد، بشمول:

  • پیسے بھیجو: 65,653 منفرد اور متنوع اشارے
  • بیلنس انکوائری: 3,052 پرامپٹس
  • رقم کی درخواست: 26,972 پرامپٹس
  • لین دین کی تاریخ، ریچارج، بل کی ادائیگی وغیرہ۔

آڈیو ریکارڈنگ

صداقت اور حقیقی دنیا کے اطلاق کو یقینی بنانے کے لیے، مختلف لسانی پس منظر سے تعلق رکھنے والے 45 بولنے والوں کے ذریعے اشارے ریکارڈ کیے گئے۔ مختلف مادری زبانوں، علاقائی بولیوں، اور ماحول (اندرونی اور بیرونی) کے ذریعے پکڑے گئے تنوع نے تربیتی ڈیٹا کو بڑھانے میں مدد کی۔

  • زبان کا تنوع: صارفین انگریزی میں روانی رکھتے ہیں لیکن مختلف مادری زبانوں کے ساتھ، جیسے کماونی، گجراتی، ہندی، بنگلہ، مراٹھی اور ملیالم۔
  • عمر، جنس، اور تعلیمی پس منظر: ڈیٹا نے ڈیموگرافکس کی ایک وسیع رینج کو حاصل کیا۔
  • شہری اور دیہی بولنے والے: حقیقی دنیا کے استعمال کی عکاسی کرنے کے لیے، شہری اور دیہی دونوں بولنے والوں کو شامل کیا گیا تھا۔
  • ریکارڈنگ کا ماحول: آڈیو ریکارڈنگ ان ڈور اور آؤٹ ڈور سیٹنگز میں کی گئی تھی، جس میں مختلف قسم کے پس منظر کے شور شامل تھے۔

چیلنجز

لسانی اور علاقائی تنوع

متنوع علاقائی بولیوں اور بولنے والوں کی خصوصیات کی عکاسی کو یقینی بنانے کے لیے محتاط منصوبہ بندی اور عمل درآمد کی ضرورت ہے۔

قدرتی آڈیو تغیرات

پس منظر کے شور اور ماحولیاتی حالات (اندرونی بمقابلہ آؤٹ ڈور) کو ہینڈل کرنا حقیقی دنیا کے اطلاق کے لیے بہت ضروری تھا۔

متنوع اسپیکر پروفائلز

مختلف عمر کے گروہوں، تعلیمی پس منظر، اور دیہی/شہری علاقوں سے بولنے والوں کی شمولیت نے مستند ڈیٹا حاصل کرنے میں پیچیدگی کا آغاز کیا۔

حل

شیپ نے ایک حل پیش کیا جس نے جدید ترین NLP تکنیکوں کو لاگو کرکے اور فوری تخلیق اور ریکارڈنگ دونوں میں محتاط منصوبہ بندی کے ذریعے پروجیکٹ کے چیلنجوں سے نمٹا۔ کے اہم پہلوؤں
حل شامل ہے:

فوری تخلیق

  • 2,500 منفرد اشارے بنائے گئے، ہر ایک کی ساخت اور الفاظ کے لحاظ سے متنوع۔
  • 13 بنیادی ادائیگی کی درخواستوں سے لے کر مزید پیچیدہ انکوائریوں جیسے لین دین کی تاریخ اور بل کی ادائیگیوں تک کے ارادوں کا احاطہ کیا گیا تھا۔

آڈیو ریکارڈنگ

  • 200 گھنٹے آڈیو ریکارڈنگ کی طرف سے منعقد کیا گیا تھا 45 صارفین, مقامی زبانوں، ماحول اور بولنے والوں کی آبادی میں تنوع کو یقینی بنانا۔
  • قدرتی آڈیو تغیر کو یقینی بنانے کے لیے اندرون اور بیرونی دونوں ماحول کو ریکارڈنگ کے لیے استعمال کیا گیا۔
  • مقررین نے درست لسانی نمائندگی کو یقینی بناتے ہوئے علاقائی بولیوں کی ایک رینج کی نمائندگی کی۔
آشےحساببیلنس انکوائریرقم کی درخواست کریں۔ٹرانزیکشن کی تاریخ
فوری طور پرگھر کے کرایے کے لیے سماٹری کو اکیس سو کی ادائیگی کرومیں اپنے بچت اکاؤنٹ میں اپنا موجودہ بیلنس جاننا چاہتا ہوں۔کیا آپ راجی، ایمرجنسی کے لیے تین سو اٹھارہ روپے کی درخواست کر سکتے ہیں؟
مجھے میرے ڈیبٹ کارڈ کی لین دین کی تاریخ دکھائیں۔
گجراتیસુમાત્રીને گھر کے کرایہ دار پیٹے ایکویسو دعائیںمیں اپنے خالی ખાતા میں موجودہ بیلنس માંગુ ہوں۔શું તમે રાજી શકો છો?مجھے میرے ڈیبٹ کارڈ کے نشان نشانات.
ہندیسوماتری کو مکا ن کے لیے ادائیگی کریں |میں اپنی بچت اکاؤنٹ میں موجودہ رقم جاننا چاہتا ہوں۔کیا آپ راجی سے کسی इमरजेंसी کے لیے تین سو اٹھارہ روپے مانگ سکتے ہیں؟مجھے میرا डेबिट कार्ड का लेनदेन ब्यौरा दिखाओ।
ملیالمВидео Видео دیکھیں۔എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലെ തുക അേവിക അക് ആഗ്രഹിക്കുന്നു.RAJAJITIAN MAMANI ആവശ്യപ്പെടാമോ؟എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവരണം കാണിക്.
تیلگوఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్వకక చెల్లించండినేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రసస౤ బ్యాలెన్స్ ను తెలుసుకోవాలనుకుంటుకుంటునన.ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిది రూపాయలు అడగగలరానా డెబిట్ కార్డ్ లావాదేవీ చరిేవీ చరిేత్రను ను చూపించండి.
بنگلہ বাংলাবাড়ি ভাড়া সুলিকে ২১,০০০ টাকা পরিশোধ করুনআমি আমার সঞ্চয় আপনার বর্তমান ব্যালেন্স জানতে চাই.আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য তিনশো আঠারো টাকাচেয়ে নিতে পারেন?আমার ডেবিটের লেনদেনের ইতিহাস দেখান۔
مراٹهیसुमात्री ला घरा चे रेंट के लिए दो हजार एक संभर रुपये चुकावामला माये बचत खाते मधी चालू बॅलन्स جانا چا ہے۔کیا آپ راجی سے तीन सो अठराह रुपय मांगु इमरजेंसी के लिए ?.

نتیجہ

شیپ کے ذریعے فراہم کیے گئے اعلیٰ معیار کے، متنوع آڈیو ڈیٹا نے کلائنٹ کو AI سے چلنے والی آواز پر مبنی UPI ادائیگی کا نظام تیار کرنے کی اجازت دی جو مختلف بولیوں، ماحول اور سیاق و سباق میں حکموں کو پہچاننے کے قابل ہے۔ ڈیٹا کو بڑھانے میں مدد ملی:

  • ریئل ٹائم آواز کی شناخت پیچیدہ ماحول میں.
  • زیادہ درست UPI لین دین صارفین کی ایک وسیع رینج کے لیے ہینڈلنگ۔
  • سکالٹیبل: یہ پروجیکٹ دیگر ہندوستانی زبانوں میں پھیلنے کے لیے ایک مضبوط بنیاد رکھتا ہے۔

فراہمی

  • 200 گھنٹے آڈیو فائلوں کی (8 kHz PCM WAV فارمیٹ، مونو)
  • 87,000 + متنوع اشارے منفرد ارادوں کے ساتھ تشریح شدہ
  • میٹا ڈیٹا: اسپیکر پروفائلز، ماحول کی تفصیلات، اور نقل کی درستگی

منفرد اشارے اور مستند آڈیو ریکارڈنگ کے ذریعے ہندوستان کے تنوع کو حاصل کرنے کی Shaip کی صلاحیت ہمارے آواز پر مبنی UPI ادائیگی کے نظام کے لیے ایک گیم چینجر رہی ہے۔ ان کی ٹیم نے اس بات کو یقینی بنایا کہ پراجیکٹ کے ہر پہلو کو – فوری تخلیق سے لے کر ریکارڈنگ کے معیار تک – کو درستگی کے ساتھ سنبھالا گیا، جس سے ہمیں مزید جامع، مضبوط آواز کی شناخت کا ماڈل بنانے میں مدد ملے۔

گولڈن-5-ستارہ