کیس اسٹڈی: کلام کا مجموعہ
حقیقی دنیا کا حل۔
ڈیٹا جو عالمی بات چیت کو طاقت دیتا ہے۔
یوٹرنس ٹریننگ کی ضرورت اس لیے پیدا ہوتی ہے کیونکہ تمام گاہک اسکرپٹڈ فارمیٹ میں اپنے صوتی معاونین سے بات چیت کرتے یا سوالات پوچھتے وقت بالکل درست الفاظ یا جملے استعمال نہیں کرتے۔ اس لیے مخصوص صوتی ایپلی کیشنز کو بے ساختہ اسپیچ ڈیٹا پر تربیت دی جانی چاہیے۔ مثال کے طور پر، "قریب ترین ہسپتال کہاں واقع ہے؟" "میرے نزدیک کوئی ہسپتال تلاش کریں" یا "کیا آس پاس کوئی ہسپتال ہے؟" سبھی ایک ہی تلاش کے ارادے کی نشاندہی کرتے ہیں لیکن مختلف طریقے سے بیان کیے جاتے ہیں۔
مسئلہ
دنیا بھر کی زبانوں کے لیے کلائنٹس کے ڈیجیٹل اسسٹنٹ کے اسپیچ روڈ میپ کو انجام دینے کے لیے، ٹیم کو اسپیچ ریکگنیشن AI ماڈل کے لیے بڑی تعداد میں تربیتی ڈیٹا حاصل کرنے کی ضرورت تھی۔ کلائنٹ کی اہم ضروریات یہ تھیں:
- 3 عالمی زبانوں میں اسپیچ ریکگنیشن سروسز کے لیے بڑی مقدار میں تربیتی ڈیٹا حاصل کریں (سنگل سپیکر کا بیان 30-13 سیکنڈ سے زیادہ نہیں)
- ہر زبان کے لیے، سپلائر ریکارڈ کرنے کے لیے بولنے والوں کے لیے ٹیکسٹ پرامپٹس تیار کرے گا (جب تک کہ
کلائنٹ کی فراہمی) اور نتیجے میں آڈیو کو نقل کریں۔ - متعلقہ JSON فائلوں کے ساتھ آڈیو ڈیٹا اور ریکارڈ شدہ الفاظ کی نقل فراہم کریں۔
تمام ریکارڈنگز کے لیے میٹا ڈیٹا پر مشتمل ہے۔ - عمر، جنس، تعلیم اور بولی کے لحاظ سے بولنے والوں کے متنوع امتزاج کو یقینی بنائیں
- تفصیلات کے مطابق ریکارڈنگ کے ماحول کے متنوع مرکب کو یقینی بنائیں۔
- ہر آڈیو ریکارڈنگ کم از کم 16kHz ہو گی لیکن ترجیحاً 44kHz ہو گی۔
اپنی بات چیت کی AI ایپلیکیشن کی ترقی کو 100% تیز کریں
"بہت سے وینڈرز کا جائزہ لینے کے بعد، کلائنٹ نے بات چیت کے AI پروجیکٹس میں مہارت کی وجہ سے Shaip کا انتخاب کیا۔ ہم Shaip کی پروجیکٹ کو انجام دینے کی اہلیت، ماخذ میں ان کی مہارت، 13 زبانوں میں ماہر لسانیات کے مطلوبہ الفاظ کو سخت ٹائم لائنز کے اندر اور مطلوبہ معیار کے ساتھ فراہم کرنے سے بہت متاثر ہوئے۔"
حل
بات چیت کی AI کے بارے میں اپنی گہری سمجھ کے ساتھ، ہم نے کلائنٹ کو ماہر لسانیات اور تشریح کاروں کی ٹیم کے ساتھ ڈیٹا اکٹھا کرنے، نقل کرنے اور تشریح کرنے میں مدد کی تاکہ وہ اپنے AI سے چلنے والے اسپیچ پروسیسنگ کثیر لسانی وائس سویٹ کو تربیت دیں۔
شیپ کے لیے کام کا دائرہ اسپیچ ریکگنیشن کے لیے بڑی مقدار میں آڈیو ٹریننگ ڈیٹا حاصل کرنے، ہمارے ٹائر 1 اور ٹائر 2 زبان کے روڈ میپ پر تمام زبانوں کے لیے متعدد زبانوں میں آڈیو ریکارڈنگ کو نقل کرنے، اور متعلقہ ڈیلیور کرنے تک محدود نہیں تھا۔ JSON میٹا ڈیٹا پر مشتمل فائلیں۔ شیپ نے پیچیدہ پروجیکٹس کے لیے ایم ایل ماڈلز کو تربیت دینے کے لیے مطلوبہ معیار کو برقرار رکھتے ہوئے پیمانے پر 3-30 سیکنڈ کے الفاظ جمع کیے ہیں۔
- آڈیو جمع، نقل اور تشریح شدہ: 22,250 گھنٹے
- تائید شدہ زبانیں: 13 (ڈینش، کورین، سعودی عرب عربی، ڈچ، مین لینڈ اور تائیوان چینی، فرانسیسی کینیڈین، میکسیکن ہسپانوی، ترکی، ہندی، پولش، جاپانی، روسی)
- کلمات کی تعداد: 7M +۔
- ٹائم لائن: ماہ 7 8

16 kHz پر آڈیو کلمات جمع کرتے ہوئے، ہم نے متنوع ریکارڈنگ ماحول میں عمر، جنس، تعلیم اور بولیوں کے لحاظ سے مقررین کے صحت مند امتزاج کو یقینی بنایا۔
نتیجہ
ماہر لسانیات کے اعلیٰ معیار کے آڈیو ڈیٹا نے کلائنٹ کو 13 عالمی سطح 1 اور 2 زبانوں میں اپنے کثیر لسانی تقریر کی شناخت کے ماڈل کو درست طریقے سے تربیت دینے کا اختیار دیا۔ سونے کے معیاری تربیتی ڈیٹاسیٹس کے ساتھ، کلائنٹ مستقبل کے حقیقی دنیا کے مسائل کو حل کرنے کے لیے ذہین اور مضبوط ڈیجیٹل مدد فراہم کر سکتا ہے۔
ہماری مہارت
تجویز کردہ وسائل
خریداروں کے لئے رہنما
خریدار کی گائیڈ: بات چیت AI
آپ نے جس چیٹ بوٹ کے ساتھ بات چیت کی ہے وہ ایک اعلی درجے کی بات چیت کے AI سسٹم پر چلتا ہے جو کہ بہت سارے اسپیچ ریکگنیشن ڈیٹا سیٹس کا استعمال کرتے ہوئے تربیت یافتہ، جانچا اور بنایا گیا ہے۔
بلاگ
ریاست کی بات چیت AI 2025
Conversational AI 2025 انفوگرافکس بات کرتے ہیں کہ Conversational AI کیا ہے ، اس کا ارتقاء ، اقسام ، علاقائی لحاظ سے بات چیت AI مارکیٹ ، استعمال کے معاملات ، چیلنجز وغیرہ۔
بلاگ
سری اور الیکسا کیسے سمجھتے ہیں کہ آپ کیا کہہ رہے ہیں؟
وائس اسسٹنٹ یہ ٹھنڈی، زیادہ تر خواتین کی آوازیں ہو سکتی ہیں جو قریب ترین ریستوراں یا مال کا مختصر ترین راستہ تلاش کرنے کی آپ کی درخواستوں کا جواب دیتی ہیں۔
ہمیں بتائیں کہ ہم آپ کے اگلے AI اقدام میں کس طرح مدد کرسکتے ہیں۔