کیس اسٹڈی: کلام کا مجموعہ

7 زبانوں میں کثیر لسانی ڈیجیٹل اسسٹنٹ بنانے کے لیے 13M+ یوٹرننس فراہم کیے گئے۔
کلمات کا مجموعہ

حقیقی دنیا کا حل۔

ڈیٹا جو عالمی بات چیت کو طاقت دیتا ہے۔

یوٹرنس ٹریننگ کی ضرورت اس لیے پیدا ہوتی ہے کیونکہ تمام گاہک اسکرپٹڈ فارمیٹ میں اپنے صوتی معاونین سے بات چیت کرتے یا سوالات پوچھتے وقت بالکل درست الفاظ یا جملے استعمال نہیں کرتے۔ اس لیے مخصوص صوتی ایپلی کیشنز کو بے ساختہ اسپیچ ڈیٹا پر تربیت دی جانی چاہیے۔ مثال کے طور پر، "قریب ترین ہسپتال کہاں واقع ہے؟" "میرے نزدیک کوئی ہسپتال تلاش کریں" یا "کیا آس پاس کوئی ہسپتال ہے؟" سبھی ایک ہی تلاش کے ارادے کی نشاندہی کرتے ہیں لیکن مختلف طریقے سے بیان کیے جاتے ہیں۔

کلام کا مجموعہ 1

مسئلہ

دنیا بھر کی زبانوں کے لیے کلائنٹس کے ڈیجیٹل اسسٹنٹ کے اسپیچ روڈ میپ کو انجام دینے کے لیے، ٹیم کو اسپیچ ریکگنیشن AI ماڈل کے لیے بڑی تعداد میں تربیتی ڈیٹا حاصل کرنے کی ضرورت تھی۔ کلائنٹ کی اہم ضروریات یہ تھیں:

  • 3 عالمی زبانوں میں اسپیچ ریکگنیشن سروسز کے لیے بڑی مقدار میں تربیتی ڈیٹا حاصل کریں (سنگل سپیکر کا بیان 30-13 سیکنڈ سے زیادہ نہیں)
  • ہر زبان کے لیے، سپلائر ریکارڈ کرنے کے لیے بولنے والوں کے لیے ٹیکسٹ پرامپٹس تیار کرے گا (جب تک کہ
    کلائنٹ کی فراہمی) اور نتیجے میں آڈیو کو نقل کریں۔
  • متعلقہ JSON فائلوں کے ساتھ آڈیو ڈیٹا اور ریکارڈ شدہ الفاظ کی نقل فراہم کریں۔
    تمام ریکارڈنگز کے لیے میٹا ڈیٹا پر مشتمل ہے۔
  • عمر، جنس، تعلیم اور بولی کے لحاظ سے بولنے والوں کے متنوع امتزاج کو یقینی بنائیں
  • تفصیلات کے مطابق ریکارڈنگ کے ماحول کے متنوع مرکب کو یقینی بنائیں۔
  • ہر آڈیو ریکارڈنگ کم از کم 16kHz ہو گی لیکن ترجیحاً 44kHz ہو گی۔

اپنی بات چیت کی AI ایپلیکیشن کی ترقی کو 100% تیز کریں

"بہت سے وینڈرز کا جائزہ لینے کے بعد، کلائنٹ نے بات چیت کے AI پروجیکٹس میں مہارت کی وجہ سے Shaip کا انتخاب کیا۔ ہم Shaip کی پروجیکٹ کو انجام دینے کی اہلیت، ماخذ میں ان کی مہارت، 13 زبانوں میں ماہر لسانیات کے مطلوبہ الفاظ کو سخت ٹائم لائنز کے اندر اور مطلوبہ معیار کے ساتھ فراہم کرنے سے بہت متاثر ہوئے۔"

حل

بات چیت کی AI کے بارے میں اپنی گہری سمجھ کے ساتھ، ہم نے کلائنٹ کو ماہر لسانیات اور تشریح کاروں کی ٹیم کے ساتھ ڈیٹا اکٹھا کرنے، نقل کرنے اور تشریح کرنے میں مدد کی تاکہ وہ اپنے AI سے چلنے والے اسپیچ پروسیسنگ کثیر لسانی وائس سویٹ کو تربیت دیں۔

شیپ کے لیے کام کا دائرہ اسپیچ ریکگنیشن کے لیے بڑی مقدار میں آڈیو ٹریننگ ڈیٹا حاصل کرنے، ہمارے ٹائر 1 اور ٹائر 2 زبان کے روڈ میپ پر تمام زبانوں کے لیے متعدد زبانوں میں آڈیو ریکارڈنگ کو نقل کرنے، اور متعلقہ ڈیلیور کرنے تک محدود نہیں تھا۔ JSON میٹا ڈیٹا پر مشتمل فائلیں۔ شیپ نے پیچیدہ پروجیکٹس کے لیے ایم ایل ماڈلز کو تربیت دینے کے لیے مطلوبہ معیار کو برقرار رکھتے ہوئے پیمانے پر 3-30 سیکنڈ کے الفاظ جمع کیے ہیں۔

  • آڈیو جمع، نقل اور تشریح شدہ: 22,250 گھنٹے
  • تائید شدہ زبانیں: 13 (ڈینش، کورین، سعودی عرب عربی، ڈچ، مین لینڈ اور تائیوان چینی، فرانسیسی کینیڈین، میکسیکن ہسپانوی، ترکی، ہندی، پولش، جاپانی، روسی)
  • کلمات کی تعداد: 7M +۔
  • ٹائم لائن: ماہ 7 8

اے آئی سے چلنے والی اسپیچ پروسیسنگ کثیر لسانی وائس سوٹ

16 kHz پر آڈیو کلمات جمع کرتے ہوئے، ہم نے متنوع ریکارڈنگ ماحول میں عمر، جنس، تعلیم اور بولیوں کے لحاظ سے مقررین کے صحت مند امتزاج کو یقینی بنایا۔

نتیجہ

ماہر لسانیات کے اعلیٰ معیار کے آڈیو ڈیٹا نے کلائنٹ کو 13 عالمی سطح 1 اور 2 زبانوں میں اپنے کثیر لسانی تقریر کی شناخت کے ماڈل کو درست طریقے سے تربیت دینے کا اختیار دیا۔ سونے کے معیاری تربیتی ڈیٹاسیٹس کے ساتھ، کلائنٹ مستقبل کے حقیقی دنیا کے مسائل کو حل کرنے کے لیے ذہین اور مضبوط ڈیجیٹل مدد فراہم کر سکتا ہے۔

اعلی معیار کا آڈیو ڈیٹا

ہماری مہارت

تقریر کے اوقات جمع ہوئے۔
0 +
وائس ڈیٹا جمع کرنے والوں کی ٹیم
0
PII کے مطابق
0 %
ٹھنڈا نمبر
0 +
ڈیٹا کی قبولیت اور درستگی
> 0
فارچیون 500 کلائنٹ
0 +

ہمیں بتائیں کہ ہم آپ کے اگلے AI اقدام میں کس طرح مدد کرسکتے ہیں۔