چینی انگریزی ڈیٹاسیٹ
中英文数据集
AI اور اسپیچ ماڈلز کے لیے اعلیٰ معیار کا چینی انگریزی کال سینٹر اور پوڈ کاسٹ ڈیٹاسیٹ
جائزہ
عنوان
چینی انگریزی زبان کا ڈیٹا سیٹ
ڈیٹا سیٹ کی قسم
کال سینٹر
تفصیل
"ایجنٹ" اور "کسٹمر" کے درمیان غیر رسمی، مصنوعی ٹیلی فونک گفتگو، تقریباً۔ آڈیو دورانیہ (حد) 5-15 منٹ۔
کیس کا استعمال کریں
ASR، ورچوئل اسسٹنٹ، چیٹ بوٹ، کنورسیشنل AI، اسپیچ اینالیٹکس، TTS، لینگویج ماڈلنگ
ڈیٹا سیٹ کی تفصیلات
کل گھنٹے
169
نمونہ کی شرح
8 kHz
آڈیو چینل
دوہری
ریکارڈنگ پلیٹ فارم
ڈیسک ٹاپ
آڈیو وضع
ویو.
نقل کی شکل
.json
WER (%)
5
ڈیٹا سیٹ ڈیموگرافکس
ملک
چین
زبان
چینی انگریزی
جنس
خواتین 1790، مرد 523، نامعلوم 13
مقررین کی تعداد
2,326
عمر
18-50
جائزہ
عنوان
چینی انگریزی زبان کا ڈیٹا سیٹ
ڈیٹا سیٹ کی قسم
Podcast
تفصیل
لائسنس کے قابل پبلک ڈومین آڈیو/ویڈیو فائلیں جیسے انٹرویوز، پوڈکاسٹ وغیرہ - 1 سے 5 افراد۔ تقریبا. آڈیو کا دورانیہ (حد) 15-60 منٹ۔
کیس کا استعمال کریں
ASR، ورچوئل اسسٹنٹ، چیٹ بوٹ، کنورسیشنل AI، اسپیچ اینالیٹکس، TTS، لینگویج ماڈلنگ
ڈیٹا سیٹ کی تفصیلات
کل گھنٹے
249
نمونہ کی شرح
16 kHz
آڈیو چینل
مونو
ریکارڈنگ پلیٹ فارم
ویب سورسنگ
آڈیو وضع
ویو.
نقل کی شکل
.json
WER (%)
5
ڈیٹا سیٹ ڈیموگرافکس
ملک
چین
زبان
چینی انگریزی
جنس
خواتین 126، مرد 346، نامعلوم 6
مقررین کی تعداد
478
عمر
18-50
جائزہ
عنوان
ووہان زبان کا ڈیٹا سیٹ
ڈیٹا سیٹ کی قسم
بے ساختہ مکالمہ
کل گھنٹے
500
نمونہ کی شرح
16 kHz
چینی زبان کا ڈیٹا سیٹ
ٹی ٹی ایس
300
16 kHz
ہوکینیز زبان کا ڈیٹا سیٹ
بے ساختہ مکالمہ
100
16 kHz
شنگھائی زبان کا ڈیٹا سیٹ
بے ساختہ مکالمہ
500
16 kHz
سچوان زبان کا ڈیٹا سیٹ
بے ساختہ مکالمہ
500
16 kHz
انگریزی (چینی) زبان کا ڈیٹا سیٹ
اسکرپٹڈ بے ساختہ
2,000
16 kHz
نمایاں مؤکل
دنیا کے معروف AI مصنوعات تیار کرنے کے لئے ٹیموں کو بااختیار بنانا۔
آپ جو ڈھونڈ رہے ہیں اسے نہیں مل سکتا؟
تمام ڈیٹا کی اقسام میں نئے آف دی شیلف ڈیٹا سیٹس جمع کیے جا رہے ہیں۔
اپنی آڈیو/اسپیچ ٹریننگ ڈیٹا اکٹھا کرنے کی پریشانیوں کو دور کرنے کے لیے ابھی ہم سے رابطہ کریں۔