ڈیفینیشن
آڈیو ڈیٹا اکٹھا کرنا اے آئی سسٹمز کو تربیت دینے اور جانچنے کے لیے خام صوتی ریکارڈنگ کو جمع کرنے کا عمل ہے۔ ڈیٹا میں تقریر، موسیقی، یا ماحولیاتی آوازیں شامل ہو سکتی ہیں۔
مقصد
مقصد نمائندہ ڈیٹا سیٹس بنانا ہے جو آڈیو ماڈلز کو لہجوں، ماحول اور آلات میں قابل اعتماد کارکردگی کا مظاہرہ کرنے کی اجازت دیتے ہیں۔
اہمیت
- مضبوط تقریر اور آڈیو سسٹم کی تربیت کے لیے ضروری ہے۔
- تعصب سے بچنے کے لیے تنوع (زبانیں، حالات) پر غور کرنا چاہیے۔
- ریکارڈ شدہ آوازوں کے لیے مضبوط رازداری اور رضامندی کے اقدامات کی ضرورت ہے۔
- جمع کرنے کا معیار نیچے کی طرف AI کارکردگی کو متاثر کرتا ہے۔
یہ کیسے کام کرتا
- اہداف کی وضاحت کریں (مثلاً تقریر کی شناخت، آواز کا پتہ لگانا)۔
- ریکارڈنگ کے آلات اور ماحول منتخب کریں۔
- مقررین کو بھرتی کریں یا قدرتی ریکارڈنگ جمع کریں۔
- شور اور معیار کو کنٹرول کرتے ہوئے آڈیو ریکارڈ کریں۔
- بعد میں استعمال کے لیے میٹا ڈیٹا کے ساتھ ریکارڈنگ کو اسٹور کریں۔
مثالیں (حقیقی دنیا)
- گوگل اسپیچ کمانڈز: بولی جانے والی کمانڈز کا کراؤڈ سورس ڈیٹا سیٹ۔
- UrbanSound8K: لیبل شدہ ماحولیاتی آوازوں کا ڈیٹاسیٹ۔
- LibriSpeech: ASR تحقیق کے لیے آڈیو بک سے ماخوذ کارپس۔
حوالہ جات / مزید پڑھنا
- اسپیچ ڈیٹا اکٹھا کرنے کے رہنما خطوط — لسانی ڈیٹا کنسورشیم۔
- آڈیو کی شناخت کے لیے ڈیٹا سیٹس - کوڈ کے ساتھ کاغذات۔
- ISO/IEC TR 20547-5: بگ ڈیٹا ریفرنس آرکیٹیکچر — ISO۔
- آڈیو ڈیٹا اکٹھا کرنا - شیپ