عربی اور تھائی اور ویتنامی اور ہندی اور انگریزی اور چینی زبان کا ڈیٹا سیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 150k
تشریح: جی ہاں
تفصیل: عربی اور تھائی اور ویتنامی اور ہندی اور انگریزی اور چینی زبان کا ڈیٹا سیٹ
عربی ٹیکسٹ ڈیٹا سیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 1k
تشریح: جی ہاں
تفصیل: عربی ٹیکسٹ ڈیٹا سیٹ میں عربی میں لکھے گئے متن کے نمونوں کا مجموعہ ہے۔ اس میں مواد کی مختلف شکلیں شامل ہیں، جیسے کہ خبروں کے مضامین، سوشل میڈیا پوسٹس، ادب، اور مکالمے، مختلف عنوانات اور تحریری انداز پر محیط ہیں۔ اس ڈیٹاسیٹ کو قدرتی زبان کی پروسیسنگ (NLP)، متن کی درجہ بندی، جذبات کا تجزیہ، اور عربی زبان کی ایپلی کیشنز میں مشینی ترجمہ جیسے کاموں کے لیے استعمال کیا جاتا ہے۔
چینی اور انگریزی اور تبتی اور ایغور زبان کا ڈیٹا سیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 38k
تشریح: جی ہاں
تفصیل: چینی اور انگریزی اور تبتی اور ایغور زبان کا ڈیٹا سیٹ
چینی اور انگریزی مینو ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 60k
تشریح: جی ہاں
تفصیل: چینی اور انگریزی مینو ڈیٹاسیٹ میں ریستوران کے مینو کی تصاویر یا متن کے نمونے شامل ہیں جن میں چینی اور انگریزی دونوں زبانیں شامل ہیں۔ اس میں مختلف فونٹس، ترتیب، اور مینو کے ڈھانچے شامل ہیں، جو دو لسانی ڈش کے نام، وضاحتیں اور قیمتیں پیش کرتے ہیں۔ یہ ڈیٹا سیٹ آپٹیکل کریکٹر ریکگنیشن (OCR)، مشین ٹرانسلیشن، اور کثیر لسانی سیٹنگز میں مینو ڈیجیٹائزیشن جیسے کاموں کے لیے مفید ہے۔
چینی ہاتھ سے لکھا کمپوزیشن ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 3k
تشریح: جی ہاں
تفصیل: چینی ہاتھ سے لکھے ہوئے کمپوزیشن ڈیٹاسیٹ میں ہاتھ سے لکھے ہوئے چینی متن کے نمونے شامل ہیں، بشمول کمپوزیشنز، مضامین اور دیگر طویل شکل والے متن۔ اس میں ہینڈ رائٹنگ کے مختلف انداز اور پیچیدگی کی سطحیں شامل ہیں، اور اس کا استعمال ہینڈ رائٹنگ کی شناخت، متن کا تجزیہ، اور مشین لرننگ ماڈل ٹریننگ جیسے کاموں کے لیے کیا جاتا ہے۔
چینی وائی فائی پرامپٹ ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 1k
تشریح: جی ہاں
تفصیل: چینی وائی فائی پرامپٹ ڈیٹاسیٹ متن کے نمونوں پر مشتمل ہوتا ہے جو WIFI پرامپٹس اور چینی زبان میں لکھی گئی لاگ ان اسکرینوں میں پائے جاتے ہیں۔ اس میں عام طور پر WIFI نیٹ ورکس سے منسلک ہونے یا ان کا انتظام کرنے سے متعلق مختلف اشارے، ہدایات، اور خرابی کے پیغامات شامل ہوتے ہیں۔ یہ ڈیٹا سیٹ متن کی شناخت، قدرتی زبان کی پروسیسنگ، اور نیٹ ورک کنیکٹیویٹی کے لیے یوزر انٹرفیس کو بہتر بنانے جیسے کاموں کے لیے استعمال کیا جاتا ہے۔
انگریزی اور چینی ہینڈ رائٹنگ ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 12k
تشریح: جی ہاں
تفصیل: انگریزی اور چینی ہینڈ رائٹنگ ڈیٹاسیٹ انگریزی اور چینی دونوں زبانوں میں ہاتھ سے لکھے ہوئے نمونے پر مشتمل ہے، جو تحریر کے مختلف انداز اور کردار کی پیچیدگیوں کو ظاہر کرتا ہے۔ یہ عام طور پر ہینڈ رائٹنگ ریکگنیشن ماڈلز کی تربیت اور ان کا جائزہ لینے، کثیر لسانی متن کے تجزیے اور دیگر متعلقہ تحقیق کے لیے استعمال ہوتا ہے۔ ڈیٹا سیٹ میں دونوں زبانوں میں حروف، ہندسوں، الفاظ اور جملوں کی متنوع رینج شامل ہے۔
انگریزی اور چینی شاپ سائن ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 30k
تشریح: جی ہاں
تفصیل: انگریزی اور چینی شاپ سائن ڈیٹاسیٹ میں دکان کے نشانات کی تصاویر شامل ہیں جن میں انگریزی اور چینی متن دونوں شامل ہیں۔ یہ مختلف اشارے کے عناصر کو پکڑتا ہے جیسے اسٹور کے نام، اشتہارات، پروموشنز، اور ڈائریکشنز، متنوع فونٹس، اسٹائلز اور فارمیٹس میں دکھائے جاتے ہیں۔ اس ڈیٹاسیٹ کا استعمال متن کا پتہ لگانے اور پہچاننے، کثیر لسانی منظر کی تفہیم، اور دو لسانی اشارے کی تشریح کے لیے کمپیوٹر ویژن ماڈل کو بہتر بنانے جیسے کاموں کے لیے کیا جاتا ہے۔
انگریزی اور چینی خصوصی زاویہ ٹیکسٹ ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 50k
تشریح: جی ہاں
تفصیل: انگریزی اور چینی اسپیشل اینگل ٹیکسٹ ڈیٹاسیٹ میں متن کی تصاویر شامل ہیں جو انگریزی اور چینی دونوں زبانوں میں مختلف زاویوں اور واقفیت پر ظاہر ہوتی ہیں۔ اس میں اشارے، اشتہارات اور دستاویزات جیسے ذرائع سے متن شامل ہے جو معیاری افقی فارمیٹس میں پیش نہیں کیے گئے ہیں۔ اس ڈیٹاسیٹ کا استعمال متن کا پتہ لگانے اور پہچاننے والے ماڈلز کی تربیت اور جائزہ لینے کے لیے کیا جاتا ہے، خاص طور پر وہ جو غیر روایتی رجحانات اور تناظر میں متن کو سنبھالنے کے قابل ہوتے ہیں۔
انگریزی مینو ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 20k
تشریح: جی ہاں
تفصیل: انگریزی مینو ڈیٹاسیٹ میں انگریزی میں لکھے گئے ریستوراں کے مینو کی تصاویر یا متن کے نمونے شامل ہیں۔ اس میں پکوان کے نام سے لے کر تفصیل اور قیمتوں تک کے مواد کے ساتھ مختلف قسم کے فونٹس، لے آؤٹ، اور فارمیٹنگ کے انداز شامل ہیں۔ یہ ڈیٹا سیٹ اکثر آپٹیکل کریکٹر ریکگنیشن (OCR)، ٹیکسٹ نکالنے، اور کھانے سے متعلق ایپلی کیشنز میں مینو ڈیجیٹائزیشن جیسے کاموں کے لیے استعمال ہوتا ہے۔
انگریزی مناظر ٹیکسٹ ڈیٹاسیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 33k
تشریح: جی ہاں
تفصیل: انگلش سینز ٹیکسٹ ڈیٹاسیٹ ایمبیڈڈ انگریزی ٹیکسٹ کے ساتھ قدرتی مناظر پر مشتمل تصاویر پر مشتمل ہے۔ متن مختلف شکلوں میں ظاہر ہوتا ہے، جیسے کہ نشانات، بل بورڈز، اور پوسٹرز، اکثر متنوع فونٹس، سائز اور سمت بندی میں۔ یہ ڈیٹا سیٹ عام طور پر ٹیکسٹ کا پتہ لگانے، پہچاننے، اور منظر کو سمجھنے کے کاموں میں ماڈلز کی تربیت اور جانچ کے لیے استعمال ہوتا ہے۔
ہاتھ سے لکھا ہوا ٹیکسٹ ڈیٹا سیٹ
کیس استعمال کریں: دستاویز AI
فارمیٹ: HEIC (تصاویر) اور .mov (ویڈیوز)
شمار: 94053
تشریح: نہیں
تفصیل: جاپانی، کورین اور روسی کے لیے ہاتھ سے لکھے ہوئے متن کے ساتھ لائیو تصاویر
ریکارڈنگ ڈیوائس: آئی فون اور آئی پیڈ کیمرہ
ریکارڈنگ کی حالت: - جارحانہ روشنی / چکاچوند - کیمرہ فلیش آن - رنگین روشنی - کم روشنی، کوئی کیمرہ فلیش نہیں - نارمل
جاپانی اور کورین زبان کا ڈیٹا سیٹ
باؤنڈنگ باکس + ٹیکسٹ
کیس استعمال کریں: OCR
فارمیٹ: تصویر
شمار: 40k
تشریح: جی ہاں
تفصیل: جاپانی اور کورین زبان کے ڈیٹا سیٹ میں جاپانی اور کورین دونوں زبانوں میں متن کے نمونے شامل ہیں۔ اس میں مختلف سیاق و سباق اور اسلوب پر مشتمل جملے، جملے اور الفاظ جیسے مواد کی ایک رینج شامل ہے۔ یہ ڈیٹا سیٹ قدرتی زبان کی پروسیسنگ (NLP)، مشینی ترجمہ، اور کثیر لسانی ایپلی کیشنز میں متن کے تجزیہ جیسے کاموں کے لیے استعمال ہوتا ہے۔