Gesaan Pembayaran UPI Berasaskan Suara: Menangkap Kepelbagaian untuk Model AI Dipertingkat

Memanfaatkan kepakaran Shaip dalam penciptaan segera dan rakaman audio yang pelbagai untuk menyokong sistem pembayaran UPI berasaskan suara dengan data yang berkualiti tinggi dan pelbagai budaya.

Gesaan Pembayaran UPI Berasaskan Suara

Gambaran Keseluruhan projek

Shaip bekerjasama dengan syarikat fintech terkemuka untuk membangunkan aplikasi pembayaran berasaskan suara dengan mencipta dan merakam gesaan pembayaran UPI yang pelbagai. Projek itu melibatkan penciptaan 2,500 gesaan unik dan 87,000 gesaan pelbagai merentasi 13 niat berkaitan pembayaran, seperti menghantar wang, meminta wang, pertanyaan baki dan pembayaran bil. Gesaan ini telah dirakam selama 200 jam oleh 45 penceramah dari pelbagai wilayah, latar belakang dan kumpulan umur, memastikan pelbagai kepelbagaian linguistik dan persekitaran.

Matlamat projek adalah untuk membangunkan data latihan berkualiti tinggi untuk model AI yang boleh mengecam dan bertindak balas kepada arahan suara yang berkaitan dengan pembayaran UPI dalam tetapan dunia sebenar.

Pembayaran UPI Berasaskan Suara

Statistik Utama

Waktu audio gesaan pembayaran UPI dirakam

200

Penceramah dari pelbagai latar belakang (umur, pendidikan, wilayah)

45

Niat dilindungi, dengan 87,000+ gesaan pelbagai

13

bahasa: Inggeris, dengan penutur daripada pelbagai latar belakang bahasa ibunda (Kumaoni, Bengali, Malayalam, Gujerat, Hindi, Marathi dll.)

Skop projek

Penciptaan Segera

Skop termasuk membuat gesaan unik untuk sistem pembayaran UPI berasaskan suara. Gesaan direka bentuk untuk merangkumi berbilang niat, memastikan ia pelbagai dalam struktur, perbendaharaan kata dan entiti yang dinamakan. Beberapa aspek utama termasuk:

13 Niat Utama, termasuk:

  • Hantar duit: 65,653 gesaan unik dan pelbagai
  • Pertanyaan Baki: 3,052 gesaan
  • Minta Wang: 26,972 gesaan
  • Sejarah Transaksi, Caj semula, Pembayaran Bil, dsb.

Rakaman Audio

Untuk memastikan keaslian dan kebolehgunaan dunia sebenar, gesaan telah direkodkan oleh 45 penceramah daripada latar belakang linguistik yang berbeza. Kepelbagaian yang ditangkap melalui bahasa ibunda yang berbeza, dialek serantau dan persekitaran (dalam dan luar) membantu meningkatkan data latihan.

  • Kepelbagaian Bahasa: Pengguna fasih berbahasa Inggeris tetapi dengan pelbagai bahasa ibunda, seperti Kumaoni, Gujarati, Hindi, Bangla, Marathi & Malayalam.
  • Umur, Jantina dan Latar Belakang Pendidikan: Data menangkap pelbagai demografi.
  • Penceramah Bandar & Luar Bandar: Untuk mencerminkan penggunaan dunia sebenar, kedua-dua pembesar suara bandar dan luar bandar telah disertakan.
  • Persekitaran Rakaman: Rakaman audio telah dijalankan dalam kedua-dua tetapan dalaman dan luaran, dengan pelbagai bunyi latar belakang disertakan.

Cabaran

Kepelbagaian Linguistik dan Serantau

Memastikan gesaan mencerminkan pelbagai dialek serantau dan ciri pembesar suara memerlukan perancangan dan pelaksanaan yang teliti.

Variasi Audio Semulajadi

Mengendalikan bunyi latar belakang dan keadaan persekitaran (dalaman vs luar) adalah penting untuk aplikasi dunia sebenar.

Profil Penceramah Pelbagai

Kemasukan penceramah daripada kumpulan umur yang berbeza, latar belakang pendidikan dan kawasan luar bandar/bandar memperkenalkan kerumitan dalam menangkap data sahih.

Penyelesaian

Shaip menyampaikan penyelesaian yang menangani cabaran projek dengan melaksanakan teknik NLP lanjutan dan perancangan yang teliti dalam penciptaan dan rakaman segera. Aspek utama penyelesaian termasuk:

Penciptaan Segera

  • 2,500 gesaan unik telah dicipta, masing-masing dipelbagaikan mengikut struktur dan perbendaharaan kata.
  • 13 niat telah dilindungi, mulai daripada permintaan pembayaran asas kepada pertanyaan yang lebih kompleks seperti sejarah transaksi dan pembayaran bil.

Rakaman Audio

  • 200 jam rakaman audio telah dijalankan oleh pengguna 45, memastikan kepelbagaian merentas bahasa ibunda, persekitaran & demografi pembesar suara.
  • Kedua-dua persekitaran dalaman dan luaran digunakan untuk rakaman untuk memastikan variasi audio semula jadi.
  • Penceramah mewakili pelbagai dialek serantau, memastikan perwakilan linguistik yang tepat.
niat HANTAR Pertanyaan Baki Memohon Wang Sejarah Transaksi
prompt Buat bayaran dua puluh seratus kepada Sumatera untuk sewa rumah Saya ingin tahu baki semasa saya dalam akaun simpanan saya. Bolehkah anda meminta Raji, tiga ratus lapan belas rupee untuk kecemasan? Tunjukkan kepada saya sejarah transaksi kad debit saya.
gujarati સુમાત્રીને ઘરના ભાડા પેટે એકવીસસો ચૂકવો હું મારા બચત ખાતામાં મારી વર્તમાન બેલેન્ફ મારસ મારી વર્તમાન બેલેન્સ માવાસ માઍસ માઍસ છું. શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રંઢસપા િયા માંગી શકો છો? મને મારા ડેબિટ કાર્ડના વ્યવહાર દેખાડો.
Hindi सुमात्री को मकान किराए के लिए इक्कीस सौ रुपए का भुगतान करें। मैं अपने बचत खाते में वर्तमान शेष राशि जानना चाहता हूँ। क्या आप राजी से किसी इमरजेंसी के लिए तीन सौ अठारह रुपये मांग सकते हैं? मुझे मेरा डेबिट कार्ड का लेनदेन ब्यौरा दिखाओ।
Malayalam വീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടായിരത്തിഒരുന്നൂറ് നൽകൂ. എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലെ തുക അറിയാൻ ഞാൻ ആഗിക്.രഹ്ക് രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രൂപ അടിയന്തരാവശ്യത്തിന് ആവശ്യപ്പെടാമോ? എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവരണം കാണിക്കൂ.
telugu ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంల చిం్ల నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బన్ల బన్ తెలుసుకోవాలనుకుంటున్నాను. ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దమానిదెరిని లు అడగగలరా? నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు నాకు చికు చిీ
Bangla (বাংলা) বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা পরিশনোুক আমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমান ব্যালেন্স জেন্স তেন্স জেন্স তেন্স জেনস তেন্স তেন্স তেনস তেনস তেন্স তেনস জেনস তেনস তেনস তমান আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য তিনশো আঠারো আঠারো ট পারেন? আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান।
Marathi सुमात्रीला घराच्या भाड्यासाठी दोन हजार एकशे रुपये द्या. मला माझ्या बचत खात्यातील सध्याचा शिल्लक जाणून घ्यायचा आहे. आपण राजीकडून तातडीसाठी तीनशे अठरा रुपये मागू शकता का? माझ्या डेबिट कार्डचे व्यवहार दाखवा.

Hasilnya

Data audio yang berkualiti tinggi dan pelbagai yang dihantar oleh Shaip membolehkan pelanggan membangunkan sistem pembayaran UPI berasaskan suara dipacu AI yang mampu mengenali arahan dalam pelbagai dialek, persekitaran dan konteks. Data membantu meningkatkan:

  • Pengecaman suara masa nyata dalam persekitaran yang kompleks.
  • Urus niaga UPI yang lebih tepat pengendalian untuk julat pengguna yang lebih luas.
  • Berskala: Projek ini menetapkan asas yang kukuh untuk berkembang ke bahasa India yang lain.

Deliverables

  • 200 jam fail audio (format PCM WAV 8 kHz, mono)
  • 87,000 + gesaan pelbagai yang dianotasi dengan niat unik
  • Metadata: Profil pembesar suara, butiran persekitaran dan ketepatan transkripsi

Keupayaan Shaip untuk menangkap kepelbagaian India melalui gesaan unik dan rakaman audio yang tulen telah menjadi pengubah permainan untuk sistem pembayaran UPI berasaskan suara kami. Pasukan mereka memastikan bahawa setiap aspek projek - daripada penciptaan segera kepada kualiti rakaman - dikendalikan dengan ketepatan, membantu kami membina model pengecaman suara yang lebih inklusif dan mantap.

Bintang Emas 5