Koleksi Audio Frasa/Gesaan Utama

Kajian Kes: Pengumpulan Frasa Utama untuk sistem diaktifkan suara dalam kereta

Koleksi frasa utama

Terdapat peningkatan permintaan untuk sistem diaktifkan suara dalam kereta dalam Industri Auto, mentakrifkan semula cara kami terlibat dengan kenderaan mobiliti kami.

Industri automotif telah menggunakan sistem diaktifkan suara dengan pantas, dengan pemain utama seperti Ford, Tesla, dan BMW menyepadukan pengecaman suara lanjutan dalam kenderaan mereka. Menjelang 2022, dianggarkan lebih 50% kereta baharu menampilkan keupayaan pengecaman suara. Penyepaduan ini bertujuan untuk meningkatkan keselamatan, membolehkan pemandu mengendalikan fungsi navigasi, hiburan dan komunikasi tanpa gangguan.

Nilai pasaran untuk pengecaman suara dalam kereta diunjurkan melebihi $1 bilion menjelang 2023, menunjukkan permintaan yang semakin meningkat untuk interaksi dalam kereta bebas tangan dan pintar.

Automotif

Penyelidikan mencadangkan bahawa menjelang 2022, 73% pemandu akan menggunakan pembantu suara dalam kereta.

Pasaran Sistem Pengecaman Suara Automotif bernilai USD 2.01 Bn pada 2021, dan dijangka mencapai USD 3.51 Bn menjelang 2027, mencatatkan CAGR sekitar 8.07%.

Penyelesaian Dunia Sebenar

Data yang menguatkan sistem yang diaktifkan suara

Sistem yang diaktifkan suara dalam kereta meningkatkan keselamatan dan kemudahan. Mereka membenarkan pemandu mengakses navigasi, membuat panggilan, menghantar teks, dan mengawal muzik tanpa mengalihkan tangan dari roda atau memandang dari jalan raya. Dengan bertindak balas kepada arahan lisan, sistem ini mengurangkan gangguan, menggalakkan multitasking dan memastikan fokus berterusan pada pemanduan. 

Pelanggan ialah peneraju global dalam kecerdasan perbualan yang menawarkan penyelesaian AI suara yang membolehkan perniagaan menawarkan pengalaman perbualan yang luar biasa kepada pelanggan mereka. Mereka bekerjasama dengan syarikat automotif terkemuka untuk melatih sistem diaktifkan suara mereka dengan frasa utama berjenama dan memerlukan kepakaran Shaip dalam pengumpulan data audio.

Penyelesaian dunia sebenar
Cabaran

Cabaran

  • Penyumberan Orang Ramai: Rekrut 2800+ penutur asli bagi setiap bahasa di seluruh dunia.
  • Pengumpulan data: Lindungi 200k+ gesaan dalam 12 bahasa dalam tempoh masa yang ditetapkan.
  • Pengiktirafan Konteks & Niat: Untuk memahami permintaan pengguna dengan betul, sistem perlu dilatih tentang variasi yang berbeza untuk frasa utama yang sama.
  • Pengendalian Bunyi Latar Belakang: Hadkan hingar latar dunia sebenar untuk ketepatan model ML.
  • Mengurangkan Bias: Dapatkan sampel suara daripada pelbagai demografi untuk memastikan keterangkuman.
  • Spesifikasi Audio: 16khz 16bit PCM, mono, saluran tunggal, WAV; tiada pemprosesan.
  • Persekitaran Rakaman: Rakaman hendaklah mempunyai audio yang bersih tanpa bunyi latar belakang atau gangguan. Frasa Utama untuk dirakam menggunakan pertuturan biasa.
  • Semakan Kualiti:  Semua rakaman pertuturan akan menjalani penilaian dan pengesahan kualiti, hanya rakaman pertuturan yang disahkan akan dihantar. Jika Shaip tidak memenuhi Piawaian Kualiti yang dipersetujui, Shaip akan menghantar semula data tanpa kos tambahan

Penyelesaian

Shaip dengan kepakarannya dalam ruang AI Perbualan membolehkan pelanggan dengan:

  • Pengumpulan data: 208k frasa utama/gesaan jenama dikumpulkan dalam 12 bahasa global daripada 2800 pembesar suara dalam tempoh masa yang ditetapkan
  • Loghat & Dialek Pelbagai: Pakar yang diambil dari seluruh dunia, mahir dalam loghat dan dialek yang dikehendaki.
  • Pengiktirafan Konteks & Niat: Setiap pembesar suara ditugaskan untuk merekodkan frasa utama dalam 20 variasi berbeza, membolehkan model ML memahami permintaan pengguna dengan tepat dari segi konteks dan niat.
  • Pengendalian Bunyi Latar Belakang: Untuk memastikan kualiti audio tulen, kami memastikan bahawa frasa utama telah ditangkap dalam persekitaran yang tenang dengan tahap hingar di bawah 40dB, tanpa gangguan latar belakang seperti TV, radio, muzik, pertuturan atau bunyi jalanan.
  • Mengurangkan Bias: Untuk meminimumkan berat sebelah, kami melibatkan individu dari pelbagai wilayah dan mengekalkan perwakilan demografi yang seimbang dengan 50% lelaki dan 50% perempuan, merangkumi kumpulan umur dari 18 hingga 60 tahun.
  • Garis Panduan Rakaman: Frasa utama telah ditangkap dalam corak pertuturan yang konsisten dan normal, tanpa sebarang variasi seperti rentak pantas atau perlahan. Senyap 2 saat pada permulaan dan penghujung untuk menjamin bahawa tiada bahagian ucapan telah dipotong secara tidak sengaja.
  • Borang Rakaman: Audio telah dirakam pada 16kHz, 16-bit PCM dalam mono, menggunakan satu saluran, dan disimpan dalam format fail WAV. Audio kekal tidak diproses, bermakna tiada penggunaan pemampatan, reverb atau EQ.
  • Kualiti: Setiap rakaman ucapan tertakluk kepada semakan dan pengesahan kualiti yang ketat. Hanya rakaman yang lulus penilaian ini dihantar. Sebarang fail yang kurang daripada standard kualiti yang dipersetujui telah direkodkan semula dan disediakan tanpa sebarang caj tambahan
Penyelesaian
Hasil

Hasil

Data audio frasa kunci jenama berkualiti tinggi atau gesaan suara akan membolehkan syarikat automotif dan pelanggan mereka dengan:

  1. Penjenamaan dan Identiti: Gesaan suara dengan frasa jenama khusus membantu syarikat mencipta hubungan langsung & tidak dapat dilupakan antara pengguna dan jenama yang meningkatkan ingatan jenama.
  2. Kemudahan penggunaan: Arahan suara memudahkan pemandu untuk berinteraksi dengan kenderaan tanpa mengalihkan tangan mereka dari roda atau mata mereka dari jalan raya dengan itu meningkatkan keselamatan jalan raya.
  3. Fungsi: Arahan suara menjadikan akses dan mengawal ciri kereta lebih intuitif. Sama ada navigasi, main balik media atau kawalan iklim.
  4. Integrasi dengan Sistem Lain: Banyak sistem yang diaktifkan suara disepadukan dengan telefon pintar, peranti rumah pintar dan peranti IoT yang lain. Sebagai contoh, pengguna mungkin boleh meminta kereta mereka menghidupkan lampu di rumah semasa mereka menghampiri rumah.
  5. Kelebihan Persaingan: Menawarkan sistem diaktifkan suara lanjutan boleh menjadi titik jualan & pembeza. Pembeli mencari teknologi terkini apabila mempertimbangkan pembelian kereta baharu.
  6. Pembuktian Masa Depan: Apabila teknologi berkembang & IoT menjadi lebih terintegrasi ke dalam kehidupan seharian, mempunyai sistem yang diaktifkan suara yang mantap meletakkan syarikat automotif untuk lebih menyesuaikan diri dengan teknologi masa depan.
  7. Peluang Hasil: Peluang pengewangan tambahan iaitu, sistem suara menawarkan pengesyoran atau pengalaman e-dagang bersepadu (seperti memesan makanan atau mencari perkhidmatan berdekatan) yang boleh memberikan hasil ahli gabungan.
Emas-5 bintang

Apabila kami mula mendapatkan gesaan suara untuk sektor automotif, cabarannya adalah banyak. Menangkap kepelbagaian dalam pertuturan, aksen dan nada adalah penting untuk mewakili pelanggan global pelanggan kami. Shaip menonjol bukan sahaja sebagai vendor, tetapi sebagai rakan kongsi sejati. Komitmen mereka untuk mendapatkan pelbagai suara dari pelbagai wilayah adalah dipuji. Mereka melampaui sekadar mengumpul suara; mereka memahami nuansa keperluan projek kami, menjamin rakaman yang terbaik. Pematuhan sempurna mereka terhadap piawaian koleksi audio mempamerkan profesionalisme dan dedikasi mereka terhadap projek itu.

Mempercepat AI Percakapan anda
pembangunan aplikasi sebanyak 100%