April 12, 2022

6 Kaedah Terbukti untuk Menyesuaikan Pengumpulan Data Pertuturan

Terdapat beberapa jenis pelanggan yang berbeza – sesetengahnya mempunyai idea yang jelas tentang cara data pertuturan mereka harus distrukturkan, dan sesetengahnya lebih fleksibel dengan pendekatan mereka.

Sebagai penyedia perkhidmatan, kami perlu memastikan kedua-dua keperluan pelanggan dipenuhi. Walau bagaimanapun, dengan pelanggan yang fleksibel dengan keperluan mereka, ada kemungkinan mereka belum memberi sepenuhnya pengumpulan data ucapan pemikiran yang lengkap.

Di sinilah sumbangan penyedia set data pertuturan memainkan peranan.

Kami mempunyai tanggungjawab untuk mempamerkan perkara yang perlu diingat sebelum memulakan audio pengumpulan data projek untuk membolehkan organisasi AI mengenal pasti penyelesaian yang boleh dilaksanakan, cekap dan kos efektif.

Pasaran pengecaman suara, di dunia, dijangka berkembang ke $ 27.16 bilion pada 2026 daripada $10.7 bilion pada 2020 pada CAGR sebanyak 16.8%.

Mari kita lihat semua cara atau perkara yang berkesan untuk diingat sebelum menyesuaikan pengumpulan data ucapan projek.

Bahasa dan demografi
Saiz Koleksi
Struktur Skrip
Keperluan dan format audio
Keperluan Penghantaran dan Pemprosesan
Perkara Penting Lain yang Perlu Diperhatikan

Bahasa dan demografi

Projek itu hendaklah terlebih dahulu menentukan bahasa sasaran dan demografi sasaran.

Bahasa dan Dialek
Mulakan dengan mengingati keperluan projek – bahasa yang mana set data pertuturan sedang dikumpulkan dan disesuaikan. Juga, fahami keperluan kemahiran khusus. Sebagai contoh, patutkah peserta ialah penutur asli atau bukan penutur asli?
Sebagai contoh – Penutur Bahasa Inggeris Asli
Berjalan dekat pada tumit bahasa adalah dialek. Untuk memastikan set data tidak mengalami berat sebelah, adalah dinasihatkan untuk memperkenalkan dialek secara sengaja untuk menampung kepelbagaian dalam peserta.
Sebagai contoh – Penceramah beraksen Inggeris Australia
negara
Sebelum menyesuaikan, adalah penting untuk mengetahui sama ada terdapat keperluan khusus bahawa peserta harus datang dari negara tertentu. Dan, sama ada peserta perlu tinggal di negara tertentu pada masa ini.
Sebagai contoh – Bahasa Punjabi dituturkan secara berbeza di India dan Pakistan.
Demografi
Selain bahasa dan geografi, penyesuaian juga boleh dilakukan berdasarkan demografi. Pengagihan sasaran peserta berdasarkan umur, jantina, kelayakan pendidikan dan banyak lagi juga boleh dilakukan.
Sebagai contoh – Dewasa Vs Kanak-kanak atau Berpendidikan vs Tidak Berpendidikan

Saiz koleksi

Set data anda akan memberi kesan kepada prestasi projek data anda. Walau bagaimanapun, saiz data pengumpulan yang anda perlukan juga akan menentukan peserta yang diperlukan.

Jumlah Bilangan Responden
Tentukan jumlah peserta yang akan diperlukan untuk projek tersebut. Sekiranya projek memerlukan bahasa pengumpulan data audio, anda harus menganalisis jumlah bilangan peserta yang diperlukan bagi setiap bahasa sasaran.
Sebagai contoh – 50% Bahasa Inggeris Amerika dan 50% Penutur Bahasa Inggeris Australia
Jumlah Bilangan Lafaz
Untuk membina pengumpulan data pertuturan, tentukan jumlah sebutan atau ulangan setiap peserta atau jumlah ulangan yang diperlukan.
Sebagai contoh – 50 peserta dengan 25 sebutan setiap peserta = 1250 ulangan

Struktur skrip

Skrip juga boleh disesuaikan untuk memenuhi keperluan projek, jadi adalah dinasihatkan untuk mendapatkan bantuan daripada ahli terapi pertuturan untuk mereka bentuk aliran teks. Jika model ML perlu dilatih mengenai data yang tersusun dengan baik, ia perlu mengambil kira skrip dan aliran kerja.

Berskrip vs Tidak Berskrip
Anda boleh memilih antara menggunakan teks berskrip atau teks semula jadi atau tidak berskrip untuk dibaca oleh peserta.
Dalam ucapan teks berskrip, para peserta membaca apa yang dipaparkan pada skrin. Kaedah ini, kebanyakannya, digunakan untuk merekod arahan atau arahan.
Sebagai contoh – 'Matikan muzik,' 'Tekan 1 untuk merakam.'
Dalam ucapan tanpa skrip, para peserta diberikan senario dan diminta untuk merangka ayat mereka dan bercakap secara semulajadi yang mungkin.
Sebagai contoh – 'Bolehkah anda beritahu saya di mana stesen minyak seterusnya?'
Koleksi Lafaz / Kata Bangun
Sekiranya teks skrip digunakan, anda perlu menentukan bilangan skrip yang akan digunakan dan sama ada setiap peserta akan membaca skrip unik atau sekumpulan skrip. Juga, tentukan sama ada skrip mengandungi koleksi perkataan dan arahan bangun.
Sebagai contoh -
Perintah 1:
"Alexa, apakah resipi untuk kek cawan coklat?"
“Ok Google, apakah resipi untuk kek cawan coklat?”
"Siri, apakah resipi untuk kek cawan coklat?"
Perintah 2:
"Alexa, bila penerbangan ke New York?"
“Google, bila penerbangan ke New York?”
“Siri, bila penerbangan ke New York?”

Keperluan dan format audio

Kualiti audio memainkan peranan penting dalam pengecaman pertuturan pengumpulan data proses. Bunyi latar belakang yang mengganggu boleh menjejaskan kualiti nota suara yang dikumpul secara negatif. Ini mungkin juga mengurangkan keberkesanan algoritma pengecaman suara.

Kualiti audio
Kualiti rakaman dan kehadiran bunyi latar belakang boleh memberi kesan kepada hasil projek. Tetapi beberapa pengumpulan data pertuturan menerima kehadiran bunyi. Walau bagaimanapun, adalah dinasihatkan untuk mempunyai pemahaman yang lebih baik tentang keperluan dari segi kadar bit, nisbah isyarat-ke-bunyi, amplitud dan banyak lagi.
format
Format fail, titik data, struktur kandungan, pemampatan dan keperluan pasca pemprosesan juga menentukan kualiti rakaman pertuturan.
Sebab pentingnya format fail ialah model perlu mengenal pasti output fail dan dilatih untuk mengenali kualiti bunyi tertentu itu.
Tentukan Keperluan Audio Tersuai
Keperluan audio tersuai hendaklah dinyatakan sebelum permulaan proses pengumpulan. Pelanggan boleh memilih fail audio tersuai di mana fail tertentu digabungkan bersama.

Keperluan Penghantaran dan Pemprosesan

Setelah data pertuturan dikumpul, pelanggan boleh memilih untuk menyampaikannya mengikut keperluan mereka.

Keperluan Transkripsi dan Anotasi
Sesetengah pelanggan memerlukan transkripsi dan pelabelan data sebelum mereka menghantar. Selain itu, mereka juga mungkin memerlukan bentuk pelabelan dan pembahagian tertentu.
Kadang-kadang lebih baik mencari ahli patologi bahasa pertuturan dan pakar untuk membantu dalam menyalin pertuturan dalam pelbagai bahasa untuk mengekalkan keaslian bahasa sasaran.
Konvensyen penamaan fail
. borang pengumpulan data hendaklah menentukan sebarang konvensyen penamaan fail yang perlu diikuti. Jika konvensyen penamaan adalah kompleks atau di luar skop standard proses, ia boleh menarik kos pembangunan tambahan.
Garis Panduan Penghantaran
Garis panduan keselamatan dan penghantaran hendaklah dipatuhi seperti yang dinyatakan dalam keperluan projek. Lebih-lebih lagi, jika data ingin dihantar dalam pencapaian kecil atau sebagai pakej lengkap sekaligus harus dinyatakan. Pelanggan juga lebih suka menepati masa pemantauan kemajuan kemas kini supaya mereka boleh menjejaki status projek.

Perkara Penting Lain yang Perlu Diperhatikan

Penyesuaian akan memberi kesan bagaimana,

Kaedah pengumpulan data digunakan
Pengambilan peserta
Garis masa untuk penghantaran
Kos Tentatif projek

Apabila memilih vendor yang betul, anda perlu memastikan anda pergi bersama seseorang yang mempunyai kedua-dua pengalaman untuk memberikan pilihan penyesuaian dan fleksibiliti untuk menskalakan projek dengan mudah. Sifat pengumpulan data pertuturan ialah ia berkembang dan kerumitan berubah dari semasa ke semasa, dan penyedia yang betul harus dapat mengikuti perkembangan.

Apabila anda hanya perlukan fleksibiliti dan skalabiliti, Shaip ialah pilihan yang tepat. Kami menawarkan perkhidmatan yang boleh disesuaikan berdasarkan keperluan projek khusus anda. Kami menawarkan berskala dan fleksibel penyelesaian pengumpulan data untuk projek berbilang bahasa pada harga yang kompetitif. Berbincang dengan pakar kami untuk mengetahui cara pengumpulan data pertuturan dan teknik penyesuaian kami berfungsi dalam membangunkan AI perbualan.

Kongsi sosial

Bercakap dengan Pakar

Nama Awalan*
Nama Terakhir*
E-mel*
Telefon*
Syarikat*
Negara*
Negara
Komen-komen*
Dengan mendaftar, saya bersetuju dengan Shaip Polisi Laman Web and Syarat Perkhidmatan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B daripada Shaip.
CAPTCHA

Muat turun Buku Percuma

Awak juga mungkin menyukai

6 Kaedah Terbukti untuk Menyesuaikan Pengumpulan Data Pertuturan

Bahasa dan demografi

Bahasa dan Dialek

negara

Demografi

Saiz koleksi

Jumlah Bilangan Responden

Jumlah Bilangan Lafaz

Struktur skrip

Berskrip vs Tidak Berskrip

Koleksi Lafaz / Kata Bangun

Keperluan dan format audio

Kualiti audio

format

Tentukan Keperluan Audio Tersuai

Keperluan Penghantaran dan Pemprosesan

Keperluan Transkripsi dan Anotasi

Konvensyen penamaan fail

Garis Panduan Penghantaran

Perkara Penting Lain yang Perlu Diperhatikan

Kongsi sosial

Bercakap dengan Pakar

Bagaimanakah Set Data Latihan Luar Rak membolehkan projek ML anda menjadi Permulaan Berlari?

Kebangkitan Pembantu Suara Berasaskan AI dalam Meningkatkan Kualiti Penjagaan kesihatan

Melaksanakan AI Generatif untuk Pertumbuhan dan Kejayaan yang Lebih Baik

Perkhidmatan Data AI

Khas

industri

Produk

Syarikat

Sumber

Hubungi Kami