Perkhidmatan Pengumpulan Data Pertuturan Paling Dipercayai untuk AI anda

Latih model NLP, prototaip VA, TTS, dan banyak lagi dengan data perbualan yang berkualiti, dengan perkhidmatan pengumpulan data audio dan pertuturan kami

Pengumpulan data audio

Temui saluran paip data audio tanpa kesesakan

Pelanggan Pilihan

Perkhidmatan Pengumpulan Data Audio / Suara Profesional

Mana-mana subjek. Apa-apa senario.

Di Shaip, kepakaran kami terletak pada mencipta set data pertuturan berkualiti tinggi yang direka untuk keperluan AI/ML yang pelbagai. Kami menawarkan rangkaian bahasa yang luas dan rekod dalam tetapan yang pelbagai menjadikan set data kami komprehensif dan boleh disesuaikan. Otumpuan anda adalah pada model suapan dengan volum tertinggi data pertuturan tersuai, dalam masa yang paling singkat. Bersama kami, anda boleh mengharapkan: 

Koleksi ucapan
  • Data audio/suara berbilang bahasa berkualiti tinggi dipilih susun untuk meningkatkan ketepatan
  • Tahap kekhususan domain tertinggi yang mungkin kepada tArget pelbagai senario persediaan
  •  Skalakan model ML anda agar sesuai dengan pelbagai demografi dan menegak
  • Persekitaran Rakaman: Kualiti Studio, menampilkan audio sejernih kristal dengan bunyi latar belakang yang minimum, & Persekitaran Semulajadi, di mana rakaman menggabungkan bunyi ambien untuk meniru situasi dunia sebenar.

100 +

negara

55K +

Data Waktu Pertuturan

250 +

Projek

60 +

Bahasa (100+ Dialek)

8 / 16 / 44 / 48 kHz

Kadar pensampelan

Kepakaran kami

Jajarkan Data Audio kepada Model NLP yang Lebih Pintar

Shaip menawarkan perkhidmatan pengumpulan data ucapan / audio ujung ke ujung dalam lebih dari 100 bahasa untuk membolehkan teknologi berkemampuan suara untuk memenuhi pelbagai kumpulan khalayak di seluruh dunia. Kita boleh mengusahakan projek-projek dengan skop dan ukuran apa pun; dari melesenkan kumpulan data audio yang ada, untuk menguruskan pengumpulan data audio tersuai, hingga transkripsi dan anotasi audio. Tidak kira seberapa besar projek pengumpulan data ucapan anda, kami dapat menyesuaikan perkhidmatan pengumpulan audio untuk memenuhi keperluan anda untuk membina set data NLP berkualiti tinggi yang menyasarkan dialek, nada, dan bahasa. Pilih dari pelbagai kumpulan data ucapan dan sumber pengumpulan data audio kami, untuk penyediaan pintar yang membolehkan suara.

Ucapan monolog

Koleksi Ucapan Monolog

Ia memberi tumpuan kepada pemprosesan pertuturan daripada satu pembesar suara. Gunakan gesaan berskrip untuk menyuap ke dalam fail audio satu saluran, memastikan tangkapan corak pertuturan yang unik, nada dan nuansa khusus untuk individu tersebut.

Ucapan dialog

Ucapan Dialog
koleksi

Interaksi dua orang, mereplikasi perbualan dan dialog dunia sebenar dengan pendedahan berbilang bahasa melalui fail dwi-saluran dan sumber yang ditranskripsikan.

Perbualan berbilang pihak

Kumpulan / Muti-parti
Perbualan

Perbincangan berbilang orang, menangkap dinamik kumpulan, pertindihan dan nada yang pelbagai untuk melatih model pertuturan dengan tepat.

Pertuturan bahasa semula jadi

Koleksi Kata Bahasa Asli

Latih AI untuk mengenal pasti frasa atau membangunkan perkataan dengan makna yang serupa menggunakan ujaran yang pelbagai, kaya dan tulen untuk pemprosesan dan pemahaman bahasa semula jadi yang lebih maju.

Ucapan akustik

Data Akustik
koleksi

Kami boleh merakam data audio berkualiti studio secara profesional sama ada restoran, pejabat atau rumah atau daripada pelbagai persekitaran dan bahasa, sambil meliputi julat akustik yang lebih luas (Set Data Bunyi Komprehensif).

Pengiktirafan ucapan automatik

Pengecaman Ucapan Automatik (ASR)

Tingkatkan ketepatan sistem pengecaman pertuturan automatik (ASR) anda dengan mempunyai akses kepada set data pertuturan/audio terpelbagai terkini, daripada pelbagai demografi.

Pertuturan bahasa semula jadi

Data Latihan Pertuturan/Audio berbilang bahasa

Profesional bahasa mahir kami, di seluruh dunia menawarkan data audio/pertuturan berbilang bahasa dalam pelbagai bahasa dan dialek. Usaha ini memupuk komunikasi global dan merapatkan halangan bahasa, menyumbang kepada penyelesaian AI yang lebih inklusif dan berkesan.

Pembantu maya digital

Teks-ke-Ucapan
(TTS)

Bina model berbilang bahasa teks ke pertuturan (TTS) dengan bantuan tenaga kerja global kami, yang membantu anda mengumpul data pertuturan dalam 150+ bahasa & dialek untuk meningkatkan model AI anda daripada kawalan dalam kereta kepada bot sembang dan penyelesaian pembelajaran dengan tinggi- data audio yang berkualiti.

Rakaman pusat panggilan

Pusat panggilan
Rakaman

Pertukaran tulen antara ejen dan pelanggan, menyokong pelbagai bahasa seperti Sepanyol, Jerman, Inggeris Amerika, Benggali, Jepun, Cina dan Hindi.

Kisah Kejayaan

Set data AI perbualan dengan lebih 3k jam data merentas 8 bahasa

Ingin membina platform berbilang bahasa untuk bahasa India, pelanggan bekerjasama dengan Shaip untuk mengumpul, membahagikan dan menyalin set data yang besar dalam berbilang bahasa India. Ini akan membantu membangunkan model pertuturan yang berkesan yang boleh memperkasakan platform baharu pelanggan yang inovatif.

Masalah: Lebih 3,000 jam data audio dikumpul dalam 8 bahasa India, dibahagikan dan ditranskripsi untuk membangunkan pengecaman pertuturan automatik.

penyelesaian: Kami menyediakan pengumpulan data, pembahagian, transkripsi dan menghantar fail JSON dengan metadata. Kami mengumpul 3000 jam data audio dalam 8 bahasa India pada skala untuk projek teknologi pertuturan pelanggan.

Kajian kes pengumpulan data pertuturan

Sebab untuk memilih Shaip sebagai Rakan Pengumpulan Data Ucapan Yang Boleh Dipercayai

orang

orang

Pasukan yang berdedikasi dan terlatih:

  • 30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
  • Pasukan Pengurusan Projek yang diperakui
  • Pasukan Pembangunan Produk yang berpengalaman
  • Pasukan Penyediaan Bakat & Pasukan Bakat
Proses

Proses

Kecekapan proses tertinggi dijamin dengan:

  • Proses Gerbang Tahap Sigma 6 yang kuat
  • Pasukan khusus 6 tali pinggang hitam Sigma - Pemilik proses utama & Pematuhan kualiti
  • Gelung Penambahbaikan & Maklum Balas yang Berterusan
platform

platform

Platform yang dipatenkan menawarkan faedah:

  • Platform hujung ke hujung berasaskan web
  • Kualiti yang sempurna
  • TAT lebih pantas
  • Penghantaran lancar

Set Data Pertuturan / Audio Di Luar Rak

ButiranSet Data BahasaKadar SampelJenis Set DataJumlah Jam AudioShort DescriptionPenerangan Set DataChannel AudioPlatform RakamanWER (%)Format AudioFormat TranskripsiGunakan KesBilangan SpeakerCTA
Ucapanen_US_CC_8Vernakular Afrika AmerikaVernakular Afrika Amerikaen_usKHz 8Pusat panggilan211Data pusat panggilan Vernakular Afrika AmerikaPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 612, Lelaki: 1242, dan Tidak Diketahui: 12
Ucapanen_US_MA_16Vernakular Afrika AmerikaVernakular Afrika Amerikaen_usKHz 16Audio Media154Data Media Vernakular Afrika AmerikaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 151, Lelaki: 150, dan Tidak Diketahui: 10
UcapanAfrikaans_GC_8AfrikaansAfrikaansaf_ZAKHz 8Perbualan Umum368Data Perbualan Umum AfrikaansPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Afrikaans dituturkan di AfrikaDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 502, Lelaki: 390, dan Tidak Diketahui: 2
UcapanAfrikaans_MA_16AfrikaansAfrikaansaf_ZAKHz 16Audio Media658Fail Media AfrikaansFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 750, Lelaki: 1278, dan Tidak Diketahui: 52
UcapanArabic_GC_8ArabicArabicar_AEKHz 8Perbualan Umum292Data Perbualan Umum ArabPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Bahasa Arab dari negara TelukDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 171, Lelaki: 534, dan Tidak Diketahui: 1
UcapanArab_SM_48ArabicArabicar-SAKHz 48Monolog Skrip1,947Monolog Tulisan ArabRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 838 Lelaki 1209 Tidak Diketahui 78
UcapanAssamese_CC_8AssamAssam (Dalam Saluran Paip) seperti dalamPusat panggilan60Data Pusat Panggilan Assam (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanAssamese_GCAssamAssam (Dalam Saluran Paip) seperti dalamPerbualan Umum100Data Perbualan Umum Assam (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanAssamese_MAAssamAssam (Dalam Saluran Paip) seperti dalamAudio Media40Data audio media Assam (Dalam Talian Paip).Fail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanBengali_CC_8bengaliBengali (Dalam Paip) bn_INPusat panggilan60Data Pusat Panggilan Bengali (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanBengali_GCbengaliBengali (Dalam Paip) bn_INPerbualan Umum100Data Perbualan Umum Bengali (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanBengali_MAbengaliBengali (Dalam Paip) bn_INAudio Media40Bengali (Dalam Saluran Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanBoston_CC_8Bahasa Inggeris BostonBahasa Inggeris Bostonen_usKHz 8Pusat panggilan177Data pusat panggilan BostonPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 605, Lelaki: 711, dan Tidak Diketahui: 0
UcapanBoston_GC_8Bahasa Inggeris BostonBahasa Inggeris Bostonen_usKHz 8Perbualan Umum32Data Perbualan Umum BostonPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 53, Lelaki: 83, dan Tidak Diketahui: 0
UcapanBoston_MA_16Bahasa Inggeris BostonBahasa Inggeris Bostonen_usKHz 16Audio Media93Data audio Boston MediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 43, Lelaki: 181, dan Tidak Diketahui: 2
UcapanCanadian_SM_48Perancis KanadaPerancis Kanadafr-CAKHz 48Monolog Skrip1,222Perancis KanadaRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 974 Lelaki 631 Tidak Diketahui 1
UcapanChinese_CC_8Bahasa Inggeris CinaBahasa Inggeris Cinaen_usKHz 8Pusat panggilan169Data pusat panggilan CinaPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 1790, Lelaki: 523 dan Tidak Diketahui: 13
UcapanCina_MA_16Bahasa Inggeris CinaBahasa Inggeris Cinaen_usKHz 16Audio Media249Data audio Media CinaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 126, Lelaki: 346 dan Tidak Diketahui: 6
UcapanBahasa Cina Simplified_SM_48Bahasa CinaBahasa Cinazh-CNKHz 48Monolog Skrip2,762Bahasa CinaRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1920 Lelaki 1535 Tidak Diketahui 270
UcapanCina Tradisional_SM_48Cina TradisionalCina Tradisionalzh-TWKHz 48Monolog Skrip1,028Cina TradisionalRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1069 Lelaki 262 Tidak Diketahui 3
UcapanDanish_GC_8DenmarkDenmarkda_DKKHz 8Perbualan Umum372Data Perbualan Umum DenmarkPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 311, Lelaki: 417, Tidak diketahui: 0
UcapanDanish_MA_16DenmarkDenmarkda_DKKHz 16Audio Media664Data audio Media DenmarkFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan: 369, Lelaki: 864, Tidak diketahui: 27
UcapanDanish_SM_48DenmarkDenmarkda-DKKHz 48Monolog Skrip2,579Monolog Skrip DenmarkRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saat, Denmark dari DenmarkMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1551 Lelaki 1233 Tidak Diketahui 42
UcapanBahasa Inggeris Deep South_CC_8Inggeris Selatan SelatanInggeris Selatan Selatanen_usKHz 8Pusat panggilan151Bahasa Inggeris Deep South Data pusat panggilanPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 221 , Lelaki 1004 , Tidak Diketahui 7
UcapanBahasa Inggeris Deep South_GC_8Inggeris Selatan SelatanInggeris Selatan Selatanen_usKHz 8Perbualan Umum56Data Perbualan Umum Selatan Selatan InggerisPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 99, Lelaki 31, Tidak Diketahui 0
UcapanBahasa Inggeris Deep South_MA_16Inggeris Selatan SelatanInggeris Selatan Selatanen_usKHz 16Audio Media266Data audio Media Deep South Bahasa InggerisFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 204, Lelaki 356, Tidak Diketahui 21
UcapanGerman_CC_8GermanGermande-DeKHz 8Pusat panggilan64Data pusat panggilan Jerman Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Monodesktop.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 478 Lelaki 1440 Tidak Diketahui 0
UcapanGerman_IVR_8GermanGermande-DeKHz 8 sambungan IVR200Data IVR JermanManusia kepada Mesin. Jenis aliran IVR yang terdapat gesaan TTS (cth. "Bagaimana saya boleh membantu anda") diikuti dengan tindak balas manusia secara spontanMonodesktop.wav .jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa Perempuan 10115 Lelaki 8750 Tidak Diketahui 0
UcapanGujarati_CC_8gujaratiGujarati (Dalam Talian Paip) gu_INPusat panggilan60Data Pusat Panggilan Gujarati (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanGujarati_GCgujaratiGujarati (Dalam Talian Paip) gu_INPerbualan Umum100Data Perbualan Umum Gujarati (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanGujarati_MAgujaratiGujarati (Dalam Talian Paip) gu_INAudio Media40Gujarati (Dalam Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanHebrew_Perbualan Umum_8Bahasa IbraniBahasa Ibranidia_ILKHz 8Perbualan Umum399Data Perbualan Umum IbraniPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Ibrani di IsraelDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 414 , Lelaki 399 , Tidak Diketahui 1
UcapanHebrew_MA_16Bahasa IbraniBahasa Ibranidia_ILKHz 16Audio Media427Data audio Media HebrewFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 361 , Lelaki 513, Tidak Diketahui 13
UcapanHindi_MA_16HindiHindihi_INKHz 16Audio Media219Data audio Media HindiFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 83 , Lelaki 309, Tidak Diketahui 0
UcapanHindi_SM_48HindiHindihi-INKHz 48Monolog Skrip2,867Monolog Skrip HindiRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1977 Lelaki 1864 Tidak Diketahui 147
UcapanHINGLISH_CC_8HinglishHinglishhg_INKHz 8Pusat panggilan208HINGLISH Data pusat panggilanPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 822, Lelaki 1262 , Tidak Diketahui 0
UcapanHINGLISH_MA_16HinglishHinglishhg_INKHz 16Audio Media216Data audio media HINGLISHFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 75, Lelaki 380, Tidak Diketahui 0
UcapanHispanik_CC_8Inggeris HispanikInggeris Hispaniken_usKHz 8Pusat panggilan212Data pusat panggilan HispanikPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 822, Lelaki 1262, Tidak Diketahui 0
UcapanHispanik_MA_16Inggeris HispanikInggeris Hispaniken_usKHz 16Audio Media155Audio Media Panggilan HispanikFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 140, Lelaki 219, Tidak Diketahui 5
UcapanIndonesian_GC_8IndonesianIndonesiansaya telah lakukanKHz 8Perbualan Umum496Data Perbualan Umum IndonesiaPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Bahasa IndonesiaDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 524, Lelaki 454, Tidak Diketahui 2
UcapanIndonesian_MA_16IndonesianIndonesiansaya telah lakukanKHz 16Audio Media643Data audio Media IndonesiaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 746, Lelaki 1507, Tidak Diketahui 129
UcapanIrish_GC_8IrishIrishen_IEKHz 8Perbualan Umum192Data Perbualan Umum IrelandPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 213 , Lelaki 153 , Tidak Diketahui 0
UcapanJapanese_SM_48JapaneseJapaneseja-JPKHz 48Monolog Skrip2,335Monolog Skrip JepunRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1460 Lelaki 1221 Tidak Diketahui 194
UcapanKannada_CC_8kannadaKannada (Dalam Saluran Paip) kn_INPusat panggilan60Data Pusat Panggilan Kannada (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanKannada_GCkannadaKannada (Dalam Saluran Paip) kn_INPerbualan Umum100Data Perbualan Umum Kannada (Dalam Saluran Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanKannada_MAkannadaKannada (Dalam Saluran Paip) kn_INAudio Media40Data audio media Kannada (Dalam Talian Paip).Fail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanKorean_CC_8KoreanKoreanko_KRKHz 8Pusat panggilan107Data Pusat Panggilan KoreaPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1086, Lelaki 210 , Tidak Diketahui 4
UcapanKorea_MA_16KoreanKoreanko_KRKHz 16Audio Media204Data audio media KoreaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 70 Lelaki 303, Tidak Diketahui 25
UcapanKorean_SM_48KoreanKoreanko-KRKHz 48Monolog Skrip1,955Monolog Skrip KoreaRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1195 Lelaki 1134 Tidak Diketahui 122
UcapanBahasa Melayu_GC_8MelayuMelayums_MYKHz 8Perbualan Umum266Data Perbualan Umum Bahasa MelayuPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Bahasa Melayu di MalaysiaDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 316, Lelaki 176 , Tidak Diketahui 0
UcapanMelayu_MA_16MelayuMelayums_MYKHz 16Audio Media344Data audio Media MelayuFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 236, Lelaki 626, Tidak Diketahui 47
UcapanMalayalam_CC_8MalayalamMalayalam (Dalam Talian Paip) ml_INPusat panggilan60Data Pusat Panggilan Malayalam (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMalayalam_GCMalayalamMalayalam (Dalam Talian Paip) ml_INPerbualan Umum100Data Perbualan Umum Malayalam (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMalayalam_MAMalayalamMalayalam (Dalam Talian Paip) ml_INAudio Media40Malayalam (Dalam Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMarathi_CC_8MarathiMarathi (Dalam Saluran Paip) mr_INPusat panggilan60Data Pusat Panggilan Marathi (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMarathi_GCMarathiMarathi (Dalam Saluran Paip) mr_INPerbualan Umum100Data Perbualan Umum Marathi (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMarathi_MAMarathiMarathi (Dalam Saluran Paip) mr_INAudio Media40Marathi (Dalam Saluran Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanMexico_SM_48Sepanyol (Mexico)Sepanyol (Mexico)es-MXKHz 48Monolog Skrip1,492Monolog Skrip Sepanyol MexicoRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1016 Lelaki 1069 Tidak Diketahui 95
UcapanBelanda_SM_48DutchDutchnl-NLKHz 48Monolog Skrip1,205Monolog Skrip BelandaRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1285 Lelaki 531 Tidak Diketahui 3
UcapanNew York English_CC_8Bahasa Inggeris New YorkBahasa Inggeris New Yorken_usKHz 8Pusat panggilan103New York English Data pusat panggilanPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 610, Lelaki 532, Tidak Tahu 0
UcapanNew York English_GC_8Bahasa Inggeris New YorkBahasa Inggeris New Yorken_usKHz 8Perbualan Umum107Data Perbualan Umum Bahasa Inggeris New YorkPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 118, Lelaki 114, Tidak Diketahui 0
UcapanNew York English_MA_16Bahasa Inggeris New YorkBahasa Inggeris New Yorken_usKHz 16Audio Media140Data audio New York English MediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 66, Lelaki 230, Tidak Diketahui 11
UcapanNew Zealand_GC_8Inggeris New Zealand Inggeris New Zealand en_NZKHz 8Perbualan Umum148Data Perbualan Umum Bahasa Inggeris New ZealandPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 167, lelaki 121, Tidak diketahui 4
UcapanNew Zealand_MA_16Inggeris New Zealand Inggeris New Zealand en_NZKHz 16Audio Media400Audio Media Inggeris New ZealandFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 367, lelaki 678, Tidak diketahui 26
UcapanOriya_CC_8OriyaOriya (Dalam Talian Paip) or_INPusat panggilan60Data Pusat Panggilan Oriya (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanOriya_GCOriyaOriya (Dalam Talian Paip) or_INPerbualan Umum100Data Perbualan Umum Oriya (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanOriya_MAOriyaOriya (Dalam Talian Paip) or_INAudio Media40Oriya (Dalam Saluran Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanPolish_MA_16PolandPolandpl_PLKHz 16Audio Media269Audio Media PolandFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 173 Lelaki 354 Tidak Diketahui 6
UcapanPoland Poland_SM_48Poland (Poland)Poland (Poland)pl-PLKHz 48Monolog Skrip1,482Poland Poland - Monolog SkripRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1324 Lelaki 701 Tidak Diketahui 24
UcapanPunjabi_CC_8punjabiPunjabi (Dalam Talian Paip) punjabiPusat panggilan60Data Pusat Panggilan Punjabi (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanPunjabi_GCpunjabiPunjabi (Dalam Talian Paip) punjabiPerbualan Umum100Punjabi (Dalam Paip) Data Perbualan UmumPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanPunjabi_MApunjabiPunjabi (Dalam Talian Paip) punjabi Audio Media40Punjabi (Dalam Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanRussian_SM_48RussiaRussiaru-RUKHz 48Monolog Skrip2,398Monolog Skrip RusiaRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1689 Lelaki 1937 Tidak Diketahui 214
UcapanScotland_GC_8Scotland (Inggeris Loghat)Scotland (Inggeris Loghat)en_ABKHz 8Perbualan Umum292Data Perbualan Umum ScotlandPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 285 , Lelaki 260, Tidak Diketahui 3
UcapanSingapura_CC_8Bahasa Inggeris SingapuraBahasa Inggeris Singapuraen_SGKHz 8Pusat panggilan218Data Pusat Panggilan SingapuraPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 2139 , Lelaki 884, Tidak Diketahui 21
UcapanSingapura_MA_16Bahasa Inggeris SingapuraBahasa Inggeris Singapuraen_SGKHz 16Audio Media247Data audio Media SingapuraFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 160, Lelaki 455, Tidak Diketahui 37
UcapanBahasa Inggeris Afrika Selatan_CC_8Inggeris Afrika SelatanInggeris Afrika Selatanen_ZAKHz 8Pusat panggilan261Data Pusat Panggilan Inggeris Afrika SelatanPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1274 , Lelaki 935 , Tidak Diketahui 1
UcapanBahasa Inggeris Afrika Selatan_MA_16Inggeris Afrika SelatanInggeris Afrika Selatanen_ZAKHz 16Audio Media251Data audio Media Inggeris Afrika SelatanFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 235, Lelaki 432, Tidak Diketahui 36
UcapanSwahili_CC_8swahiliswahilisw_KEKHz 8Pusat panggilan230Data Pusat Panggilan SwahiliPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 611, Lelaki 833, Tidak Diketahui 0
UcapanSwahili_MA_16swahiliswahilisw_KEKHz 16Audio Media265Data audio Media SwahiliFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 118, Lelaki 493, Tidak Diketahui 25
UcapanSwedish_CC_8SwedishSwedishsv_SEKHz 8Pusat panggilan250Data Pusat Panggilan SwedenPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1581, lelaki 727, Tidak diketahui 2
UcapanSwedish_MA_16SwedishSwedishsv_SEKHz 16Audio Media278Data audio Media SwedenFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 195, lelaki 500, Tidak diketahui 21
UcapanTamil_CC_8tamilTamil (Dalam Talian Paip) ta_INPusat panggilan60Data Pusat Panggilan Tamil (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanTamil_GCtamilTamil (Dalam Talian Paip) ta_INPerbualan Umum100Tamil (Dalam Saluran Paip) Data Perbualan UmumPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanTamil_MAtamil Tamil (Dalam Talian Paip) ta_INAudio Media40Tamil (Dalam Saluran Paip) Data audio mediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanTelugu_GC_8telugutelugute_INKHz 8Perbualan Umum553Data Perbualan Umum TeluguPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 574 , Lelaki 564, Tidak Diketahui 0
UcapanTelugu_MA_16telugutelugute_INKHz 16Audio Media648Data audio Telugu MediaFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 207, Lelaki 963, Tidak Diketahui 2
UcapanTelugu_CC_8teluguTelugu (Dalam Saluran Paip) te_INPusat panggilan30Data Pusat Panggilan Telugu (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanTelugu_GCteluguTelugu (Dalam Saluran Paip) te_INPerbualan Umum50Data Perbualan Umum Telugu (Dalam Talian Paip).Perbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,desktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanTelugu_MAteluguTelugu (Dalam Saluran Paip) te_INAudio Media20Data audio media Telugu (Dalam Talian Paip).Fail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa
UcapanThai_GC_8ThaiThaith_THKHz 8Perbualan Umum183Perbualan Umum ThaiPerbualan telefon tanpa skrip antara dua orang. lebih kurang Tempoh Audio (Julat) - 15-60 minit, Daftar tidak rasmi yang digunakan antara rakanDwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 338, Lelaki 96, Tidak Diketahui 8
UcapanThai_MA_8ThaiThaith_THKHz 16Audio Media173Audio Media ThaiFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 143, Lelaki 502, Tidak Diketahui 26
UcapanTurki Turki_SM_48Turki TurkiTurki Turkitr-TRKHz 48Monolog Skrip2,027Turki TurkiRakaman sebutan tunggal, yang cenderung jatuh dalam julat 5 hingga 30 saatMonoMobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 1561 Lelaki 1241 Tidak Diketahui 31
UcapanVietnamese_GC_8VietnamVietnamvi_VNKHz 8Perbualan Umum295Data Perbualan Umum VietnamPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit, Utara (cth,Hanoi), Tengah dan Selatan (cth, Bandar Ho Chi Minh).Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 400, lelaki 380, Tidak diketahui 2
UcapanVietnam_MA_16VietnamVietnamvi_VNKHz 16Audio Media257Data audio Media VietnamFail audio/video domain awam yang boleh dilesenkan seperti wawancara, podcast dll - 1 hingga 5 orang. lebih kurang Tempoh Audio (Julat) 15-60 minitMonoPenyumberan Web5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 249, lelaki 200, Tidak diketahui 45
UcapanWelsh_GC_8Bahasa Wales (Logat Inggeris)Bahasa Wales (Logat Inggeris)en_WLKHz 8Perbualan Umum278Data Perbualan Umum WalesPerbualan telefon sintetik tanpa skrip antara "ejen" dan "pelanggan", Anggaran. Tempoh Audio (Julat) 5-15 Minit,Dwidesktop5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaPerempuan 270, Lelaki 324, Tidak Diketahui 0
UcapanInggeris UK_WW_16Inggeris InggerisInggeris Inggerisen_ukKHz 16Bangun KataPembesar suara 200Wake Word UK Inggerisfrasa kunci pengumpulan data
  • Penceramah 200
  • 4 frasa kunci unik bagi setiap pembesar suara
  • 25-30 frasa kunci berulang rakaman setiap frasa kunci unik
  • 25-30 fail audio bagi setiap frasa kunci unik
  • 120 jumlah ujaran yang dirakam setiap penceramah
saluran 1Mobile App5.0.wav.jsonASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan BahasaJantina: 50% lelaki, 50% perempuan, +/- 10%.

Perkhidmatan yang Ditawarkan

Pengumpulan data audio pakar bukan semua-untuk-dek untuk penyediaan AI yang komprehensif. Di Shaip, anda juga boleh mempertimbangkan perkhidmatan berikut untuk menjadikan model menjadi lebih meluas daripada biasa:

Pengumpulan data teks

Pengumpulan Data Teks
Perkhidmatan

Nilai sebenar perkhidmatan pengumpulan data kognitif Shaip adalah bahawa ia memberi organisasi kunci untuk membuka kunci maklumat kritikal yang terdapat dalam data tidak berstruktur

Pengumpulan data imej

Perkhidmatan Pengumpulan Data Imej

Pastikan model penglihatan komputer anda mengenal pasti setiap gambar dengan tepat, untuk melatih model AI generasi akan datang dengan lancar

Pengumpulan data video

Perkhidmatan Pengumpulan Data Video

Sekarang fokus pada penglihatan komputer bersama dengan NLP untuk melatih model anda mengenal pasti objek, individu, pencegah, dan elemen visual lain sehingga sempurna

Shaip hubungi kami

Ingin membina set data audio anda sendiri?

Berhubung dengan pakar pengumpulan data pertuturan dalaman kami untuk menyediakan repositori audio yang paling sesuai dengan keperluan anda

  • Dengan mendaftar, saya bersetuju dengan Shaip Polisi Laman Web and Syarat Perkhidmatan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B daripada Shaip.

Pengumpulan Data Pertuturan untuk Model ML merujuk kepada proses pengumpulan rakaman audio bahasa pertuturan. Koleksi ini membantu dalam melatih dan memperhalusi algoritma pembelajaran mesin, terutamanya yang tertumpu pada pemahaman dan pemprosesan suara manusia.

Apabila menyasarkan untuk mengumpul data audio untuk Pengecaman Pertuturan Automatik (ASR), anda harus bermula dengan mentakrifkan keperluan khusus projek anda, termasuk bahasa, loghat dan jenis pertuturan yang dikehendaki. Selepas menetapkan parameter ini, pastikan anda memperoleh semua kebenaran yang diperlukan untuk menghormati privasi pengguna. Kemudian, gunakan peranti atau perisian rakaman yang sesuai untuk menangkap sampel audio yang jelas. Setiap rakaman harus diberi anotasi dengan teliti dengan transkripsinya atau metadata lain yang berkaitan dan disimpan secara sistematik untuk akses yang mudah.

Set data pertuturan dalam pembelajaran mesin adalah penting untuk melatih, menguji dan mengesahkan model yang disesuaikan untuk mengecam, mentranskripsi atau mentafsir bahasa pertuturan. Set data sedemikian membuka jalan untuk pelbagai aplikasi, daripada pembantu suara dan perkhidmatan transkripsi kepada biometrik suara.

Untuk mengumpul data yang tepat daripada pelbagai bahasa dan aksen, kerjasama dengan penutur asli latar belakang linguistik yang diingini adalah penting. Matlamat untuk sampel yang berbeza-beza dan mewakili untuk merangkumi spektrum luas nuansa demografi. Gunakan peralatan rakaman piawai dalam persekitaran yang seragam untuk memastikan ketekalan audio. Dan yang penting, beri anotasi setiap bahagian data dengan transkripsi dan metadata terperinci, menandakan bahasa dan aksen tertentu.