Sekarang Dapatkan POTONGAN 50* pada Set Data Luar Rak AI Perbualan
Set data pertuturan & Audio untuk chatbots, pembantu suara, peranti yang didayakan pertuturan.
*Tawaran Tempoh Terhad
Dipercayai oleh Pemimpin Industri
Butiran | Kata kunci | Set Data Bahasa di luar rak | Perbualan Pusat Panggilan 8khz* | Perbualan Generik 8khz* | Media & Podcast 16khz* | Ujaran/ Monolog Skrip 16khz* | Jumlah Isipadu dalam Jam | Dialek yang diliputi | Format Audio | Format Transkripsi Teks | Gunakan Kes | Source | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Afrikaans | Set Data Audio Afrikaans | 600 | 900 | 1500 | Afrikaans dituturkan di Afrika | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Arabic | Set Data Audio Arab | 800 | 1500 | 2300 | Arab dari negara Teluk | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Cina | Set Data Audio Cina | 2000 | 2000 | Cina dari China | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Denmark | Set Data Audio Denmark | 400 | 600 | 2000 | 3000 | Danish dari Denmark | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Dutch | Set Data Audio Belanda | 2000 | 2000 | Belanda dari Belanda | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Bahasa Inggeris - AAVE Accent | Bahasa Inggeris - AAVE (African American Vernacular English) Set Data Audio | 500 | 500 | 1000 | Variasi vernakular (kadangkala dikenali sebagai AAVE, lazimnya dituturkan oleh sebahagian besar warga Amerika Afrika yang bekerja dan kelas menengah) dan ragam yang lebih standard (biasanya dituturkan oleh warga Amerika Afrika kelas pertengahan dalam situasi formal dan awam) tetapi dengan penekanan yang lebih kuat pada bahasa vernakular. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Inggeris - Boston/New York Accent | Bahasa Inggeris - Set Data Audio Boston/New York | 225 | 225 | 350 | 800 | Ini ialah koleksi beberapa loghat serantau yang dituturkan di dalam dan sekitar bandar Boston, New York dan Philadelphia. Loghat ini mungkin kedengaran serupa dengan loghat bukan tempatan, tetapi berbeza daripada loghat Amerika yang lain. Walaupun terdapat beberapa perbendaharaan kata tempatan yang berbeza daripada bahagian lain dalam dunia berbahasa Inggeris, aksen ini boleh difahami bersama dengan bahasa Inggeris yang dituturkan di tempat lain. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Loghat Inggeris - Cina | Set Data Audio Beraksen Bahasa Inggeris - Cina | 150 | 300 | 450 | Penutur yang bercakap bahasa Cina sebagai bahasa pertama mereka dan yang berpindah/berhijrah ke Amerika Syarikat sebagai remaja/dewasa dan mempelajari bahasa Inggeris sebagai bahasa kedua mereka. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Inggeris - Deep South Accent | Inggeris - Deep South Audio Dataset | 275 | 275 | 450 | 1000 | Penceramah dari (i) Texas; (ii) Carolina Utara, Carolina Selatan, Georgia; (iii) New Orleans; (iv) Florida panhandle; (v) Tennessee, Arkansas, Michigan. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Inggeris - Loghat Hispanik | Bahasa Inggeris - Set Data Audio Beraksen Hispanik | 400 | 400 | 800 | Bahasa Inggeris Hispanik merujuk kepada kepelbagaian bahasa Inggeris AS yang dituturkan oleh warga Amerika Hispanik dari pelbagai warisan negara. Tumpuan utama adalah pada warga Mexico Amerika, penutur asal usul negara yang berbeza (cth Mexico, Puerto Rico, Republik Dominican, Ecuador, Cuba, dll) dan dari wilayah yang berbeza (cth California, New York, Florida) juga. Penceramah termasuk yang bercakap bahasa Sepanyol sebagai bahasa pertama serta penutur asal Hispanik yang bercakap bahasa Sepanyol mempunyai bahasa warisan. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Bahasa Inggeris - Loghat New Zealand | Set Data Audio Inggeris - New Zealand | 250 | 750 | 1000 | Pembesar suara di kedua-dua pulau, termasuk gabungan pembesar suara yang lebih muda (<40 tahun) dan pembesar suara yang lebih tua (>40 tahun) dalam perkadaran yang sama. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Bahasa Inggeris - Loghat Singapura | Set Data Audio Inggeris - Singapura | 400 | 600 | 1000 | Kedua-dua Bahasa Inggeris Standard Singapura dan Bahasa Inggeris Singapura Kolokial. Warga Singapura dari latar belakang etnik yang berbeza (cth. Cina, Melayu, India, dsb) dan berbeza tahap pendidikan. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Bahasa Inggeris - Loghat Afrika Selatan | Set Data Audio Inggeris - Afrika Selatan | 400 | 600 | 1000 | Wakil daripada pelbagai kelas sosioekonomi dan latar belakang etnologi (cth Afrika Selatan Eropah, Afrika, India, atau latar belakang campuran). | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Bahasa Inggeris - Loghat Ireland | Set Data Audio Inggeris - Ireland | 500 | 500 | Bahasa Inggeris dituturkan di Ireland | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Inggeris - Loghat Scotland | Bahasa Inggeris - Set Data Audio Scotland | 800 | 800 | Bahasa Inggeris yang dituturkan oleh orang Scotland | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Inggeris - Welsh Accent | Bahasa Inggeris - Set Data Audio Wales | 800 | 800 | Bahasa Inggeris Wales | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Kanada Perancis | Set Data Audio Kanada Perancis | 1000 | 1000 | Perancis Kanada | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Bahasa Ibrani | Set Data Audio Ibrani | 750 | 750 | 1500 | Ibrani di Israel | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Indonesian | Set Data Audio Indonesia | 1000 | 1000 | 2000 | Bahasa Indonesia | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Japanese | Set Data Audio Jepun | 2000 | 2000 | Jepun dari Jepun | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Korean | Set Data Audio Korea | 100 | 200 | 1500 | 1800 | Penceramah tersebar di seluruh Korea Selatan. | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Melayu | Set Data Audio Bahasa Melayu | 500 | 500 | 1000 | Melayu di Malaysia | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Sepanyol Mexico | Set Data Audio Sepanyol Mexico | 1250 | 1250 | Mexico dari Mexico | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Poland | Set Data Audio Poland | 250 | 2000 | 2250 | Poland dari Poland | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Russia | Set Data Audio Rusia | 2000 | 2000 | Rusia dari Rusia | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
swahili | Set Data Audio Swahili | 350 | 650 | 1000 | Afrika Selatan dan Swahili Kenya | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Swedish | Set Data Audio Sweden | 350 | 650 | 1000 | Sweden di Sweden | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Cina Taiwan | Set Data Audio Cina Taiwan | 1000 | 1000 | Cina dari Taiwan | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Thai | Set Data Audio Thai | 350 | 450 | 800 | Daftar tidak rasmi yang digunakan antara rakan, | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Turki | Set Data Audio Turki | 2000 | 2000 | Turki dari Turki | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||||
Vietnam | Set Data Audio Vietnam | 600 | 400 | 1000 | Utara (cth, Hanoi), Tengah, dan Selatan (cth, Bandar Ho Chi Minh). | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Hindi | Set Data Audio Hindi | 800 | 2000 | 2800 | Hindi di India khususnya di wilayah Utara, Timur dan Barat | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
Hinglish | Set Data Audio Bahasa Inggeris India | 300 | 500 | 800 | Dikumpul dari bandar bandar India yang menjadi hab kewangan negara kerana peluang ekonomi yang semakin meningkat. Tempat-tempat tersebut boleh Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, dll | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||
English | Set Data Audio Bahasa Inggeris | 700 | 700 | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | |||||
kannada | Set Data Audio Kannada | 60 | 100 | 40 | 200 | Kannada dari Karnataka, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Malayalam | Set Data Audio Malayalam | 60 | 100 | 40 | 200 | Malayalam dari Kerala, Lakshadweep dan Puducherry | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Oriya | Set Data Audio Oriya | 60 | 100 | 40 | 200 | Oriya dari bahagian Odisha, West Bengal, Jharkhand dan Chhattisgarh | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
punjabi | Set Data Audio Punjabi | 60 | 100 | 40 | 200 | Punjabi dari Punjab, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
tamil | Set Data Audio Tamil | 60 | 100 | 240 | 400 | Tamil dari Tamil Nadu, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
telugu | Set Data Audio Telugu | 100 | 950 | 950 | 2000 | Telugu dari Andhra Pradesh, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
bengali | Set Data Audio Bengali | 60 | 100 | 40 | 200 | Benggali dari Benggala Barat, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
gujarati | Set Data Audio Gujarati | 60 | 100 | 40 | 200 | Gujerat dari Gujerat, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Marathi | Set Data Audio Marathi | 60 | 100 | 40 | 200 | Marathi dari Maharashtra, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami | ||
Assam | Set Data Audio Assam | 60 | 100 | 40 | 200 | Assam dari Asssam, India | .wav | .json | ASR, Pembantu Maya, Chatbot, AI Perbualan, Analitis Pertuturan, TTS, Pemodelan Bahasa | Saip | Hubungi Kami Hubungi Kami |
Kepakaran yang mendalam dalam Percakapan AI
AI Perbualan atau Chatbots atau Pembantu Maya / Digital hanya pintar seperti teknologi dan data di belakangnya. Di Shaip, kami menawarkan anda satu set luas set data audio terpelbagai untuk Pemprosesan Bahasa Asli (NLP) yang meniru perbualan dengan orang sebenar yang membolehkan anda menghidupkan AI anda. Dengan pemahaman mendalam kami, kami membantu anda membina dan menyetempatkan model pertuturan yang didayakan AI, dengan ketepatan tertinggi dengan set data yang kaya dan berstruktur dalam berbilang bahasa dari seluruh dunia. Kami menawarkan perkhidmatan koleksi audio berbilang bahasa, transkripsi audio dan anotasi audio berdasarkan keperluan anda, sambil menyesuaikan sepenuhnya niat, ujaran dan pengedaran demografi yang diingini.
Koleksi Ucapan Skrip
Koleksi Ucapan Spontan
Transkripsi Data Audio
Pelabelan & Anotasi Data
Shaip membolehkan anda melatih Platform AI Perbualan anda dengan tepat supaya ia boleh:
- Berbual, menghantar teks dan bersembang dengan lancar merentas berbilang saluran.
- Belajar daripada interaksi sedia ada dalam bentuk sembang, transkrip suara, transaksi, dsb. dan mencadangkan & berbual, berdasarkan pembelajaran ini.
- Fahami maksud di sebalik pertuturan manusia dan hapuskan kekaburan dalam memahami bahasa manusia.
- Berinteraksi dengan anda secara satu-satu dan boleh dilatih untuk mengenal pasti pengguna dan mengingati perbualan yang lalu.
Pemimpin Dunia dalam Data Latihan AI Percakapan
Jam data audio dalam 100+ bahasa - Berasal, Ditranskrip & Dianotasi
Perlesenan Data Pertuturan
20k + jam Data Ucapan dalam 40+ bahasa dan dialek yang merangkumi pelbagai topik 55+ dari pelbagai domain iaitu, Pusat Panggilan, Perbahasan, Perbualan umum, Ucapan, podcast, dll.
Pengumpulan Data Ucapan
Kumpulkan data audio & pertuturan (monolog, perbualan 2 orang, sembang bot manusia) dalam lebih dari 100 bahasa dari seluruh dunia, disesuaikan dengan keperluan AI anda.
Transkripsi Data Ucapan
Transkripsi audio atau penjelasan audio yang menjimatkan melalui tenaga kerja yang kuat daripada 30,000 kolaborator dengan TAT, ketepatan, dan penjimatan yang dijamin
Percepatkan pembangunan apl AI Perbualan anda dengan Perkhidmatan Koleksi Audio & Anotasi Audio
Kelebihan Shaip
Skala
Kami dapat sumber, skala, dan menyampaikan data audio dari seluruh dunia dalam pelbagai bahasa dan dialek berdasarkan keperluan anda.
Kepakaran
Kami mempunyai kepakaran yang tepat mengenai pengumpulan data, transkripsi, dan anotasi standard emas yang tepat dan tidak berat sebelah.
rangkaian
Rangkaian 30,000+ penyumbang yang berkelayakan, yang dapat dengan cepat diberikan tugas pengumpulan data untuk membangun model latihan AI & meningkatkan perkhidmatan.
Teknologi
Kami mempunyai platform berasaskan AI sepenuhnya dengan alat & proses proprietari untuk memanfaatkan pengurusan aliran kerja 24 * 7 sepanjang masa.
Ketangkasan
Kami menyesuaikan diri dengan perubahan keperluan pelanggan dengan sangat cepat dan membantu mempercepat pengembangan AI dengan data ucapan berkualiti 5-10x lebih cepat daripada persaingan.
Keselamatan
Kami sangat mengutamakan keselamatan dan privasi data dan juga diperakui untuk mengendalikan data sensitif yang sangat terkawal.
Apa yang Kami Lakukan dengan Terbaik
Data Latihan
Dapatkan data berlabel kualiti tertinggi dalam sebahagian kecil masa. Ia adalah standard emas, boleh dipercayai dan bersedia untuk melatih model AI dan ML anda untuk mencapai tahap prestasi tertinggi.
Pengumpulan, Pelabelan & Anotasi Data
Dengan Shaip anda mendapat 15+ tahun kepakaran terbukti dalam mengumpul, menyalin dan menganotasi data berkualiti. Dengan tenaga buruh global kami, kami boleh mengumpul data dari seluruh dunia, kemudian menyediakan perkhidmatan pelabelan dan anotasi dengan jumlah tahap kemahiran dan kepakaran yang diperlukan untuk data anda.
Katalog Data & Perlesenan
Dengan inventori berjuta-juta set data kami yang luas, anda boleh mengumpul dan menyusun mengikut keperluan. Kami kemudiannya boleh melesenkan data berkualiti itu untuk keperluan penggunaan AI dan ML khusus anda. Selain itu, data ini tersedia pada sebahagian kecil daripada kos jika anda menciptanya sendiri.
Ingin membina set data anda sendiri?
Hubungi kami sekarang untuk mengetahui cara kami boleh mengumpul set data tersuai untuk penyelesaian AI unik anda.