Analisis Emosi & Sentimen Pertuturan

Mendayakan Pusat Panggilan Lebih Pintar dengan Cerapan Dipacu AI

Memanfaatkan kepakaran Shaip dalam pengumpulan data audio dan anotasi untuk meningkatkan emosi masa nyata dan pengesanan sentimen untuk perkhidmatan pelanggan yang lebih baik.

Analisis Emosi & Sentimen Pertuturan

Analisis Emosi & Sentimen Pertuturan Automatik

Pelanggan bekerjasama dengan Shaip untuk membangunkan model analisis emosi dan sentimen pertuturan automatik untuk pusat panggilan. Projek ini melibatkan pengumpulan dan anotasi 250 jam data audio pusat panggilan merentas empat dialek Inggeris - AS, UK, Australia dan India. Ini membolehkan pelanggan meningkatkan model AI mereka untuk mengesan emosi seperti Gembira, Neutral dan Marah, dan sentimen seperti Tidak Puas dan Puas dalam interaksi pelanggan masa nyata.

Projek ini mengatasi cabaran seperti pengesanan sindiran, panjang audio yang berbeza-beza, dan isyarat lisan yang halus tentang ketidakpuasan hati, memberikan hasil yang tepat dan boleh skala.

Analisis Emosi & Sentimen Pertuturan Automatik

Statistik Utama

Data audio pusat panggilan dikumpul & diberi penjelasan merentas 4 dialek Inggeris

250 Jam

Bilangan Bahasa

Inggeris AS, Inggeris UK, Inggeris Australia & Inggeris India

Gunakan Kes

Analisis Emosi & Sentimen Pertuturan Automatik

Skop projek

Kumpul dan anotasi 250 jam data audio pusat panggilan dalam empat dialek bahasa Inggeris:

  • Bahasa Inggeris AS (30%)
  • Inggeris UK (30%)
  • Bahasa Inggeris Australia (20%)
  • Bahasa Inggeris India (20%)

Dalam Skop

Projek ini terdiri daripada tiga bahagian:

  • Data audio dengan entiti tertentu, termasuk metadata.
  • Fail transkripsi yang sepadan dengan butiran segmentasi dan cap masa.
  • Anotasi emosi dan sentimen:
    • Emosi Audio: Gembira, Berkecuali, Marah
    • Sentimen Transkripsi: Amat Tidak Puas Hati, Tidak Puas Hati, Neutral, Puas Hati, Amat Puas Hati

Cabaran

Kepelbagaian Dialek

Memastikan bahawa data audio mewakili dialek yang dinyatakan dengan tepat (AS, UK, Australia dan India) boleh menjadi mencabar. Kawasan yang berbeza dalam kategori ini mungkin menggunakan perbendaharaan kata, aksen dan sebutan yang pelbagai.

Keperluan Kepakaran

Menganotasi audio dan transkripsi untuk emosi dan sentimen memerlukan anotor terlatih yang biasa dengan nuansa budaya dan kehalusan linguistik setiap dialek.

Kerumitan Emosi & Sentimen

Emosi audio & sentimen transkripsi tidak sentiasa sejajar. Sebagai contoh, seseorang mungkin terdengar marah tetapi sebenarnya menyatakan kepuasan. Cth, mengendalikan perbualan sindiran dalam frasa sarkastik seperti "Oh, hebat, orang lain yang tidak dapat menyelesaikan masalah saya" perlu diberi anotasi dengan betul untuk emosi & sentimen.

Kualiti audio

Kualiti rakaman audio boleh berbeza-beza, menjejaskan ketepatan transkripsi dan pengesanan emosi. Bunyi latar belakang, perbualan yang bertindih dan pelbagai peralatan rakaman boleh menimbulkan cabaran yang ketara.

Menangkap Tepat

Ketidakpuasan hati melalui isyarat lisan seperti menghembus nafas berat atau tanda-tanda kekecewaan lain.

Penyelesaian

Dengan memanfaatkan teknik pemprosesan bahasa semula jadi (NLP) lanjutan, penyelesaian berikut telah dilaksanakan:

Pengumpulan Data

  • 250 jam data audio dibahagikan kepada kuota khusus dialek.
    • Bahasa Inggeris AS (30% atau 75 jam)
    • Inggeris UK (30% atau 75 jam)
    • Bahasa Inggeris Australia (20% atau 50 jam)
    • Bahasa Inggeris India (20% atau 50 jam)
  • Pengguna aksen asli dari AS, UK, Australia dan India.
  • Sampel pertuturan yang mengandungi nada yang berbeza-beza, dengan tumpuan khusus pada kes di mana emosi suara Marah dan sentimen teks Tidak Puas Hati atau Sangat Tidak Puas Hati.

Klasifikasi/Anotasi Teks

Pengelasan Teks

  • Anotasi emosi dan sentimen berdasarkan kategori tertentu:
    • Emosi Audio: Gembira, Berkecuali, Marah.
    • Sentimen Transkripsi: Amat Tidak Puas Hati, Tidak Puas Hati, Neutral, Puas Hati, Amat Puas Hati.
  • Setiap segmen audio hanya mengandungi satu emosi utama.
  • Mengubah segmen kelewatan (dari 2 hingga 30 saat) digunakan dalam perbualan.
  • Format transkripsi mengikuti output JSON, termasuk maklumat pembesar suara kiri dan kanan, teg sentimen dan sentimen segmen akhir.

 

Jaminan Kualiti

Jaminan Kualiti
Ketepatan Transkripsi:

  • Memastikan 250 jam audio dihantar dengan sekurang-kurangnya:
    • 90% ketepatan Transcription Error Rate (TER).
    • 95% ketepatan Kadar Pengecaman Perkataan (WER).

Proses QA:

  • Audit tetap sampel yang dipilih secara rawak daripada set data telah dijalankan.
    • Menggunakan alatan automatik untuk mengukur TER dan WER merentas set data.
    • Semakan manual bahagian yang dibenderakan memastikan ambang ketepatan dipenuhi.

Hasilnya

Data latihan akan menyokong pembangunan model pengesanan emosi dan sentimen automatik, yang menyampaikan:

  • Pengesanan emosi masa nyata dalam interaksi pusat panggilan.
  • Pengendalian kes kompleks yang lebih berkesan, seperti sindiran atau rasa tidak puas hati.
  • Kebolehskalaan untuk projek masa hadapan, mudah menyesuaikan diri dengan peningkatan volum data dan lebih banyak bahasa.

Deliverables

  • 250 jam fail Audio (dalam format 8 kHz PCM WAV, mono)
  • Fail transkripsi (dengan pembahagian, teg sentimen dan pengecam pembesar suara)
  • Metadata (tempoh audio, butiran pembesar suara, dsb.)

Bekerjasama dengan Shaip untuk projek data pusat panggilan kami telah menjadi detik penting dalam memajukan penyelesaian AI kami. Pasukan mereka dengan mahir mengumpul dan membuat anotasi 250 jam data audio merentas empat dialek Inggeris utama - AS, UK, Australia dan India - memastikan kualiti dan ketepatan tertinggi. Perhatian kepada nuansa linguistik di seluruh wilayah ini telah meningkatkan ketepatan model pengecaman pertuturan kami dengan ketara. Selain itu, kepakaran Shaip dalam mengendalikan projek anotasi data yang kompleks, telah memainkan peranan penting dalam membantu kami membina model yang boleh dipercayai dan patuh pada skala.

Bintang Emas 5