Kajian Kes: Kesederhanaan Kandungan

30K+ dokumen web dilupuskan & dianotasi untuk Penyederhanaan Kandungan
Penyederhanaan kandungan - sepanduk
Terdapat permintaan yang semakin meningkat untuk penyederhanaan kandungan dikuasakan AI yang berusaha untuk mendapatkan ruang dalam talian tempat kami berhubung & berkomunikasi.

Memandangkan penggunaan media sosial terus berkembang, masalah buli siber telah muncul sebagai halangan penting bagi platform yang berusaha untuk memastikan ruang dalam talian yang selamat. Sebanyak 38% individu menghadapi kelakuan buruk ini setiap hari, menekankan permintaan mendesak untuk pendekatan penyederhanaan kandungan inventif. Organisasi hari ini bergantung pada penggunaan kecerdasan buatan untuk menangani masalah buli siber yang berterusan secara proaktif.

Keselamatan siber:

Laporan Penguatkuasaan Standard Komuniti S4 Facebook didedahkan – tindakan ke atas 6.3 juta kandungan buli dan gangguan, dengan kadar pengesanan proaktif sebanyak 49.9%

pendidikan:

2021 kajian mendapati bahawa 36.5% % pelajar di amerika syarikat berumur antara 12 & 17 tahun mengalami buli siber pada satu ketika atau yang lain semasa persekolahan mereka.

Menurut laporan 2020, pasaran penyelesaian penyederhanaan kandungan global bernilai USD 4.07 bilion pada 2019 dan dijangka mencecah USD 11.94 bilion menjelang 2027, dengan CAGR sebanyak 14.7%.

Penyelesaian Dunia Sebenar

Data yang menyederhanakan perbualan global

Pelanggan sedang membangunkan model Pembelajaran Mesin penyederhanaan kandungan automatik yang mantap untuk tawaran Awannya, yang mana mereka sedang mencari vendor khusus domain yang boleh membantu mereka dengan data latihan yang tepat.

Memanfaatkan pengetahuan kami yang luas dalam pemprosesan bahasa semula jadi (NLP), kami membantu pelanggan dalam mengumpulkan, mengkategorikan dan menganotasi lebih daripada 30,000 dokumen dalam kedua-dua bahasa Inggeris dan Sepanyol untuk membina penyederhanaan kandungan automatik Model Pembelajaran Mesin yang dibahagikan kepada kandungan Toksik, Matang atau Eksplisit Seksual kategori.

Penyelesaian dunia sebenar

Masalah

  • Web mengikis 30,000 dokumen dalam bahasa Sepanyol dan Inggeris daripada domain yang diutamakan
  • Mengkategorikan kandungan yang dikumpul kepada segmen pendek, sederhana dan panjang
  • Melabelkan data yang disusun sebagai kandungan toksik, matang atau seksual yang eksplisit
  • Memastikan anotasi berkualiti tinggi dengan ketepatan minimum 90%.

Penyelesaian

  • Web Menghapus 30,000 dokumen setiap satu untuk bahasa Sepanyol & Inggeris daripada BFSI, Penjagaan Kesihatan, Pembuatan, Peruncitan. Kandungan dicabangkan lagi kepada dokumen pendek, sederhana & panjang 
  • Berjaya melabelkan kandungan yang dikelaskan sebagai kandungan toksik, matang atau seksual eksplisit
  • Untuk mencapai kualiti 90%, Shaip melaksanakan proses kawalan kualiti dua peringkat:
    » Tahap 1: Semakan Jaminan Kualiti: 100% daripada fail yang akan disahkan.
    » Tahap 2: Semakan Analisis Kualiti Kritikal: Pasukan CQA Shaips untuk menilai 15%-20% daripada sampel retrospektif.

Hasilnya

Data latihan membantu dalam membina model ML penyederhanaan kandungan automatik yang boleh menghasilkan beberapa hasil yang bermanfaat untuk mengekalkan persekitaran dalam talian yang lebih selamat. Beberapa hasil utama termasuk:

  • Kecekapan untuk memproses amt data yang luas
  • Konsisten dalam memastikan penguatkuasaan seragam dasar kesederhanaan
  • Kebolehskalaan untuk menyesuaikan diri dengan jumlah pangkalan pengguna dan kandungan yang semakin meningkat
  • Penyederhanaan Masa Nyata boleh mengenal pasti &
    alih keluar kandungan yang berpotensi berbahaya kerana ia dihasilkan
  • Keberkesanan kos dengan mengurangkan pergantungan kepada penyederhana manusia

Mempercepatkan pembangunan aplikasi AI Perbualan anda sebanyak 100%

Beritahu kami bagaimana kami dapat membantu dengan inisiatif AI anda yang seterusnya.