Kajian Kes: Kesederhanaan Kandungan

30K+ dokumen web dilupuskan & dianotasi untuk Penyederhanaan Kandungan

Content moderation - banner
Terdapat permintaan yang semakin meningkat untuk penyederhanaan kandungan dikuasakan AI
yang berusaha untuk mendapatkan ruang dalam talian tempat kami berhubung & berkomunikasi.

Memandangkan penggunaan media sosial terus berkembang,
masalah buli siber telah timbul sebagai a
halangan penting untuk platform berusaha untuk
memastikan ruang dalam talian yang selamat. Suatu yang mengejutkan
38% individu menghadapi ini
perbuatan yang merugikan setiap hari,
menekankan permintaan mendesak untuk inventif
pendekatan penyederhanaan kandungan.
Organisasi hari ini bergantung pada penggunaan
kecerdasan buatan untuk menangani yang berkekalan
masalah buli siber secara proaktif.

Keselamatan siber:

Laporan Penguatkuasaan Standard Komuniti S4 Facebook didedahkan – tindakan ke atas 6.3 juta kandungan buli dan gangguan, dengan kadar pengesanan proaktif sebanyak 49.9%

pendidikan:

2021 kajian mendapati bahawa 36.5% % pelajar di amerika syarikat berumur antara 12 & 17 tahun mengalami buli siber pada satu ketika atau yang lain semasa persekolahan mereka.

Menurut laporan 2020, pasaran penyelesaian penyederhanaan kandungan global bernilai USD 4.07 bilion pada 2019 dan dijangka mencecah USD 11.94 bilion menjelang 2027, dengan CAGR sebanyak 14.7%.

Penyelesaian Dunia Sebenar

Data yang menyederhanakan perbualan global

Pelanggan sedang membangunkan automatik yang mantap
penyederhanaan kandungan Pembelajaran Mesin
model untuk tawaran Awannya, yang mana mereka
sedang mencari vendor khusus domain yang
boleh membantu mereka dengan data latihan yang tepat.

Memanfaatkan pengetahuan kami yang luas dalam pemprosesan bahasa semula jadi (NLP), kami membantu pelanggan dalam mengumpulkan, mengkategorikan dan menganotasi lebih daripada 30,000 dokumen dalam kedua-dua bahasa Inggeris dan Sepanyol untuk membina penyederhanaan kandungan automatik Model Pembelajaran Mesin yang dibahagikan kepada kandungan Toksik, Matang atau Eksplisit Seksual kategori.

Real world solution

Masalah

  • Web mengikis 30,000 dokumen dalam bahasa Sepanyol dan Inggeris daripada domain yang diutamakan
  • Mengkategorikan kandungan yang dikumpul kepada segmen pendek, sederhana dan panjang
  • Melabelkan data yang disusun sebagai kandungan toksik, matang atau seksual yang eksplisit
  • Memastikan anotasi berkualiti tinggi dengan ketepatan minimum 90%.

Penyelesaian

  • Web Menghapus 30,000 dokumen setiap satu untuk bahasa Sepanyol & Inggeris daripada BFSI, Penjagaan Kesihatan, Pembuatan, Peruncitan. Kandungan dicabangkan lagi kepada dokumen pendek, sederhana & panjang 
  • Berjaya melabelkan kandungan yang dikelaskan sebagai kandungan toksik, matang atau seksual eksplisit
  • Untuk mencapai kualiti 90%, Shaip melaksanakan proses kawalan kualiti dua peringkat:
    » Tahap 1: Semakan Jaminan Kualiti: 100% daripada fail yang akan disahkan.
    » Tahap 2: Semakan Analisis Kualiti Kritikal: Pasukan CQA Shaips untuk menilai 15%-20% daripada sampel retrospektif.

Hasilnya

Data latihan membantu dalam membina model ML penyederhanaan kandungan automatik yang boleh menghasilkan beberapa hasil yang bermanfaat untuk mengekalkan persekitaran dalam talian yang lebih selamat. Beberapa hasil utama termasuk:

  • Kecekapan untuk memproses amt data yang luas
  • Konsisten dalam memastikan penguatkuasaan seragam dasar kesederhanaan
  • Kebolehskalaan untuk menyesuaikan diri dengan jumlah pangkalan pengguna dan kandungan yang semakin meningkat
  • Penyederhanaan Masa Nyata boleh mengenal pasti &
    alih keluar kandungan yang berpotensi berbahaya kerana ia dihasilkan
  • Keberkesanan kos dengan mengurangkan pergantungan kepada penyederhana manusia

Contoh Penyederhanaan Kandungan

Examples of content moderation

Mempercepat AI Percakapan anda
pembangunan aplikasi sebanyak 100%

Beritahu kami bagaimana kami dapat membantu dengan inisiatif AI anda yang seterusnya.