Kajian Kes Mengenai Model Pengecaman Muka
Set Data Video Anti-Spoofing untuk Model AI Pengesanan Penipuan
Temui cara Shaip menyampaikan 25,000 set data video anti-penipuan berkualiti tinggi yang menampilkan senario serangan sebenar dan main semula untuk melatih model AI bagi pengesanan penipuan.
Gambaran Keseluruhan projek
Shaip bekerjasama dengan syarikat keselamatan AI terkemuka untuk menyediakan set data video anti-spoofing berkualiti tinggi dan luar biasa yang direka untuk meningkatkan latihan model AI untuk pengesanan penipuan. Set data termasuk 25,000 video yang menangkap kedua-dua senario serangan sebenar dan memainkan semula, memastikan data latihan yang mantap untuk model anti-penipuan.
Setiap satu daripada Peserta 12,500 menyumbang dua video—satu serangan sebenar dan satu serangan ulangan—dirakam di peleraian 720p atau lebih tinggi dengan kadar bingkai sebanyak 26 FPS dan ke atas.
Matlamat projek adalah untuk menyampaikan set data yang tulen dan pelbagai yang akan membolehkan model AI membezakan secara berkesan antara video biometrik sebenar dan palsu, dengan itu mengurangkan risiko penipuan dalam sistem pengesahan biometrik.

Statistik Utama
25,000 jumlah video (12,500 video sebenar, 12,500 ulang tayang video serangan)
12,500 unik
peserta
5 kumpulan etnik
diwakili dalam set data
Penghantaran berperingkat: 4 kumpulan daripada 6,250 video setiap satu
Atribut metadata: 12 parameter utama untuk kebolehgunaan set data yang dipertingkatkan
Skop Set Data Biometrik Anti-Spoofing
Susunan Set Data: Projek ini memberi tumpuan kepada penyampaian set data video anti-penipuan berkualiti tinggi yang terdiri daripada sebenar dan memainkan semula video serangan. Aspek utama termasuk:
- Peserta 12,500 menyumbang dua video setiap satu (1 sebenar, 1 palsu).
- Kepelbagaian dalam peranti rakaman untuk meningkatkan kebolehsesuaian model.
- Perwakilan etnik yang seimbang untuk memastikan keterangkuman set data.
Pengumpulan Metadata: Setiap video disertakan dengan 12 atribut metadata untuk meningkatkan kebolehgunaan set data.
Cabaran Pengumpulan Data Video
Mengekalkan pengedaran data yang seimbang dari segi etnik sambil mendapatkan video berkualiti tinggi.
Memastikan setiap peserta menyumbang satu video serangan sebenar dan satu ulangan untuk mengekalkan integriti set data.
Mematuhi garis panduan ketat untuk FPS (≥ 26), peleraian (≥ 720p) dan ketepatan cap masa (+/- 0.5ms).
Bagaimana Kami Menyelesaikannya
Shaip menyediakan set data berstruktur dan berkualiti tinggi untuk memenuhi keperluan projek. Penyelesaiannya termasuk:
Susunan Set Data & Kawalan Kualiti
- 25,000 video dikumpulkan merentasi Fasa 4 untuk memastikan aliran data yang stabil dan berstruktur, mengelakkan kesesakan.
- Proses pengesahan yang ketat untuk memastikan pematuhan dengan FPS, resolusi dan ketepatan metadata. Setiap video menjalani beberapa pemeriksaan kualiti sebelum penerimaan akhir.
- Pengetegan metadata yang komprehensif bersama 12 sifat:
- ID/Nama Fail
- Jenis Serangan (Sebenar/Main Semula)
- ID Orang
- Resolusi Video
- Tempoh Video
- Etnik Subjek
- Jantina Subjek
- Sama ada Video Asli atau Dipalsukan
- Nama/Model Peranti
- Orang Bercakap atau Tidak
- Masa Mula Cap Masa
- Masa Tamat Cap Masa
- Taburan Kumpulan Etnik Seimbang: Set data telah disusun dengan teliti untuk mengekalkan perwakilan etnik yang seimbang. Taburan termasuk Hispanik (33%), Asia Selatan (21%), Kaukasia (20%), Afrika (15%) dan populasi Asia Timur & Timur Tengah (masing-masing terdiri sehingga 6%).
- Tiada entri pendua untuk mengekalkan keunikan set data dan mencegah berat sebelah dalam latihan AI.
- Pemilihan peserta yang pelbagai etnik untuk mencipta set data yang mencerminkan variasi pengguna dunia sebenar, meningkatkan kebolehsuaian model AI dan keadilan.
- Variasi peranti rakaman termasuk berbilang model telefon pintar, kamera dan keadaan pencahayaan untuk meningkatkan keteguhan model terhadap tetapan persekitaran yang berbeza.
Hasil
Set data video anti-spoofing berkualiti tinggi dan pelbagai yang disediakan oleh Shaip membolehkan pelanggan melatih model AI untuk membezakan dengan tepat antara video sebenar dan video palsu dalam pelbagai senario pengesahan biometrik. Set data menyumbang kepada:
Prestasi AI dipertingkatkan dalam mengesan serangan biometrik penipuan.
Memperkukuh keupayaan model untuk mengenali serangan ulangan merentas etnik, peranti dan keadaan persekitaran yang berbeza.
Set data berfungsi sebagai asas untuk peningkatan dan pengembangan model anti-penipuan masa hadapan.
Dataset Shaip telah memainkan peranan penting dalam meningkatkan model anti-penipuan dipacu AI kami. Kepelbagaian, kualiti dan metadata berstruktur menyediakan asas yang kukuh untuk meningkatkan pengesanan penipuan dalam sistem pengesahan biometrik.