definisi
Data sintetik ialah maklumat yang dijana secara buatan yang meniru data dunia sebenar. Ia boleh dibuat menggunakan simulasi, GAN, atau kaedah generatif lain.
Tujuan
Tujuannya adalah untuk menambah atau menggantikan data sebenar apabila ia adalah terhad, sensitif atau mahal untuk dikumpulkan.
kepentingan
- Melindungi privasi dengan mengurangkan pergantungan pada data peribadi.
- Mendayakan latihan untuk kes jarang atau edge.
- Mungkin kekurangan kerumitan penuh data dunia sebenar.
- Semakin banyak digunakan dalam AI kritikal keselamatan.
Langkah-langkah untuk Copytrade
- Tentukan ciri data untuk ditiru.
- Gunakan simulasi atau model generatif untuk mencipta data.
- Sahkan data sintetik terhadap pengedaran sebenar.
- Gunakan data sintetik dalam saluran paip latihan.
- Pantau jurang dalam realisme.
Contoh (Dunia Sebenar)
- Waymo: menggunakan adegan pemanduan sintetik untuk latihan autonomi.
- NVIDIA Omniverse: menjana data 3D sintetik untuk robotik.
- Penjagaan kesihatan: data pesakit sintetik untuk penyelidikan.
Rujukan / Bacaan Lanjut
- Penerbitan Khas NIST mengenai Data Sintetik.
- Goncalves et al. "Penjanaan dan Penilaian Data Sintetik." Tinjauan Pengkomputeran ACM.
- Bilik Kebal Data Sintetik (MIT).
- Apakah Data Sintetik dalam AI