definisi
Pengecaman Entiti Dinamakan (NER) ialah tugas NLP yang mengenal pasti dan mengelaskan entiti dalam teks, seperti orang, organisasi, lokasi, tarikh atau produk.
Tujuan
Tujuannya adalah untuk menstruktur teks tidak berstruktur dengan mengekstrak entiti utama. Ia menyokong carian, pengekstrakan maklumat dan pembinaan graf pengetahuan.
kepentingan
- Asas untuk mendapatkan maklumat dan saluran paip NLP.
- Ralat merebak ke aplikasi hiliran.
- NER khusus domain (cth, perubatan, undang-undang) memerlukan set data tersuai.
- Berkaitan dengan tugas seperti pemautan entiti dan pengekstrakan perhubungan.
Langkah-langkah untuk Copytrade
- Kumpul dan praproses teks.
- Anotasi set data dengan kategori entiti.
- Melatih model pada contoh berlabel (CRF, transformer).
- Ramalkan entiti dalam teks yang tidak kelihatan.
- Sahkan ketepatan dengan data ujian.
Contoh (Dunia Sebenar)
- spaCy: perpustakaan NLP sumber terbuka dengan NER terbina dalam.
- Stanford CoreNLP: menyediakan alat pengecaman entiti bernama.
- NLP Kewangan: mengekstrak nama syarikat daripada laporan.
Rujukan / Bacaan Lanjut
- Jurafsky & Martin. Pertuturan dan Pemprosesan Bahasa. Stanford.
- Lample et al. "Senibina Neural untuk Pengiktirafan Entiti Dinamakan." ACL.
- Model NER Transformers Muka Berpeluk.
- Apakah yang dinamakan Pengiktirafan Entiti (NER)