Algoritma AI hanya sebaik data yang anda suapkan.
Ia bukanlah satu kenyataan yang berani atau tidak lazim. AI mungkin kelihatan agak mengada-ada beberapa dekad yang lalu, tetapi Kecerdasan Buatan dan Pembelajaran Mesin telah berjalan jauh sejak itu.
Penglihatan komputer membantu komputer memahami dan mentafsir label dan imej. Apabila anda melatih komputer anda menggunakan jenis set data imej yang betul, ia boleh memperoleh keupayaan untuk mengesan, memahami dan mengenal pasti pelbagai ciri muka, mengesan penyakit, memandu kenderaan autonomi dan juga menyelamatkan nyawa menggunakan pengimbasan organ berbilang dimensi.
Pasaran Penglihatan Komputer diramalkan akan mencapai $ 144.46 bilion pada tahun 2028 dari yang sederhana $ 7.04 Bilion pada tahun 2020, berkembang pada a CAGR sebanyak 45.64% antara 2021 dan 2028.
Set data imej yang anda suap dan latih tugasan Pembelajaran Mesin dan penglihatan komputer anda adalah penting untuk kejayaan projek AI anda. Set data yang berkualiti agak sukar diperoleh. Menggunakan koleksi imej yang pelbagai adalah penting untuk memastikan latihan model yang mantap dan untuk mencerminkan kerumitan dunia sebenar dengan lebih baik.
Bergantung pada kerumitan projek anda, ia mungkin mengambil masa antara beberapa hari hingga beberapa minggu untuk mendapatkan set data yang boleh dipercayai dan berkaitan untuk tujuan penglihatan komputer. Pelbagai set data diperlukan untuk merangkumi pelbagai tugas penglihatan komputer dan senario dunia sebenar. Penyelidik sering mencari set data yang besar untuk tujuan penyelidikan untuk memastikan penilaian model yang komprehensif dan untuk menyokong pelbagai aplikasi.
Di sini, kami menyediakan anda dengan julat (dikategorikan untuk kemudahan anda) set data imej sumber terbuka yang boleh anda gunakan serta-merta.
Tugasan Set Data Imej: Pengelasan, Pembahagian, Pengesanan dan Banyak Lagi
Set data imej adalah tulang belakang penglihatan komputer moden, menggerakkan pelbagai tugas yang membolehkan mesin mentafsir dan memahami maklumat visual. Sama ada anda sedang membina model untuk kenderaan autonomi, membangunkan teknologi pengecaman muka atau mengusahakan analisis imej perubatan, set data imej yang betul ialah alat penting untuk berjaya.
Klasifikasi imej adalah salah satu tugas penglihatan komputer yang paling asas. Dalam proses ini, model belajar untuk memberikan label kepada keseluruhan imej berdasarkan kandungannya. Contohnya, set data klasifikasi imej mungkin membantu model membezakan antara imej kucing dan anjing atau mengenal pasti jenis tumbuhan yang berbeza. Tugas ini penting untuk aplikasi seperti pengetegan foto automatik, diagnosis penyakit daripada imej perubatan dan penanda aras pengkategorian pemandangan.
Pengesanan objek mengambil langkah lebih jauh dengan bukan sahaja mengenal pasti kehadiran objek dalam imej tetapi juga menentukan lokasinya menggunakan kotak sempadan. Set data untuk pengesanan objek, seperti yang mengandungi imej beranotasi dengan kotak sempadan, adalah penting untuk aplikasi seperti pengesanan pejalan kaki dalam kenderaan autonomi, pengawasan keselamatan dan analitik runcit. Pengesanan objek juga merupakan komponen utama dalam membangunkan algoritma penglihatan komputer yang mantap untuk senario dunia sebenar.
Segmentasi semantik melibatkan pengelasan setiap piksel dalam imej ke dalam kategori tertentu, memberikan pemahaman terperinci tentang pemandangan. Pembahagian trimap peringkat piksel ini amat penting dalam tugas seperti pengimejan perubatan, di mana persempadanan organ atau tumor yang tepat diperlukan, dan dalam persekitaran bandar untuk pemanduan autonomi, yang membezakan antara jalan raya, kaki lima dan kenderaan adalah kritikal.
Di sebalik tugas teras ini, set data imej juga menyokong pembahagian contoh (membezakan antara objek individu kelas yang sama), kapsyen imej (menjana teks deskriptif untuk imej) dan pengecaman muka (mengenal pasti atau mengesahkan wajah manusia dalam imej). Setiap tugas penglihatan komputer ini bergantung pada imej beranotasi berkualiti tinggi untuk melatih dan mengesahkan model pembelajaran mesin.
Dengan memanfaatkan set data imej yang pelbagai dan beranotasi dengan baik, saintis data dan pengamal pembelajaran mesin boleh menangani pelbagai cabaran penglihatan komputer, daripada tugas pengecaman dan pengelasan imej kepada masalah segmentasi dan pengesanan yang kompleks. Set data yang betul bukan sahaja mempercepatkan penyelidikan dan pembangunan tetapi juga memastikan sistem penglihatan komputer berfungsi dengan tepat dalam aplikasi dunia sebenar.
Senarai Komprehensif Set Data Imej untuk Melatih Model Penglihatan Komputer Anda
Umum:
-
ImageNet
ImageNet ialah set data yang digunakan secara meluas, dan ia disertakan dengan 1.2 juta imej yang mengagumkan yang dikategorikan kepada 1000 kategori. Set data ini disusun mengikut hierarki WorldNet dan dikategorikan kepada tiga bahagian - data latihan, label imej dan data pengesahan.
-
Kinetik 700
Kinetics 700 ialah set data berkualiti tinggi yang besar dengan lebih daripada 650,000 klip 700 kelas tindakan manusia yang berbeza. Setiap tindakan kelas mempunyai kira-kira 700 klip video. Klip dalam set data mempunyai interaksi manusia-objek dan manusia-manusia, yang terbukti sangat membantu apabila mengenali tindakan manusia dalam video.
-
CIFAR-10
CIFAR 10 ialah salah satu set data penglihatan komputer terbesar yang mempunyai 60000 32 x 32 imej warna yang mewakili sepuluh kelas berbeza. Setiap kelas mempunyai kira-kira 6000 imej yang digunakan untuk melatih algoritma penglihatan komputer dan pembelajaran mesin.
-
Set Data Imej Haiwan Kesayangan Oxford-IIIT
Set data imej haiwan peliharaan terdiri daripada 37 kategori dengan 200 imej setiap kelas. Imej ini berbeza dalam skala, pose dan pencahayaan, serta disertakan dengan anotasi untuk baka, ROI kepala dan pembahagian trimap peringkat piksel.
-
Gambar Terbuka Google
Dengan 9 juta URL yang mengagumkan, ini adalah salah satu set data imej terbesar dalam senarai, yang mengandungi berjuta-juta imej yang dilabelkan merentas 6,000 kategori.
-
Imej Tumbuhan
Kompilasi ini termasuk beberapa set data imej yang menampilkan 1 juta imej tumbuhan yang mengagumkan, meliputi kira-kira 11 spesies.
-
LSUN
LSUN ialah set data imej berskala besar dengan berjuta-juta imej berlabel dalam pelbagai kategori pemandangan dan objek. Set data termasuk set ujian khusus untuk penilaian model.
Pengecaman Muka:

-
Wajah Berlabel di Alam Liar
Berlabel Faced in the Wild ialah set data besar yang mengandungi lebih daripada 13,230 imej hampir 5,750 orang yang dikesan daripada internet. Set data wajah ini direka bentuk untuk memudahkan anda mengkaji pengesanan muka tanpa kekangan.
-
Muka Web CASIA
Muka Web CASIA ialah set data yang direka dengan baik yang membantu pembelajaran mesin dan penyelidikan saintifik tentang pengecaman muka tanpa batasan. Dengan lebih daripada 494,000 imej hampir 10,000 identiti sebenar, ia sesuai untuk tugasan pengecaman muka dan pengesahan.
-
Set Data UMD Faces
UMD menghadapi set data beranotasi baik yang mengandungi dua bahagian - imej pegun dan bingkai video. Set data mempunyai lebih daripada 367,800 anotasi muka dan 3.7 juta bingkai video beranotasi subjek.
-
Pengesanan Topeng Muka
Set data ini termasuk 853 imej yang dikategorikan kepada tiga kelas: "dengan topeng," "tanpa topeng" dan "topeng dipakai dengan tidak betul," bersama-sama dengan kotak sempadannya dalam format PASCAL VOC.
-
FERET
FERET (Pangkalan Data Teknologi Pengecaman Muka) ialah set data imej komprehensif yang mengandungi lebih 14,000 imej beranotasi wajah manusia.
Pengecaman Tulisan Tangan:
-
Pangkalan Data MNIST
MNIST ialah pangkalan data yang mengandungi sampel digit tulisan tangan dari 0 hingga 9, dan ia mempunyai 60,000 dan 10,000 imej latihan dan ujian. Dikeluarkan pada tahun 1999, MNIST memudahkan untuk menguji sistem pemprosesan imej dalam Pembelajaran Dalam.
-
Set Data Aksara Tiruan
Set Data Aksara Tiruan ialah, seperti namanya, data yang dijana secara buatan yang menerangkan struktur bahasa Inggeris dalam sepuluh huruf besar. Ia datang dengan lebih daripada 6000 imej.
Pengesanan Objek:
MS COCO
MS COCO atau Common Objects in Context ialah set data pengesanan objek dan kapsyen.
Ia mempunyai lebih daripada 328,000 imej dengan pengesanan titik kunci, pengesanan berbilang objek, kapsyen dan anotasi topeng segmentasi. Ia datang dengan 80 kategori objek dan lima kapsyen setiap imej.
LSUN
LSUN, singkatan kepada Large-Scene Understanding, mempunyai lebih daripada sejuta imej berlabel dalam 20 objek dan 10 kategori pemandangan. Sesetengah kategori mempunyai hampir 300,000 imej, dengan 300 imej khusus untuk pengesahan dan 1000 imej untuk data ujian.
Objek Rumah
Set data Objek Rumah mengandungi imej beranotasi objek rawak dari sekeliling rumah - dapur, ruang tamu dan bilik mandi. Set data ini juga mempunyai beberapa video beranotasi dan 398 foto tidak bernotasi yang direka untuk ujian.
Genom Visual
Genom Visual ialah pangkalan pengetahuan visual yang komprehensif dengan lebih 108,000 imej kapsyen. Ia menyediakan anotasi yang luas untuk objek, atribut dan perhubungan, menjadikannya berharga untuk pengecaman objek, kapsyen imej dan tugasan pembelajaran pelbagai mod.
Otomotif:
Dataset Cityscape
Cityscape ialah set data yang perlu dikunjungi apabila mencari pelbagai jujukan video yang dirakam daripada beberapa adegan jalanan yang dipetik. Imej-imej ini telah ditangkap dalam tempoh yang lama dan dalam cuaca dan keadaan cahaya yang berbeza. Anotasi adalah untuk 30 kelas imej yang dibahagikan kepada lapan kategori berbeza.
Barkley Deep Drive
Barkley DeepDrive direka khusus untuk latihan kenderaan autonomi, dan ia mempunyai lebih daripada 100 ribu jujukan video beranotasi. Ia adalah salah satu data latihan yang paling berguna untuk kenderaan autonomi mengikut perubahan jalan dan keadaan pemanduan.
Mapillary
Mapillary mempunyai lebih 750 juta pemandangan jalanan dan papan tanda lalu lintas di seluruh dunia, yang sangat berguna dalam melatih model persepsi visual dalam pembelajaran mesin dan algoritma AI. Ia membolehkan anda membangunkan kenderaan autonomi yang memenuhi pelbagai pencahayaan dan keadaan cuaca dan sudut pandangan.
Pengimejan Perubatan:
Set Data Penyelidikan Terbuka Covid-19
Dataset asal ini mempunyai kira-kira 6500 pembahagian paru-paru poligon piksel tentang x-ray dada AP/PA. Selain itu, 517 imej x-ray pesakit Covid-19 dengan tag yang mengandungi nama, lokasi, butiran kemasukan, hasil dan banyak lagi tersedia.
Pangkalan Data NIH 100,000 X-Ray Dada
Pangkalan data NIH ialah salah satu set data yang tersedia secara terbuka yang paling luas yang mengandungi 100,000 imej x-ray dada dan data berkaitan yang berguna untuk komuniti saintifik dan penyelidikan. Ia juga mempunyai imej pesakit dengan keadaan paru-paru lanjut.
Atlas Patologi Digital
Atlas of Digital Pathology menawarkan beberapa imej tampalan histopatologi, lebih daripada 17,000 kesemuanya, daripada hampir 100 slaid beranotasi organ berbeza. Set data ini berguna dalam membangunkan penglihatan komputer dan perisian pengecaman corak.
Pengiktirafan Adegan:

Pengiktirafan Pemandangan Dalaman
Pengecaman Adegan Dalaman ialah set data yang sangat dikategorikan dengan hampir 15620 imej objek dan pemandangan dalam untuk digunakan dalam pembelajaran mesin dan latihan data. Ia datang dengan lebih 65 kategori, dan setiap kategori mempunyai sekurang-kurangnya 100 imej.
xLihat
Sebagai salah satu set data tersedia secara umum yang paling terkenal, xView mengandungi banyak imej overhed beranotasi daripada pelbagai adegan yang kompleks dan besar. Mempunyai kira-kira 60 kelas dan lebih daripada sejuta contoh objek, tujuan set data ini adalah untuk memberikan bantuan bencana yang lebih baik menggunakan imejan satelit.
Tempat-tempat
Places, set data yang disumbangkan oleh MIT, mempunyai lebih 1.8 juta imej daripada 365 kategori pemandangan yang berbeza. Terdapat kira-kira 50 imej dalam setiap kategori ini untuk pengesahan dan 900 imej untuk ujian. Mempelajari ciri pemandangan dalam untuk mewujudkan pengecaman pemandangan atau tugas pengecaman visual adalah mungkin.
Pangkalan Data SUN
Pangkalan data SUN ialah penanda aras pengkategorian pemandangan komprehensif yang digunakan secara meluas dalam penglihatan komputer. Ia mengandungi beribu-ribu imej yang merangkumi rangkaian luas persekitaran dalaman dan luaran, dengan anotasi terperinci untuk setiap adegan. Pangkalan data SUN diiktiraf untuk liputan adegan yang berbeza dan berfungsi sebagai rujukan standard untuk menilai algoritma pemahaman adegan.
Hiburan:
Set Data IMDB WIKI
IMDB – Wiki ialah salah satu pangkalan data awam yang paling popular bagi wajah yang dilabelkan dengan secukupnya dengan umur, jantina dan nama. Ia juga mempunyai kira-kira 20 ribu wajah selebriti dan 62 ribu daripada Wikipedia.
Wajah Selebriti
Celeb Faces ialah pangkalan data berskala besar dengan 200,000 imej beranotasi selebriti. Imej datang dengan bunyi latar belakang dan variasi pose, menjadikannya berharga untuk set ujian latihan dalam tugas penglihatan komputer. Ia amat berfaedah untuk mencapai ketepatan yang lebih tinggi dalam pengecaman muka, pengeditan, penyetempatan bahagian muka dan banyak lagi.
Set Data YouTube-8M
YouTube-8M ialah set data video berlabel berskala besar yang mengandungi berjuta-juta ID video YouTube dengan anotasi entiti visual yang dihasilkan oleh mesin berkualiti tinggi. Set data ini digunakan secara meluas untuk pemahaman video berskala besar dan melatih algoritma penglihatan, kerana ia memautkan kandungan video kepada metadata melalui ID video YouTube, membolehkan pengumpulan dan anotasi data video boleh skala.
Kini anda mempunyai senarai besar set data imej sumber terbuka untuk memacu jentera kecerdasan buatan anda. Hasil model AI dan pembelajaran mesin anda bergantung terutamanya pada kualiti set data yang anda suap dan latih mereka. Jika anda mahu model AI anda mengeluarkan ramalan yang tepat, ia memerlukan set data berkualiti yang diagregatkan, ditag dan dilabelkan dengan sempurna. Bekerja dengan set data ini ialah cara terbaik untuk membangunkan dan meningkatkan kemahiran pembelajaran mesin anda melalui projek praktikal dunia sebenar. Untuk menguatkan kejayaan sistem penglihatan komputer anda, anda mesti menggunakan pangkalan data imej berkualiti yang berkaitan dengan visi projek anda.


