Visi Komputer

22+ Set Data Sumber Terbuka Yang Paling Dicari untuk Penglihatan Komputer

Algoritma AI hanya sebaik data yang anda suapkan.

Ia bukanlah satu kenyataan yang berani atau tidak lazim. AI mungkin kelihatan agak mengada-ada beberapa dekad yang lalu, tetapi Kecerdasan Buatan dan Pembelajaran Mesin telah berjalan jauh sejak itu.

Visi komputer membantu komputer memahami dan mentafsir label dan imej. Apabila anda melatih komputer anda menggunakan jenis imej yang betul, ia boleh memperoleh keupayaan untuk mengesan, memahami dan mengenal pasti pelbagai ciri muka, mengesan penyakit, memandu kenderaan autonomi dan juga menyelamatkan nyawa menggunakan pengimbasan organ berbilang dimensi.

Pasaran Penglihatan Komputer diramalkan akan mencapai $ 144.46 Bilion menjelang 2028 daripada $7.04 Billion yang sederhana pada 2020, berkembang pada CAGR sebanyak 45.64% antara 2021 dan 2028.

Beberapa kes penggunaan penglihatan komputer ialah:

  • Pengimejan perubatan
  • Kenderaan autonomi
  • Pengecaman muka dan objek
  • Pengenalan kecacatan
  • Pengesanan adegan

. set data imej anda memberi makan dan melatih pembelajaran Mesin dan tugas penglihatan komputer anda adalah penting untuk kejayaan projek AI anda. Set data yang berkualiti agak sukar diperoleh. Bergantung pada kerumitan projek anda, ia mungkin mengambil masa antara beberapa hari hingga beberapa minggu untuk mendapatkan set data yang boleh dipercayai dan berkaitan untuk tujuan penglihatan komputer.

Di sini, kami menyediakan anda dengan julat (dikategorikan untuk kemudahan anda) set data sumber terbuka yang boleh anda gunakan serta-merta.

Senarai Komprehensif Set Data Penglihatan Komputer

Umum:

  1. ImageNet (Pautan)

    ImageNet ialah set data yang digunakan secara meluas, dan ia disertakan dengan 1.2 juta imej yang mengagumkan yang dikategorikan kepada 1000 kategori. Set data ini disusun mengikut hierarki WorldNet dan dikategorikan kepada tiga bahagian - data latihan, label imej dan data pengesahan.

  2. Kinetik 700 (Pautan)

    Kinetics 700 ialah set data berkualiti tinggi yang besar dengan lebih daripada 650,000 klip 700 kelas tindakan manusia yang berbeza. Setiap tindakan kelas mempunyai kira-kira 700 klip video. Klip dalam set data mempunyai interaksi manusia-objek dan manusia-manusia, yang terbukti sangat membantu apabila mengenali tindakan manusia dalam video.

  3. CIFAR-10 (Pautan)

    CIFAR 10 ialah salah satu set data penglihatan komputer terbesar yang mempunyai 60000 32 x 32 imej warna yang mewakili sepuluh kelas berbeza. Setiap kelas mempunyai kira-kira 6000 imej yang digunakan untuk melatih algoritma penglihatan komputer dan pembelajaran mesin.

Pengecaman Muka:

pengecaman wajah

  1. Wajah Berlabel di Alam Liar (Pautan)

    Berlabel Faced in the Wild ialah set data besar yang mengandungi lebih daripada 13,230 imej hampir 5,750 orang yang dikesan daripada internet. Set data wajah ini direka bentuk untuk memudahkan anda mengkaji pengesanan muka tanpa kekangan.

  2. Muka Web CASIA (Pautan)

    Muka Web CASIA ialah set data yang direka dengan baik yang membantu pembelajaran mesin dan penyelidikan saintifik tentang pengecaman muka tanpa batasan. Dengan lebih daripada 494,000 imej hampir 10,000 identiti sebenar, ia sesuai untuk tugasan pengecaman muka dan pengesahan.

  3. Set Data UMD Faces (Pautan)

    UMD menghadapi set data beranotasi baik yang mengandungi dua bahagian - imej pegun dan bingkai video. Set data mempunyai lebih daripada 367,800 anotasi muka dan 3.7 juta bingkai video beranotasi subjek.

Pengecaman Tulisan Tangan:

  1. Pangkalan Data MNIST (Pautan)

    MNIST ialah pangkalan data yang mengandungi sampel digit tulisan tangan dari 0 hingga 9, dan ia mempunyai 60,000 dan 10,000 imej latihan dan ujian. Dikeluarkan pada tahun 1999, MNIST memudahkan untuk menguji sistem pemprosesan imej dalam Pembelajaran Dalam.

  2. Set Data Aksara Tiruan (Pautan)

    Set Data Aksara Tiruan ialah, seperti namanya, data yang dijana secara buatan yang menerangkan struktur bahasa Inggeris dalam sepuluh huruf besar. Ia datang dengan lebih daripada 6000 imej.

Mari bincangkan keperluan Data Latihan AI anda hari ini.

Pengesanan Objek:

  1. MS COCO (Pautan)

    MS COCO atau Common Objects in Context ialah set data pengesanan objek dan kapsyen.

    Ia mempunyai lebih daripada 328,000 imej dengan pengesanan titik kunci, pengesanan berbilang objek, kapsyen dan anotasi topeng segmentasi. Ia datang dengan 80 kategori objek dan lima kapsyen setiap imej.

  2. LSUN(Pautan)

    LSUN, singkatan kepada Large-Scene Understanding, mempunyai lebih daripada sejuta imej berlabel dalam 20 objek dan 10 kategori pemandangan. Sesetengah kategori mempunyai hampir 300,000 imej, dengan 300 imej khusus untuk pengesahan dan 1000 imej untuk data ujian.

  3. Objek Rumah(Pautan)

    Set data Objek Rumah mengandungi imej beranotasi objek rawak dari sekeliling rumah - dapur, ruang tamu dan bilik mandi. Set data ini juga mempunyai beberapa video beranotasi dan 398 foto tidak bernotasi yang direka untuk ujian.

Otomotif:

  1. Dataset Cityscape (Pautan)

    Cityscape ialah set data yang perlu dikunjungi apabila mencari pelbagai jujukan video yang dirakam daripada beberapa adegan jalanan yang dipetik. Imej-imej ini telah ditangkap dalam tempoh yang lama dan dalam cuaca dan keadaan cahaya yang berbeza. Anotasi adalah untuk 30 kelas imej yang dibahagikan kepada lapan kategori berbeza.

  2. Barkley Deep Drive (Pautan)

    Barkley DeepDrive direka khusus untuk latihan kenderaan autonomi, dan ia mempunyai lebih daripada 100 ribu jujukan video beranotasi. Ia adalah salah satu data latihan yang paling berguna untuk kenderaan autonomi mengikut perubahan jalan dan keadaan pemanduan.

  3. Mapillary (Pautan)

    Mapillary mempunyai lebih 750 juta pemandangan jalanan dan papan tanda lalu lintas di seluruh dunia, yang sangat berguna dalam melatih model persepsi visual dalam pembelajaran mesin dan algoritma AI. Ia membolehkan anda membangunkan kenderaan autonomi yang memenuhi pelbagai pencahayaan dan keadaan cuaca dan sudut pandangan.

Pengimejan Perubatan:

  1. Set Data Penyelidikan Terbuka Covid-19 (Pautan)

    Dataset asal ini mempunyai kira-kira 6500 pembahagian paru-paru poligon piksel tentang x-ray dada AP/PA. Selain itu, 517 imej x-ray pesakit Covid-19 dengan tag yang mengandungi nama, lokasi, butiran kemasukan, hasil dan banyak lagi tersedia.

  2. Pangkalan Data NIH 100,000 X-Ray Dada (Pautan)

    Pangkalan data NIH ialah salah satu set data yang tersedia secara terbuka yang paling luas yang mengandungi 100,000 imej x-ray dada dan data berkaitan yang berguna untuk komuniti saintifik dan penyelidikan. Ia juga mempunyai imej pesakit dengan keadaan paru-paru lanjut.

  3. Atlas Patologi Digital (Pautan)

    Atlas of Digital Pathology menawarkan beberapa imej tampalan histopatologi, lebih daripada 17,000 kesemuanya, daripada hampir 100 slaid beranotasi organ berbeza. Set data ini berguna dalam membangunkan penglihatan komputer dan perisian pengecaman corak.

Pengiktirafan Adegan:

Pengiktirafan adegan

  1. Pengiktirafan Pemandangan Dalaman (Pautan)

    Pengecaman Adegan Dalaman ialah set data yang sangat dikategorikan dengan hampir 15620 imej objek dan pemandangan dalam untuk digunakan dalam pembelajaran mesin dan latihan data. Ia datang dengan lebih 65 kategori, dan setiap kategori mempunyai sekurang-kurangnya 100 imej.

  2. xLihat (Pautan)

    Sebagai salah satu set data tersedia secara umum yang paling terkenal, xView mengandungi banyak imej overhed beranotasi daripada pelbagai adegan yang kompleks dan besar. Mempunyai kira-kira 60 kelas dan lebih daripada sejuta contoh objek, tujuan set data ini adalah untuk memberikan bantuan bencana yang lebih baik menggunakan imejan satelit.

  3. Tempat-tempat (Pautan)

    Places, set data yang disumbangkan oleh MIT, mempunyai lebih 1.8 juta imej daripada 365 kategori pemandangan yang berbeza. Terdapat kira-kira 50 imej dalam setiap kategori ini untuk pengesahan dan 900 imej untuk ujian. Mempelajari ciri pemandangan dalam untuk mewujudkan pengecaman pemandangan atau tugas pengecaman visual adalah mungkin.

Hiburan:

  1. Set Data IMDB WIKI (Pautan)

    IMDB – Wiki ialah salah satu pangkalan data awam yang paling popular bagi wajah yang dilabelkan dengan secukupnya dengan umur, jantina dan nama. Ia juga mempunyai kira-kira 20 ribu wajah selebriti dan 62 ribu daripada Wikipedia.

  2. Wajah Selebriti (Pautan)

    Celeb Faces ialah pangkalan data berskala besar dengan 200,000 imej beranotasi selebriti. Imej datang dengan bunyi latar belakang dan variasi pose, menjadikannya berharga untuk set ujian latihan dalam tugas penglihatan komputer. Ia amat berfaedah untuk mencapai ketepatan yang lebih tinggi dalam pengecaman muka, pengeditan, penyetempatan bahagian muka dan banyak lagi.

Kini anda mempunyai senarai besar set data imej sumber terbuka untuk memacu jentera kecerdasan buatan anda. Hasil model AI dan pembelajaran mesin anda bergantung terutamanya pada kualiti set data yang anda suap dan latih mereka. Jika anda mahu model AI anda mengeluarkan ramalan yang tepat, ia memerlukan set data berkualiti yang diagregatkan, ditag dan dilabelkan dengan sempurna. Untuk menguatkan kejayaan sistem penglihatan komputer anda, anda mesti menggunakan pangkalan data imej berkualiti yang berkaitan dengan visi projek anda. Jika anda sedang mencari lebih banyak set data sedemikian Tekan di sini

Kongsi sosial

Awak juga mungkin menyukai