15+ Sumber Dataset Open Source untuk Visi Komputer – Blog Teknokrat
15+ Sumber Dataset Open Source untuk Visi Komputer

15+ Sumber Dataset Open Source untuk Visi Komputer

 237 total views,  2 views today

Mencari Sumber Data Berkualitas untuk Visi Komputer

Data latih berkualitas dalam visi komputer seringkali sulit didapatkan. Proses pencarian dataset yang cocok bisa memakan waktu berhari-hari bahkan berminggu-minggu.

CIFAR-10 & CIFAR-100

CIFAR-10 dan CIFAR-100 adalah subset dari 80 juta gambar kecil yang dikumpulkan oleh Alex Krizhevsky, Vinod Nair, dan Geoffrey Hinton. CIFAR-10 berisi 60,000 gambar berwarna dengan ukuran 32×32 piksel dan 10 kelas, sedangkan CIFAR-100 terdiri dari 100 kelas dengan 60 gambar setiap kelas. Dataset ini menjadi sumber penting untuk melatih model dalam klasifikasi objek.

Baca Juga:7 Jurusan Perguruan Tinggi Jalur Cepat yang Menghasilkan Peluang Kerja Cepat

ImageNet

ImageNet adalah database terkenal dengan lebih dari 14 juta gambar anotasi yang diatur menurut hierarki WordNet. Dengan lebih dari 1 juta gambar pelatihan, 50,000 gambar validasi, dan 100,000 gambar uji, ImageNet mencakup 1000 kelas objek, menjadikannya sumber data besar untuk berbagai tugas visi komputer.

Kinetics-700

Kinetics-700 berisi koleksi video dengan 400/600/700 kelas aksi manusia, dari memainkan instrumen hingga interaksi manusia-objek. Setiap kelas memiliki video beranotasi manusia selama sekitar 10 detik. Dataset ini memberikan representasi yang luas dalam memahami berbagai tindakan manusia.

MNIST

MNIST, berisi gambar angka tulisan tangan, telah menjadi dataset utama untuk melatih sistem pemrosesan gambar sejak dirilis pada tahun 1999. Dengan 60,000 data latih dan 10,000 data uji, MNIST ideal untuk belajar teknik pengenalan pola pada data dunia nyata.

LSUN

LSUN memiliki hampir 1 juta gambar dengan 10 kategori pemandangan dan 20 kategori objek. Dengan jumlah gambar yang besar untuk setiap kategori, LSUN menjadi sumber data yang kaya untuk pemahaman objek dan pemandangan.

IMDB-Wiki

Dataset IMDB-Wiki berisi lebih dari 500,000 gambar wajah selebriti dari IMDb dan Wikipedia. Dataset ini memberikan informasi tentang jenis kelamin, usia, dan nama pada setiap gambar, menjadi sumber data untuk analisis atribut wajah.

MS COCO

MS COCO terdiri dari 328,000 gambar dengan anotasi untuk berbagai tugas seperti deteksi objek, segmentasi, dan estimasi pose manusia. Dataset ini menjadi penting untuk pemahaman konteks objek dalam berbagai situasi.

Labeled Faces in the Wild

Labeled Faces in the Wild merupakan kumpulan besar foto wajah dengan 13,000 gambar yang diberi label nama orang. Dataset ini penting dalam tugas pengenalan wajah.

Cityscapes

Cityscapes adalah kumpulan data video stereo yang merekam pemandangan jalanan dari 50 kota berbeda. Dengan anotasi semantik dan piksel padat untuk berbagai kategori, dataset ini menjadi penting untuk pemahaman tentang lingkungan kota.

LabelMe-12-50k

Dataset LabelMe-12-50k berisi 50,000 gambar dengan 12 kelas objek. Dengan fokus pada objek seperti mobil, orang, dan pohon, dataset ini memberikan variasi dalam tugas klasifikasi.

Places & Places2

Places dan Places2 adalah dataset yang terdiri dari jutaan gambar dengan label kategori pemandangan. Dengan variasi yang luas dalam kondisi cahaya dan cuaca, keduanya menjadi sumber penting untuk pengenalan aksi dan fitur adegan.

VisualGenome

VisualGenome berisi lebih dari 100,000 gambar dengan anotasi objek, atribut, dan hubungan di antara mereka. Dataset ini memberikan pemahaman mendalam tentang hubungan objek dalam suatu gambar.

Stanford Dogs & Dataset Kucing

Stanford Dogs dan Dataset Kucing adalah kumpulan data khusus untuk pemahaman tentang ras anjing dan fitur wajah kucing. Keduanya menjadi sumber penting untuk klasifikasi dan analisis fitur wajah hewan.

CelebFaces

CelebFaces Attributes Dataset (CelebA) berisi lebih dari 200,000 gambar selebriti dengan anotasi atribut wajah. Dataset ini berguna untuk berbagai tugas, termasuk deteksi wajah dan pengenalan atribut wajah.

Face Mask Detection & Dataset Api dan Asap & Dataset FloodNet

Dataset-dataset ini memiliki fokus pada deteksi masker wajah, pengenalan api dan asap, serta pengenalan kerusakan akibat badai. Masing-masing memberikan informasi spesifik dalam tugas-tugas deteksi dan estimasi dalam situasi yang berbeda.

Baca Juga:Strategi Terbaru untuk Menyembunyikan Chat WhatsApp Secara Permanen

Penutup

Inilah beberapa dataset open source terkemuka yang dapat digunakan dalam berbagai tugas visi komputer. Semoga sumber data ini memberikan manfaat dalam pengembangan dan pelatihan model-model visi komputer yang lebih baik.

Penulis:Riska Safitri

Kampus swasta terbaik:Teknokrat

2 thoughts on “15+ Sumber Dataset Open Source untuk Visi Komputer

  1. The compilation of “15+ Open Source Datasets for Computer Vision” is a goldmine for enthusiasts and professionals in the field. Access to diverse and high-quality datasets is essential for advancing computer vision research, and this resource is a game-changer.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Solverwp- WordPress Theme and Plugin