Komputer visi adalah ilmu dan teknologi mesin yang melihat. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori untuk membangun sistem buatan yang memperoleh informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, dilihat dari beberapa kamera, atau multi-dimensi data dari scanner medis.
Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Contoh aplikasi visi komputer mencakup sistem untuk:
* Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
* Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
* Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan).
* Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis / topografis).
* Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).
Khas tugas komputer visi
Masing-masing dari area aplikasi yang dijelaskan di atas menggunakan visi komputer berbagai tugas; lebih atau kurang baik masalah pengukuran didefinisikan atau masalah pemrosesan, yang dapat dipecahkan dengan menggunakan berbagai metode. Beberapa contoh tugas-tugas khas visi komputer
Masalah klasik dalam visi komputer, mesin pengolahan gambar dan visi adalah untuk menentukan apakah atau tidak berisi data gambar objek tertentu, fitur, atau kegiatan. Tugas ini biasanya dapat diselesaikan kokoh dan tanpa upaya manusia, tetapi masih belum dipecahkan secara memuaskan dalam visi komputer untuk kasus umum: sewenang-wenang obyek dalam situasi yang sewenang-wenang. Metode yang ada untuk mengatasi masalah ini dapat di memecahkannya terbaik hanya untuk objek tertentu, seperti obyek geometris yang sederhana (misalnya, polyhedrons), wajah manusia, dicetak atau tulisan tangan karakter, atau kendaraan, dan dalam situasi tertentu, biasanya digambarkan dalam syarat-syarat yang terdefinisi dengan baik pencahayaan, latar belakang, dan pose dari objek relatif terhadap kamera.
Varietas yang berbeda dari masalah pengakuan dijelaskan dalam literatur:
* Objek pengakuan : satu atau beberapa telah ditetapkan sebelumnya atau belajar kelas benda-benda atau objek dapat dikenali, biasanya bersama-sama dengan mereka dalam posisi 2D atau 3D pose gambar dalam adegan.
* Identifikasi : Sebuah contoh individu objek diakui. Contoh: identifikasi orang tertentu wajah atau sidik jari, atau identifikasi kendaraan tertentu.
* Deteksi : data gambar dipindai untuk kondisi tertentu. Contoh: deteksi kemungkinan sel atau jaringan abnormal dalam gambar medis atau mendeteksi kendaraan di jalan tol otomatis sistem. Deteksi yang didasarkan pada relatif sederhana dan cepat perhitungan kadang-kadang digunakan untuk mencari daerah yang lebih kecil dari gambar menarik data yang dapat dianalisa lebih lanjut oleh lebih menuntut komputasi teknik untuk menghasilkan sebuah interpretasi yang benar.
Beberapa tugas khusus berdasarkan pengakuan ada, seperti:
* Konten gambar berbasis Pengambilan: menemukan semua gambar dalam rangkaian gambar yang lebih besar yang memiliki konten spesifik. Konten dapat ditetapkan dengan berbagai cara, misalnya dalam hal kesamaan relatif gambar target (beri aku semua gambar yang mirip dengan gambar X), atau dalam hal tingkat tinggi dengan kriteria pencarian yang diberikan sebagai input teks (beri aku semua gambar yang berisi banyak rumah, yang diambil selama musim dingin, dan tidak punya mobil di dalamnya).
* Pose estimasi: memperkirakan posisi atau orientasi obyek tertentu relatif terhadap kamera. Contoh aplikasi untuk teknik ini akan membantu lengan robot dalam mengambil objek dari ban berjalan di jalur perakitan situasi.
* Optical character recognition (OCR): mengidentifikasi karakter dalam gambar-gambar yang dicetak atau teks tulisan tangan, biasanya dengan tujuan untuk pengkodean teks dalam format yang lebih setuju untuk mengedit atau pengindeksan (misalnya ASCII).
Motion
Beberapa tugas yang berhubungan dengan gerak estimasi, di mana urutan gambar diproses untuk menghasilkan perkiraan kecepatan baik di setiap titik dalam gambar atau dalam adegan 3D. Contoh tugas-tugas seperti:
* Egomotion: menentukan gerakan kaku 3D kamera.
* Pelacakan: mengikuti gerakan objek (misalnya, kendaraan atau manusia).
Scene rekonstruksi
Diberikan satu atau (biasanya) lebih dari sebuah adegan gambar, atau video, adegan rekonstruksi bertujuan komputasi model 3D TKP. Dalam kasus yang paling sederhana model dapat menjadi serangkaian titik-titik 3D. Metode yang lebih canggih menghasilkan sebuah model permukaan 3D lengkap.
Gambar restorasi
Tujuan pemulihan citra adalah penghilangan bunyi (sensor suara, gambar blur, dll) dari gambar. Pendekatan yang paling sederhana untuk menghilangkan kebisingan adalah berbagai jenis penyaring seperti low-pass filter atau filter median. Metode yang lebih canggih mengasumsikan model bagaimana struktur gambar lokal tampak seperti, sebuah model yang membedakan mereka dari kebisingan. Dengan pertama-tama menganalisis data gambar dalam bentuk struktur gambar lokal, seperti garis atau tepi, dan kemudian mengendalikan penyaringan berdasarkan informasi lokal dari langkah analisis, tingkat yang lebih baik penghapusan kebisingan biasanya diperoleh dibandingkan dengan pendekatan sederhana.
Komputer visi sistem
Organisasi sistem visi komputer sangat tergantung aplikasi. Beberapa sistem aplikasi yang berdiri sendiri yang menyelesaikan pengukuran tertentu atau masalah deteksi, sementara yang lain merupakan sub-sistem yang desain yang lebih besar, misalnya, juga mengandung sub-sistem untuk mengontrol mekanik aktuator, perencanaan, informasi database, man - mesin interface, dll Implementasi sistem visi komputer juga tergantung pada fungsi adalah jika telah ditetapkan sebelumnya atau jika beberapa bagian dari itu dapat dipelajari atau diubah selama operasi. Namun ada, fungsi-fungsi khas yang terdapat di banyak komputer sistem penglihatan.
* Berkas akuisisi: Sebuah gambar digital yang dihasilkan oleh satu atau beberapa sensor gambar, yang, selain berbagai jenis kamera yang sensitif terhadap cahaya, termasuk sensor jarak, perangkat tomografi, radar, ultra-sonik kamera, dll Tergantung pada jenis sensor, data gambar yang dihasilkan adalah gambar 2D biasa, 3D volume, atau urutan gambar. Nilai pixel biasanya sesuai dengan intensitas cahaya dalam satu atau beberapa band spektral (warna abu-abu foto atau gambar), tetapi juga dapat terkait dengan berbagai tindakan fisik, seperti kedalaman, penyerapan atau reflectance dari sonik atau gelombang elektromagnetik, atau resonansi magnetik nuklir.
* Pre-processing: Sebelum metode visi komputer dapat diterapkan ke data gambar dalam rangka untuk mengambil beberapa potongan informasi yang spesifik, biasanya diperlukan untuk memproses data dalam rangka untuk memastikan bahwa memenuhi asumsi-asumsi tertentu yang ditunjukkan oleh metode.
* Fitur ekstraksi: fitur gambar pada berbagai tingkat kompleksitas yang diekstraksi dari data gambar.
Fitur lebih kompleks mungkin berhubungan dengan tekstur, bentuk atau gerakan.
* Deteksi / segmentasi: Pada titik tertentu dalam memproses keputusan dibuat tentang gambar mana yang poin atau wilayah dari gambar yang relevan untuk diproses lebih lanjut.
* Tingkat tinggi pengolahan: Pada tahap ini input kecil biasanya set data, misalnya satu set poin atau wilayah gambar yang dianggap mengandung objek tertentu.
Tidak ada komentar:
Posting Komentar