검색
색인
컴퓨터 시각, -視覺, Computer Vision, CV
사람이나 동물 시각 체계의 기능을 컴퓨터로 구현하는 것.
주로 사진이나 동영상 같은 2차원 이미지에서 정보를 추출하는 컴퓨터 기술을 연구한다.

사람의 시각 체계는 망막에 맺힌 2차원 이미지에서 3차원 모델이나 구조를 추론하고, 물체를 탐지하거나 이미지 내부의 영역을 구분하는 등 눈으로 보는 것에서 다양한 정보를 추출하는 역할을 한다. 컴퓨터 시각은 이러한 기능을 컴퓨터로 구현하는 것을 가리키며 주로 디지털카메라나 캠코더 등의 이미지 센서에 맺힌 2차원 이미지를 처리한다. 로봇이나 자율 주행 자동차와 같은 지능형 에이전트(intelligent agent) 구현에 꼭 필요하며, 위성사진 분석과 같은 작업에 활용하기도 한다.
초창기 인공지능 연구자들은 시각 체계 구현이 증명이나 추론과 같은 상위 수준의 지적인 기능을 컴퓨터로 구현하는 것보다 더 쉬울 것이라고 생각하였다. 그러나 1960년대에 시작된 컴퓨터 시각 연구는 매우 느리게 발전하였다. 1980년대에 이르러서야 사진에서 물체의 윤곽선을 탐지하는 실용적인 기술들이 개발되었으며, 1990년대에는 물체 인식 기술과 이미지 분할 기법 등이 활발하게 연구되었다. 2000년대에 들어서 인터넷의 발달에 따라 대규모 데이터의 활용이 가능해지면서 기계학습 기반 컴퓨터 시각 기술의 성능이 비약적으로 발전하였으며 자동차 번호판 인식 등의 기술이 실용화되었다.
2010년대에 확산된 심층기계학습(deep learning) 기반의 컴퓨터 시각 기술은 잡음(noise)이 없는 사진에서는 수천 종류의 사물을 인식하는 등 한정된 상황에서 물체를 인식할 때는 사람과 유사하거나 더 뛰어난 정확도를 보였다. 그러나 잡음에 취약하고 물체의 상대적인 크기를 구분하지 못하는 등 사람의 시각 체계 성능에는 미치지 못한다.
컴퓨터 시각 기술은 자동차 번호판 인식, 디지털카메라얼굴 인식, 공장에서의 제품 검사 등에 활용한다.