검색
색인
기계독해
출처 : 최신 ICT 시사상식 2021
인공지능(AI) 알고리즘이 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술.

기계독해를 이용하면 사람이 텍스트를 읽고 질문에 답변을 추론하듯이 인공지능(AI)이 문장 속에서 의미를 찾고 답변한다. 이때 추론은 불가능하지만 사람이 관련 정보를 찾기 위해 정보를 일일이 확인하지 않아도 답을 찾아낼 수 있다.

과거 기계독해는 알고리즘을 일일이 컴퓨터에 주입하는 방식으로 이뤄졌다. 알고리즘은 규칙 다발(묶음 또는 덩이)이다. 사람은 무의식적으로 하는 일을 기계는 할 수 없기 때문에 차례로 수행하도록 규칙 명령을 내려야 한다. 수많은 규칙을 일일이 입력하는 것은 매우 어렵고 효율이 떨어진다. 또한 언어는 본질적으로 앞뒤가 딱 맞아떨어지는 영역이 아니다. 문법을 벗어난 표현이 일상적으로 사용되기도 하고 문맥에 따라 다른 의미로 이해되는 경우도 있다. 이러한 이유로 알고리즘을 입력하는 데에 한계가 존재할 수밖에 없었다.

이를 해결하기 위하여 데이터베이스를 학습하는 인공지능(AI)이 등장하였다. 글자와 단어, 문장을 숫자 형태로 인식하여 독해하는 ‘인간의 방식’으로 접근한다.

컴퓨터는 글자 하나하나를 벡터로 인식하고 처리한다. 이것은 자연어 이해방식으로 글자를 기계적으로 분석하여 컴퓨터가 이해할 수 있는 형태로 만들거나 컴퓨터가 이해하도록 만들어진 형태를 다시 인간이 이해할 수 있는 언어로 표현한다.

기계독해는 딥러닝 기술과 접목한 솔루션으로 고도화한다. 글자와 이미지를 인식·분석하는 컴퓨터 시각(computer vision), 광 문자 인식(OCR) 기술 고도화와 병행한다.

기계독해의 최종단계는 질의응답 기술을 기반으로 전문가 수준의 의사 결정을 지원하는 것이다. 여기에 딥러닝, 추론 등의 인공지능 기술이 활용될 예정이다.




딥러닝 기술, 컴퓨터 시각, 광문자 인식 기술 등으로 더욱 고도화되고 있는 기계독해 / 출처=게티이미지뱅크