검색
색인
데이터 마이닝, data mining
대용량 데이터에서 의미 있는 통계적 패턴이나 규칙, 관계를 찾아내 분석하여 유용하고 활용할 수 있는 정보를 추출하는 기술.

지하에 묻힌 광물을 찾아낸다는 뜻의 마이닝(mining)은 탄광에서 석탄을 캐거나 대륙붕에서 원유를 채굴하는 작업처럼 데이터에서 숨겨진 가치를 찾아낸다는 동일한 특징 때문에 데이터 분석 용어로 사용한다.
데이터 마이닝(data mining)은 학문적으로는 통계, 전산, 경영 등 다양한 데이터 분석 관련 학문의 융합으로 탄생한 융합 학문이다. 기술적으로 데이터 마이닝에는 대용량 데이터를 효율적으로 저장하고 및 관리하는 기법인 데이터베이스, 데이터 창고(DW: Data Warehouse), 데이터 마트(data mart) 등과 방대한 규모의 데이터를 분석하는 분산 처리 기술 등이 사용된다. 데이터 마이닝 분석 방법으로는 목표 변수에 따라 진행되는 정형 데이터 마이닝 기법과 비정형 데이터 마이닝 기법이 있다.
데이터 마이닝(data mining)은 데이터 처리를 위한 다양한 분야에 적용할 수 있으며, 마케팅, 생산, 금융, 미디어, 순수 과학 등 다양한 산업 분야에 활용할 수 있다.