검색
색인
메타데이터, metadata
다른 데이터를 정의하고 기술하는 데이터 또는 다양한 형식의 다른 데이터의 내용 또는 구조를 설명하는 데이터.

메타데이터는 “데이터에 관한 데이터(data about data)” 또는 좀 더 구체적으로는 “데이터에 대한 구조화된 데이터”. “전자 자원을 기술(description)하는 데 사용되는 데이터 요소”라고도 설명한다(Lui, 2007). ISO/IEC 11179(Information Technology - Metadata registries (MDR)) 표준에 따르면 메타데이터는 데이터 그 자체는 아니지만, “다른 데이터를 정의하고 기술하는 데이터(data that defines and describes other data)”라고 정의한다.

메타데이터의 주요 기능은 정보를 찾고 발견하는 데 도움을 주는 것이다. 메타데이터는 대표적으로 설명 메타데이터와 구조화 메타데이터 두 가지로 나뉜다. 설명 메타데이터는 대상 정보 자원이 무엇인지 이해할 수 있도록 요약하고, 구조화 메타데이터는 대상 정보 자원을 표현하는 형식과 방법을 규정한다.

대표적인 설명 메타데이터의 사례는 도서관의 도서 목록(catalog)이다. 컴퓨터가 없던 시대에 도서관에서는 목록 카드를 비치하여 이용자가 원하는 책을 찾는 데 도움을 주었다. 이 목록 카드에는 각 도서의 제목, 저자명, 발행처, 도서 위치 정보가 포함된 서가 번호 등 도서를 식별하고 접근할 수 있는 최소한의 데이터 요소(data element)와 값(value)이 표준화된 형식으로 기록되어 있었다. 이용자는 이 목록 카드를 가지고 원하는 책을 쉽게 찾을 수 있었다. 컴퓨터가 보급되고 확산되면서 이 목록 카드의 데이터 요소와 값은 메타데이터의 형태로 디지털화 되었다. 도서뿐만 아니라 공산품과 전자 거래 품목도 상품을 설명하는 메타데이터를 제시하고 있다.

구조화 메타데이터는 대상 정보 자원을 구조화하는 메타데이터이다. 구조화 메타데이터는 대상 정보의 객체 클래스(object class)를 설명하는 속성(attribute)을 선택하고, 각 데이터 요소에 상응하는 값의 형식과 범위를 규정한다. 예를 들어, 객체 클래스가 사람인 경우에는 이름, 성별, 신장, 체중과 같은 속성을 선택할 수 있다. 이름은 한글로 10자 이내로 하며, 성별은 한자리 성별 코드(관련 표준 참조)를 기준으로 하고, 신장과 체중은 미터법을 따르도록 한다는 형식과 범위를 정하게 된다.

가장 대표적인 메타데이터는 더블린 코어(DC, Dublin Core)이다. 더블린 코어는 웹 자원의 기술을 위해 1995년에 제안된 15개의 데이터 요소로 구성된다. 또한, 2003년에 ISO 표준(관련 표준 참조)으로도 제정되어 모든 메타데이터의 근간이 되고 있다. 더블린 코어 메타데이터는 최소한의 기본 요소만을 제시하고 있어서 특수한 정보 객체에 적용하는 데에는 한계가 있다. 그래서 각 분야에서는 더블린 코어를 수정 및 확장하여 메타데이터를 만들어 사용하고 있다. 분야별 메타데이터로는 도서관 분야의 MARC21(MAchine Readable Catalog 21), MODS(Metadata Object Description Schema), ONIX(ONline Information eXchange), CERIF(Common European Research Information Format) 등이 있고, 상품 목록을 위한 GDAS(Global Data Alignment System), 교육 자료를 기술하기 위한 LOM(Learning Object Metadata), 생물 다양성 정보 관리를 위한 DwC(Darwin Core) 등이 있다.
이뿐만 아니라 메타데이터는 빅데이터, 인공지능, 사물인터넷(IoT) 등의 신 산업에서도 널리 활용되고 있다.

* 관련 표준 등
- Lui, J. (2007). Metadata and Its Applications in the Digital Library : Approaches and Practices. London: Library Unlimited.
- ISO/IEC 11179, Information Technology - Metadata registries (MDR)
- ISO/IEC 5218:2004 Information Technology — Codes for the representation of human sexes
- ISO 15836 Information and documentation — The Dublin Core Metadata Set