검색
색인
디지털 아카이브, Digital Archive
출처 : 최신 ICT 시사상식 2021
문화유산 및 아날로그 정보를 디지털화해 모아 놓은 시스템 또는 디지털상에 조성된 데이터 저장고.

디지털 아카이브(digital archive)는 시간 경과에 의해 질이 떨어지거나 소실될 우려가 있는 데이터를 장기 보존하려는 데 목적이 있다.

물리 형태의 기록물은 안정적인 보존이 가장 중요하다. 전산화된 자료라 해도 원본 자료는 고유성을 띠며, 손실 시 대체가 불가능하다. 일반적인 사유로는 열람이 금지되는 편이다. 반면 디지털 아카이브는 데이터 보존 못지않게 접근 및 사용에도 중점을 둔다. 따라서 검색과 활용이 쉽게 이루어지고, 사용자 목적에 맞게 원본을 다시 변형할 수 있다. 특히 공공 아카이브는 여러 사람의 참여로 만들어지기 때문에 내용이 지속적으로 확장되며, 강한 개방성과 공공성을 띤다.

인터넷에서 생성되는 수많은 기록물도 영구적이지 않다. 2019년 불거진 싸이월드 서비스 중단 문제가 대표 사례다. 이 같은 문제를 방지하기 위해 필요한 기술도 웹 아카이브(web archive)다. 웹사이트 전체 또는 일부를 크롤링(crawling)해서 아카이브를 생성하면 사이트가 삭제되더라도 내용을 보존할 수 있다.

미국은 1996년부터 인터넷 아카이브 프로젝트를 추진해 왔는데 전 세계 웹사이트를 수집·보관해 기록하고 있다. 국내에서는 2004년부터 국립중앙도서관이 ‘오아시스’ 프로젝트를 운영하고 있다. 여기서 시간이 흘러 없어진 우리나라 주요 웹사이트 모습을 찾아볼 수 있다. 그러나 공개된 웹 자료 수량은 적고 선정 웹사이트 기준은 알려져 있지 않다. 공공성이 높고 가치 있는 웹사이트는 유형별로 구분하고 정기적인 아카이빙이 필요하다는 목소리가 높아지고 있다.

통상 데이터 백업아카이브를 같은 의미로 사용하는 경우가 있지만 이 둘은 엄연히 다른 용어다. 백업은 사고 발생 시 복구를 위해 특정 시점 데이터를 모두 사본화한 저장물이다. 이에 따라 시간이 지나면 원본과는 차이가 난다. 아카이빙은 원본 자체를 저장하고 관리하기 때문에 계속 원본 속성을 유지한다는 특징이 있다.




국내 대표적인 디지털 아카이브 서비스인 ‘네이버 뉴스 라이브러리’ / 출처=네이버