[Economist] History flushed (흘러가버린 역사)

History flushed

디지털 시대는 엄청 양의 도서관을 약속하지만 이들 대부분은 미완으로 남아있다.

Apr 28th 2012 | from the print edition

1086년, 정복자 윌리엄은 잉글랜드와 웨일즈에 관한 포괄적인 측량을 완성했다. “토지 대장”으로 불리게 된 이것은 13,418 곳의 장소와 112 곳의 도시를 자세히 포함하고 있으며 현재도 런던의 국립 도서관에서 대중에게 공개되어 있다. “토지 대장”의 900 주년을 기념하여 위탁 제작된 새로운 측량의 원본은 이와는 다르다. 이는 특별히 제작된 12인치 레이저 디스크에 기록되었다. 이 포맷도 현재는 구식이 되버렸다.

디지털의 시대는 무한한 저장 능력의 가능성과 함께 도래 했다. 향상된 컴퓨팅 파워와 디스크 용량은 저렴해진 가격과 합쳐져, 디지털로 생성된 어떤 것이라도 영원히 저장될 수 있을 것이라 여겨졌다. 하지만 디지털 데이터는 종종 깜짝 놀랄 만큼 짧은 생애를 산다. “우리가 주의하지 않으면, 21세기의 시작보다 20세기의 시작에 대해서 더 많이 알게 될지 모릅니다.” 브리티쉬 도서관의 디지털 보존 활동을 책임지고 있는 Adam Farquhar는 말한다.

디지털 기록 보관 담당자들이 다루어야 할 가장 명백한 문제는 하드웨어이다. 하지만 이 문제들은 또한 대처하기도 쉽다. 많은 저장소들은 보유한 데이터 저장 시스템을 매 3년에서 5년 사이에 교체하는데 이는 노후화 되거나 부식되는 것을 막기 위해서다. 이는 듣기보다는 그리 비싸지 않다. 하드 드라이브는 저렴하고 신뢰할 만 하다. 하드웨어 장애의 위협은 다른 장소에 복사본을 저장함으로써 극복할 수 있다. 브리티시 도서관은 런던, 요크셔, 웨일즈 그리고 스코틀랜드에 저장 공간을 가지고 있다.

디지털 자료를 수집하는 것은 더 까다롭다. 특히 온라인에서는 더 그러하다. 기록 보관 담당자들은 자유롭게 접근 가능한 웹의 부분들만을 수집할 수 있다. 암호나 검색어, 입력 형식 등의 사용자 입력이 필요한 것은 금지 구역이다. 온라인 비디오와 같은 스트리밍 미디어는 수집하기 까다롭다. 

소프트웨어나 파일 포맷의 변경은 더 많은 난관을 만들어낸다. “우리가 생성해 낸 많은 디지털 자료들이 그것을 생성한 소프트웨어에 의해서만 표현될 수 있습니다.” 현재 구글에서 근무하는 인터넷의 선구자 중 한명인 Vint Cerf는 말한다. 만약 최초의 프로그램이 사라지면, 완전히 새 것 같은 파일의 저장소는 쓸모 없어 진다. 소프트웨어가 10년이 넘어가는 시점부터는 이를 구동하기 위해서 보통, 소프트웨어가 오래된 하드웨어에서 돌고 있다고 생각하도록 속이는 하드웨어 에뮬레이션이 필요하다.

비록 기술적인 문제는 보통 풀어나갈 수 있지만, 규제 상의 장애물은 극복하기 더욱 어렵다. 국회 도서관 같은 납본 도서관들은 법에 의해 웹 사이트를 저장하기 전 허가를 받아야 함을 강제 받는다. 규제는 컴퓨터 프로그램, 게임, 음악, 책과 같은 것을 저장할 때 더 엄격해질 수 있다. 보통 디지털 저작권 관리(DRM) 소프트웨어가 불법 유출로부터 이들을 지키기 위해 딸려 있다. 이러한 프로그램들을 회피하는 기록 보관 담당자들은 불법적인 행위를 하게 되는 것이다. 미국의 디지털 밀레니엄 저작권 활동(DMCA)는 이러한 회피를 범죄로 규정했다.

저작권과 DRM은 정보 시스템이 발전하는 환경에 따라 더욱더 크게 닥칠 것이다. 초기의 인터넷은 자연스럽게 복사가 쉬운,  공개된 환경이었다. 스마트폰 앱으로 더욱 널리 퍼진 모바일 세상은 훨씬 덜 그렇다. 기업들이 더욱 더 강력하게 그들의 저작물을 보호하면, 현대의 디지털 생산물들은 절대로 저장되지 않을 위험을 수반하게 된다. 도서관은 인기 있는 문화의 한 부분인 앵그리 버드나 인스타그램과 같은 앱을 저장할 권한이 없다.

이러한 모든 어려움에도 불구하고, 세계의 도서관들은 국가의 디지털 유산의 특정 부분들을 보존하기 위해 지난 10년이 넘는 기간 동안 애써왔다. 미국 국회 도서관은 정부로부터 1억불을 지원 받는 디지털 보존 프로그램을 2000년에 시작했다. 이의 웹 저장소는 현재 미국 정부 소유가 대다수라 저작권 문제가 없는 10,000개의 웹사이트를 저장하고 있다. 민간에 의해 운영되는 웹 사이트를 포함시키기는 더욱 어렵다. 어떤 저장 프로젝트에서는 오직 5분의 1의 웹 사이트만이 복제 허가를 구하는 이메일에 회신했다.

디지털 쓰레기 수집

국회 도서관의 뒤를 이어, 많은 선진국의 국립 도서관들이 디지털 보관 프로그램을 운영하고 있다. 예를 들어 영국에서는 국립 보관소에서 모든 정부 웹사이트의 복사본을 저장하고 있다. 브리티쉬 도서관에서는 모든 영국 온라인 저작물을 축적하고 있다.

하지만 가장 많이 알려진 디지털 보존 운동은 민간 분야의 비영리 운동인 인터넷 아카이브이다. 이의 서버는 과거 특정 날짜의 한 웹사이트를 사람들에게 보여주는 인기 있는 웹 서비스인 “Wayback Machine”을 운영하고 있다. Brewster Kahle에 의해 1996년 설립된 인터넷 아카이브 컬렉트는 수십 억 개의 웹 페이지를 저장하고 접근할 수 있게 해주며 또한 책이나 비디오, 또는 소프트웨어 같은 다른 디지털 미디어도 저장하고 있다. 이 컬렉션은 1,600억 개의 웹 페이지를 저장하고 있다. 이곳은 기본적으로 허가를 요청하는 것보다는 용서를 구하는 것이 낫다는 원칙에 의해 운영되고 있다.

더 최근에, 괴짜 전문가들은 공식 기관들이 하기 꺼리는 일을 벌이고 있다. 이들은 항상 쓸데없는 것을 모아왔다. 현재 그들은 TOSEC (The Old School Emulation Centre의 줄임 말이다) 과 같은 사이트에 모여들어 오래된 소프트웨어를 수집하고 있다. 하지만 이러한 컬렉션들은 그 자체의 한계가 있다. 이들은 너무 게임이나 운영체제에만 중심을 두고 있다. 사람들은 슈퍼 마리오에서 느끼는 것과 같은 향수를 스프레드시트의 초기 버전에서는 별로 느끼지 않는 경향이 있다. 더 중요한 것은 이러한 것이 저작권 법의 보호 아래 있다는 것이다.

저장소의 확산에도 불구하고, 디지털 보존은 잘해야 들쭉날쭉하다. 법이 기술을 따라잡을 때까지, 디지털 역사는 디지털의 시대가 약속한 장대한 분출이 아니라 찔끔찔끔 쓰여질 수 밖에 없을 것이다.

Leave a Reply