건초더미 속의 바늘
정보에 대한 정보의 이용
데이터가 더욱 풍부해짐에 따라, 가장 큰 문제는 흔히들 말하는 데이터를 찾는 것이 아니라 적절한 정보를 쉽고 빠르게 제공하는데 있다. 이럴 때 필요한 것이 정보에 대한 정보이다. 도서관의 사서들과 컴퓨터 과학자들은 이를 “메타데이터”라 부른다.
정보 관리는 오랜 역사를 가진다. 3천 여 년 전의 아시리아에서는 석판에 부착된 작은 찰흙 조각들이 바구니에 담겨있거나, 선반에 쌓여 있을 때 그들을 구분하기 쉽게 만들었다. 이러한 생각은 20세기까지 작은 분류 카드 형태로 살아남았고 사서들은 이를 컴퓨터가 이용되기 전까지, 책의 제목이나 저자, 주제 등을 적어 놓는데 사용하였다. 책 자체가 데이터를 구성하고 이러한 분류 카드는 메타데이터로 볼 수 있다. 또 다른 예는 포장 레이블에 포함되어 전 세계적으로 하루에 5백만 건의 스캔이 이루어는 바코드이다.
최근 메타데이터는 사실상의 전성기를 맞고 있다. 인터넷에 있는 풍부한 정보들은 유용하게 활용되기 위해서 조직화 되어야 한다. 이것이 바로 구글의 특기이다. 그들의 검색 엔진을 위한 원자재는 공짜로 구할 수 있다. 바로 공개된 인터넷 상의 웹 페이지들이다. 그들이 가치를 추가하는 (메타데이터를 생성하고) 것은 이 정보를 조직화하고, 관련이 있는 질의에 랭킹을 매기는 행위를 통해서이다.
세계의 인터넷 검색 중 절반 가량이 구글을 통해서 이루어지며 그들은 매초당 35,000건의 질의에 답을 하고 있다. 메타데이터는 잠재적으로 수익성이 좋은 사업이다. “만약 정보를 얻을 수 있는 경로와 방법을 통제할 수 있다면, (이를 이용하는) 그 다음 단계의 생산자들에게 일정 비용을 청구할 수 있을 것입니다.” Columbia 비즈니스 스쿨의 통신 경제학자 Eli Noam은 설명했다. 하지만 더 호혜적인 사용 방법 역시 존재한다. 예를 들어, 웹사이트 Flickr에 업로드 되는 사진들에는 언제, 어디서 찍힌 것인지 뿐 아니라 잠재적 구매자들에게 유용한 카메라 모델 같은 정보가 메타데이터로 포함되어있다.
인터넷 이용자들은 조직화 되어있지 않은 정보에 라벨을 붙여 태그가 달린 사진이나 비디오처럼 쉽게 찾아질 수 있도록 돕는다. 하지만 그들은 전통적인 도서 분류법을 무시한다. 대신, 그들은 그들이 원하는 어떤 단어라도 붙여 전자 “Folksonomy” (역:다수의 유저들의 동시 노력에 의해 구축된 분류법)를 만든다. 따라서 버락 오바마의 사진에 “대통령”이라고 라벨을 붙이는 것 대신에 그들은 이 사진을 두고 “섹시” 혹은 “개자식”이라고 부를 수 있다. 혼란스러워 보이지만, 꼭 그렇지도 않다.
정보가 종이나, 필름과 같은 실재하는 매체에 기록되던 때에는 모든 것들이 오직 하나의 위치에 존재하였다. 디지털 정보는 동시에 여러 곳에서 같은 아이템이 저장 될 수 있다고 분류학과 인터넷에 관한 책의 저자 David Weinberger는 적고 있다. “모든 것이 다양성을 가집니다.” 디지털 메타데이터는 사물을 복잡하게도 만들고 동시에 간단하게도 만든다.