람다의 Re:view #3: 문서의 분류, 사람의 일, 기계의 일

얼마 전 뉴스페퍼민트가 번역해서 소개한 <컴퓨터에 파일을 보관하는 방식과 세대 차이> 라는 더 버지(The Verge)의 아티클을 재미있게 읽었습니다. 아마도 문헌정보학이나 기록학을 공부했고 컴퓨터를 좋아하는, 그리고 컴퓨터의 옛 작동 방식을 이해하는 세대에게는 더 흥미로운 글이었겁니다.(제가 그렇습니다) 요약하면, 구세대는 컴퓨터의 파일을 디렉토리로 정리하며 쓰는데 반해, 이른바 Gen-Z는 한 폴더에 몰아넣고 그냥 검색해서 쓴다는 것이었습니다.

이 글은 컴퓨터에 어떻게 파일을 보관하는지에 따라 세대를 구분할 수 있고, 요즘 컴퓨팅 환경에 대한 이해가 세대별로 어떻게 다른지를 흥미진진하게 풀었습니다. 기록을 다루는 우리는 이런 일들의 양상을 희미하게 짐작하고 있다가 누군가 콕 짚어서 말해주니 반가운 것이었는지도 모릅니다.

“요즘 친구들 정말 그런단 말이야?”

“그런데…사실 나도 어느 정도는 그래”

우리가 일을 하며 만드는 문서와 정보뿐만 아니라 기록을 관리하는 일도 분류, 검색, 탐색과 밀접하게 관련됩니다. 종종 기록을 찾아서 입증하거나 제공해야 하고, 누가(가끔은 내가) 한 일의 경과와 결과를 확인해야 하는 일도 빈번합니다. 그 방법이 검색이든 탐색이든 연역이든 귀납이든 우리는 기록과 정보를 찾아서 써야 합니다. 그리고 문서 안에 담긴(갇힌) 정보는 사람이 읽어야 하고 판독과 해석, 이해도 역시 사람 몫입니다. 어쩌면 저 글은 새로운 컴퓨팅의 백엔드(back-end: 소프트웨어의 뒷 단)에서 누가 일하는지를 설명한 것일지도 모릅니다. 그 누구는 사람에서 기계로 바뀌었다고 말이죠.

그 변화는 무엇일까요. 우리의 일과 연관 짓는다면 어떨까요. 공문서를 만들면서 키워드, 문서취지, 과제카드를 손수 입력하는 일은 사실 번거롭습니다. 기록관리 일을 하는 당사자인 우리에게도 말이죠. ‘언젠가 컴퓨터가 해주겠지’ 라고 생각합니다. 내가 지금 만들어내는 문서가 아카이브로 가는 일은 수십 년 후에나 일어날 것입니다. 지금의 우리에게 당면 과제는 아닙니다. 아카이브의 오래된 문서철 중에는 ‘잡철’이라고 당당히 이름을 붙인 문서의 묶음이 꽤 있습니다. 잡철은 그야말로 잡스러운 문서철입니다. 온갖 것들이 섞여 있고 어떤 분류 정보도 없습니다. 잡철도 살아 남았는데, 적어도 내가 만드는 문서는 디지털 행정의 최첨단 환경에서 만들어지니 기우일지도 모르죠.

문서를 분석하고 분류하는 것이 사람이 아닌 기계라면 이런 상상을 해볼 수 있을까요? 키워드도 문서취지도 과제카드도 나는 직접 입력할 필요가 없습니다. 문서가 만들어지면 그와 동시에 서버의 기계(컴퓨터)가 문서를 읽기 시작합니다. 기계는 단어와 형태소로 문서를 분해하고 빈도와 통계를 내며, 람다씨가 만든 기존 문서, 해당 업무의 전임자가 만든 문서 폴더를 통째로 읽어들이며 사전에 설계된 알고리듬을 작동시킵니다. 전문검색(full-text-search)이나 자연어처리(Natural Language Processing) 기술은 날로 발전하고 있습니다. 처음에는 허술할 수도 있겠지요. 하지만 기계는 더 많은 데이터를 학습할수록 정교해집니다. 알고리듬은 그렇게 발전하니까요. 거기에 사람이 해야 할 일은 문서를 feeding하는 일입니다. 아, 또 하나 있습니다.

분류체계를 만드는 일입니다. 분류체계는 디지털 폴더입니다. 하지만 수직적-계층적이지 않습니다. 과제카드에 담을 필요도 없다면서 무슨 분류체계냐고요? 우리가 만들 분류를 위한 폴더는 ‘2022년 000사업 추진’이 아닙니다. 폴더의 제목과 설명은 충분히 길어야 합니다. 거기에 태그도 필요합니다. 태깅은 컴퓨터의 도움을 받을 수 있습니다. 태그는 연결된 데이터입니다.(인스타그램의 태그 기능을 떠올려보세요) 태그의 길이는 단어에 한정되지 않고 길 수도 있습니다. 폴더를 성실하게 설명하고 태그를 다는 일이 우리의 일입니다. 다행히 폴더링과 태깅의 대상은 개별 문서가 아니라 폴더입니다. 차라리 과제카드 입력이 더 편할 수도 있겠다고요? 처음에 컴퓨터의 알고리듬을 학습하는 데에는 일정한 노동집약적 일도 필요합니다. 시간이 지날수록 성장은 산술급수가 아닌 기하급수적으로 일어날 것입니다. 그것이 컴퓨터가 해야 하는 일이죠.

한편 조직 내부의 정보는 공유되어야 합니다. 부서를, 기관을 가로질러 공유의 범위가 확장되어야 합니다. 특별한 보안이나 개인정보보호의 이슈가 아니라면 더 많은 정보가 공유되고 큰 클라우드 바스켓 안에서 분석되어야 합니다. 알고리듬은 데이터를 먹고 자랍니다. 사무실의 파티션과 사일로를 넘어 일과 일의 정보, 문서는 더 많이 공유됩니다. 정보는 파편이 아니라 엮이고 섞여 맥락을 만들면서 유용해집니다. 결국 업무의 관리란 지식의 관리입니다.

상상을 마치고 현실로 돌아오니 도입한지 20년이 다 되어가는 BRM(Business reference model)이 보입니다. BRM은 폴더라는 메타포를 ‘흉내낸’ 정부의 디지털 분류도구의 하나입니다. 기록관리를 위해 만들어진 것도 아니죠. 20년 전에는 유용했던 BRM이라는 선험적 분류는 재고할 때가 되었습니다. 연역적 체계만으로는 쏟아지는 세상의 정보를 감당하기 어렵기 때문입니다. 디렉토리와 폴더를 부정하는 것은 아니지만 더 똑똑한 정보 분류와 검색을 위해서는 지금의 생각을 과감히 깰 트리거가 필요하지 않을까요?

“모든 큐레이션은 검색이 필요할 때까지 커진다. 모든 검색은 큐레이션이 필요할 때까지 커진다.”(All curation grows until it requires search. All search grows until it requires curation.)

야후!의 320만개 디렉토리가 무너진 곳에서 구글은 시작됐습니다. 구글 검색은 여전히 막강하지만 우리는 원하는 정보를 더 정확하고 빠르게 찾고 싶습니다. 더해서 내가 신뢰하는 사람이 추천해주는 정보를 더 믿고 싶어합니다. 페이스북의 친구 기반 큐레이션은 사람들의 이런 요구를 먹고 자랐죠. 정보의 연관성과 맥락을 분석하고 더 똑똑한 결과를 제안하는 큐레이션이 새로운 검색과 탐색이 될 수 있을까요? Gen-Z 다음 세대는 과연 어떻게 컴퓨터를, 파일을 사용할까요? 컴퓨터? 파일? 그런 개념이 남아 있기는 할까요?

람다의 Re:view #3: 문서의 분류, 사람의 일, 기계의 일

Published by lambda

Leave a comment Cancel reply

Share this:

Published by lambda

Leave a comment Cancel reply