오픈 데이터 분석하는 비영리단체 소다비
“디지털 시대가 되면서 쏟아져 나오는 데이터의 양이 엄청납니다. 특히 관공서에서 제공할 수 있는 데이터가 많습니다. 그런데 어떻게 써야할지, 어떤 곳에서 필요한지에 대해서 잘 아는 사람이 별로 없는 것이 현실입니다.”
통계나 데이터를 분석하여 증명하고 실생활에 쓸 수 있도록 돕는 한인 비영리단체 ‘소다비(Social Data Analysis and Visualization)’가 2년차를 맞아 본격적인 활동을 위해서 기지개를 켜고 있다.
이제까지 데이터 세계는 소수 전문가들이 소수의 소스에서 대용량의 컴퓨터를 이용해서 자신들의 목적을 위해서 데이터를 가공해 정보로 사용해왔다. 그런데 2010년을 기점으로 빅데이터와 저렴해진 컴퓨터의 능력 덕분에 이전에는 꿈도 못꿨던 데이터 가공이 가능해졌다.
소다비 사무국장인 클레어몬트 매케나 칼리지 계량전산연구소 디렉터 박제호 박사는 “지난해 출범 이전에는 몰랐던 한인사회의 여러 현황을 정부 사이트에서 찾아내 분석해 공개한 바 있다”면서 “골목별 범죄 데이터, 타운 건물들의 퍼밋 현황은 물론 환경, 교통 등의 정보를 무료로 제공해왔다”고 밝혔다.
홍보 담당 제니퍼 조 박사는 “디지털 데이터를 통해 한인사회, 타운에 대한 정보를 제대로 알아야겠다는 취지”라며 “타커뮤니티에서 우리 정보를 우리를 위해서 찾아주지도 않고 영리적으로 운영하기도 어려운 상황이다. 그래서 비영리단체로 자원봉사자 위주로 설립했다”고 설명했다.
“오픈데이터를 어떻게 가공하느냐에 따라서 한인사회나 개인에게 필요한 정보가 될 수 있습니다. 저희는 공공 기관의 정보를 가공해서 한인사회에 내놓는 것이 사명입니다. 필요한 사람들이 그 필요성을 확인하고 로비를 하거나 기업체를 운영할 수 있도록 돕는 겁니다.”
정부에서 내놓는 오픈 데이터는 모든 인종, 모든 연령, 모든 지역으로 구성돼 있다. 이를 소다비 봉사자들은 한인과 관련된 데이터를 뽑아서 웹사이트나 출판물을 통해서 한인사회에 제공하게 된다.
지난해에는 한인타운의 범죄 데이터를 분석해 언제 어디서 몇건 있었는지는 물론, 지역별, 길거리 코너별로 분석했다. 또한 지난해 열린 평창 올림픽 당시 트위터에서 한국의 이미지가 얼마나 개선되고 있는지 알아볼 수 있었다. 또한 홈리스 셸터와 관련해선 한인타운과 LA의 홈리스 자료를 분석해 당시 셸터를 한인 타운 한복판에 설치하려던 일부 시관련 공무원들에게 현실을 제대로 알리는데도 공헌한 바 있다.
조 박사는 “소다비 구성원이 모두 과학기술자일 필요는 없다. 뜻이 맞는 사람들의 동참이 필요하다”면서 “이제까지는 전공 대학생, 전문기술직 종사자들로 구성됐지만 앞으로는 고교생 봉사자나, 일반인들의 참여도 가능하다. 개인적으로 실무경험을 쌓을 수 있는 기회도 되고 큰 보람도 있을 것”이라고 설명했다.
박 사무국장이 밝힌 계획은 올해에는 첫째, 산재한 정보들을 처리해서 클린 데이터 분석을 중점적으로 실행하고 둘째,한인과 밀접한 관련이 있는 창의적인 데이터콜렉션을 찾아내는 것이다. 두가지 모두 많은 관심있는 한인들의 참여가 절실하다는 것.
우선, 트위터의 API를 이용하여 사안과 키워드에 따라 사이버상의 한국, 한인사회에 대한 분석을 진행하고 연방정부에 의해서 작성되는 여러 센서스 결과, 선거구, 영사관 자료 등 다양한 경로를 통해 한인인구를 산출해 낼 계획이다.
박제호 박사는 “사실 데이터는 숫자에 불과해 중립적이다”며 “그래서 어떤 관점(view)으로 처리하느냐에 따라서 분석이 이뤄질 수 있다. 하지만 소다비는 중립적인 자세를 지킬 것”이라고 강조했다.
소다비 실무그룹에는 학생들이 참여하고 있다. 학생들은 전문가들을 돕고 전문가들은 학생들에게 산 경험을 제공하므로 나중에 데이터 사이언스 관련 취업이나 직종에서 좋은 이력이 될 수 있다. 현재 데이터 사이언스가 크게 붐을 이루고 있는 분야지만 의외로 실제 경험을 쌓을 곳이 별로 없는데 소다비가 마침 그 역할을 해줄 수 있게 된 것이다.
소다비팀은 오픈 데이터 처리 이외에도 임의 수집도 가능하다. 필요한 곳이 원하다면 협업의 문호도 열어놓고 있다.
▶웹사이트: www.sodavi.org
▶문의: sodavigroup@gmail.com
장병희 기자 <chang.byunghee@koreadaily.com>