온라인에 무료 제공 고품질 정보 넘쳐
중소기업·소상공인·예비창업자에 유용
데이터 속 팩트 분석·해석 능력 중요
핵심가치 포착해야 미래 가치 창출
1993년 뉴욕시장에 당선된 루돌프 줄리아니는 ‘범죄와의 전쟁’을 선언했다. 마피아를 비롯한 범죄단체 활동부터 신호 위반, 쓰레기 투기 등 경범죄 행위까지 대대적으로 단속했다. 이듬해 지하철 중범죄를 비롯해 뉴욕시의 범죄 발생 건수가 급격히 감소했다. 줄리아니 시장은 자신의 성과라고 자랑했다. 언론과 학계는 이른바 ‘깨진 유리창 이론(Broken Window Theory)’의 성공 사례라고 입을 모았다. 범죄학자 제임스 윌슨과 조지 켈링이 1982년 발표한 이 이론은 깨진 유리창이 있는 곳에서 범죄가 생겨나기 시작한다며 사소한 무질서도 방치하지 말라는 주장이다. 뉴욕시는 이 이론을 따라 일찌감치 1984년부터 지하철 낙서(그라피티)를 5년 넘게 지웠다.
반론도 만만찮았다. 뉴욕시 범죄율은 사실 줄리아니 시장 취임 전부터 감소했다. 더욱이 뉴욕시뿐만 아니라 미국 전체 범죄율이 내림세를 탔다. 경찰 인력이 줄었는데 범죄율이 되레 떨어진 도시도 있었다. 스티븐 레빗 미 시카고대 교수의 생각은 더 나아갔다. 그는 20년 전인 1973년 1월 미 대법원의 낙태 합법화 판결을 끄집어냈다. 낙태하려는 여성은 대체로 불우한 환경에 놓였다. 이들이 원치 않게 출산한다면 그 아이들은 제대로 돌봄을 받지 못하고 범죄자가 될 가능성도 크다. 낙태 합법화로 잠재 범죄자가 덜 태어났으며 그 결과 범죄도 줄었다는 게 레빗 교수의 주장이다. 일부 반론도 나왔지만, 그의 기발한 주장을 학계가 폭넓게 받아들이는 것을 방해하지 못했다.
이 사례는 두 가지를 일깨운다. 통계 데이터를 포함한 사실(팩트)에 기반한 논의가 이뤄져야 한다는 것과 그 팩트를 분석하고 해석하는 것에 통찰력이 필요하다는 것. 이것이 중요한 이유는 바로 우리가 데이터 홍수, 즉 빅데이터(Big Data) 시대를 살기 때문이다. 데이터를 잘못 해석하면 그 급류에 휩쓸린다. 반대로 잘 해석하면 불확실한 위험에 빠지지 않고 미래 가치 창출의 주인공이 된다.
데이터는 최근 폭발적으로 쏟아져나온다. 스마트폰을 비롯한 단말기와 소셜미디어의 활성화, 사물인터넷(IoT)의 확산에 힘입어 데이터가 감당할 수 없을 정도로 급증했다. 유튜브만 해도 1분마다 수백만 건의 신규 조회가 발생한다.
데이터가 많아지자 원하는 데이터를 찾을 확률은 오히려 더 떨어졌다. 관련이 없거나 쓸모없는 데이터도 덩달아 늘어난 탓이다. 분석 가능한 데이터 역시 거의 파편화했다. 이런 문제를 해결하기 위해 데이터 전문업체들이 관리 소프트웨어를 개발해 운영한다. 하지만 대기업이나 공공기관과 달리 중소기업과 개인은 이 비싼 소프트웨어를 쓸 수 없거니와 사실 쓸 필요도 없다. 원하는 데이터 수준이 높지 않아 이미 공개된 데이터만 잘 살펴봐도 되기 때문이다.
카드사 등의 온라인 결제금액 비중을 보면 반려견 관련 용품 소비행태가 어떻게 바뀌고 있는지 잘 드러난다. 출처=KT그룹 빅데이터 시스템
신규 창업을 준비하는 A라는 사람이 있다. 그는 아이템으로 아기용품과 반려견 용품을 놓고 고민한다. 통계자료부터 챙겨본다. 통계청 발표에 따르면 2021년 출생아 수는 26만500명이다. 전년보다 4.3%(1만1800명) 줄었다. 지난해 5월 농림축산검역본부에 따르면 2020년 총 23만5637마리의 반려견이 신규 등록됐다. 전년 대비 11% 증가했다. 씀씀이는 아기 부모가 반려견주보다 평균 5배(75만 원 vs 15만 원)는 더 많다. 그러나 미래 전망을 보면 반려견 시장의 지속 성장이 기대됐다. A씨는 반려견 용품 사업을 하기로 하고 조금 더 조사해보기로 한다.
금융 빅데이터 플랫폼인 ‘대박 날 지도’에 들어가 보니 KT그룹 빅데이터 시스템의 반려동물시장 자료가 있다. 반려견주 가운데 1인 가구와 시니어 가구의 비중이 커졌다. 일반용품과 간식·사료보다 패션과 미용 수요가, 또 그 장소로 반려견 호텔 비중이 각각 커지는 것으로 나타났다. A씨는 반려견 미용 사업을 할 마땅한 장소 몇 곳을 찾아 상권 분석 작업에 들어갔다.
과거엔 이런 정보를 찾으려면 창업 전문가나 컨설팅업체에 의뢰해야 했다. 지금은 스스로 웹을 통해 웬만한 정보를 얻을 수 있다. 통신사, 금융사, 카드사, 시장조사기관 등이 무료로 제공하는 빅데이터도 있다. A씨가 이용한 서비스만 해도 금융 빅데이터 플랫폼 ‘대박 날 지도’, KT와 BC카드로 이뤄진 ‘KT 빅데이터 시스템’, 소상공인시장진흥공단의 ‘상권 정보시스템’, 서울신용보증재단의 ‘서울시 우리 마을 가게 상권 분석 서비스’ 등이다.
1인 세대 관광소비 비중 변화
코로나 팬데믹 이후 자신만을 위한 시간을 가질 목적으로 혼자 떠나는 여행 수요가 급증했다.
출처=BC카드 소비 데이터
정부의 ‘데이터 바우처’ 서비스(kdata.or.kr/datavoucher)를 이용하면 공짜로 고품질의 데이터를 얻을 수 있다. 이 데이터 지원금제도는 초기 중견기업, 중소기업, 소상공인, 예비창업자 등 수요자가 원하는 데이터를 신청해 선정되면 관련 데이터를 가진 기관을 통해 공급받고 그 대가를 정부 예산으로 내는 사업이다.
수요자는 공짜라서 좋다. 공급자는 남아도는 데이터를 가치 있게 팔 수 있어 좋다. 정부는 더 많은 데이터 개방을 계기로 4차산업의 핵심 엔진인 빅데이터 시장을 활성화할 수 있다. 2022년에만 총 1241억 원의 예산을 책정했다.
다만, 수요자는 매년 2~3월에 일괄적으로 수요자 등록을 하고 선정이 되어야만 서비스를 이용할 수 있다. 원하는 데이터가 정작 없을 가능성도 있다. 이 한계에도 불구하고 데이터 바우처는 시장조사 자금이 부족한 사업자, 특히 중소기업과 소상공인, 예비창업자에게 매우 유용하다.
빅데이터는 이론적으로 전수조사할 수 있다. 실시간 정보를 얻을 수 있다. 과거와 비교해 원하고자 하는 데이터를 추출하고 가공하는 것도 쉬워졌다. 그런데 데이터양이 늘어났다고 데이터의 질과 활용 가치까지 곧바로 커지는 것은 아니다. 특히 미래 전망이나 활용 가치 예측은 여전히 어렵다. 데이터양은 이미 알고 있는 사실을 확인하고 검증하는 것에 그칠 수도 있다. 빅데이터라고 분석했더니 주변 몇 사람에게 물어봐도 알 만한 사실인 경우도 있다.
결국 스몰데이터든 빅데이터든 그 속에 숨겨진 핵심 사항과 그 가치, 특히 사람들이 원하는 가치를 제때 잘 포착하는 것이 중요하다. 이 능력은 저절로 생겨나지 않는다. 데이터를 많이 경험하고, 특히 다른 발상도 하면서 어느덧 길러지는 통찰력이다. 이 능력은 빅데이터 시대에 창업가든, 월급쟁이든 경쟁자보다 우위에 서게 만들어 준다.
그러니 아무쪼록 데이터를 자주 접해보고 친해지는 것이 좋겠다. 딱딱한 수치일지라도 자신의 관심 분야라면 즐거운 놀잇감이 될 수 있다. 야구팬에게 좋아하는 선수나 구단 관련 데이터가 그러할 것이다. 이렇게 데이터에 관심을 기울이다 보면 어느 날 그 분야에서 스티븐 레빗 교수 못지않은 통찰력을 가진 자신을 발견할 것이다. 바로 빅데이터 승자의 탄생이다.
필자 신화수는 30년간 기술산업 분야를 취재했으며 전자신문 편집국장, 문화체육관광부 홍보협력관, IT조선 이사 등을 역임했다. 기술로 세상을 바꾸는 사람들을 응원한다.
온라인에 무료 제공 고품질 정보 넘쳐
중소기업·소상공인·예비창업자에 유용
데이터 속 팩트 분석·해석 능력 중요
핵심가치 포착해야 미래 가치 창출
1993년 뉴욕시장에 당선된 루돌프 줄리아니는 ‘범죄와의 전쟁’을 선언했다. 마피아를 비롯한 범죄단체 활동부터 신호 위반, 쓰레기 투기 등 경범죄 행위까지 대대적으로 단속했다. 이듬해 지하철 중범죄를 비롯해 뉴욕시의 범죄 발생 건수가 급격히 감소했다. 줄리아니 시장은 자신의 성과라고 자랑했다. 언론과 학계는 이른바 ‘깨진 유리창 이론(Broken Window Theory)’의 성공 사례라고 입을 모았다. 범죄학자 제임스 윌슨과 조지 켈링이 1982년 발표한 이 이론은 깨진 유리창이 있는 곳에서 범죄가 생겨나기 시작한다며 사소한 무질서도 방치하지 말라는 주장이다. 뉴욕시는 이 이론을 따라 일찌감치 1984년부터 지하철 낙서(그라피티)를 5년 넘게 지웠다.
반론도 만만찮았다. 뉴욕시 범죄율은 사실 줄리아니 시장 취임 전부터 감소했다. 더욱이 뉴욕시뿐만 아니라 미국 전체 범죄율이 내림세를 탔다. 경찰 인력이 줄었는데 범죄율이 되레 떨어진 도시도 있었다. 스티븐 레빗 미 시카고대 교수의 생각은 더 나아갔다. 그는 20년 전인 1973년 1월 미 대법원의 낙태 합법화 판결을 끄집어냈다. 낙태하려는 여성은 대체로 불우한 환경에 놓였다. 이들이 원치 않게 출산한다면 그 아이들은 제대로 돌봄을 받지 못하고 범죄자가 될 가능성도 크다. 낙태 합법화로 잠재 범죄자가 덜 태어났으며 그 결과 범죄도 줄었다는 게 레빗 교수의 주장이다. 일부 반론도 나왔지만, 그의 기발한 주장을 학계가 폭넓게 받아들이는 것을 방해하지 못했다.
이 사례는 두 가지를 일깨운다. 통계 데이터를 포함한 사실(팩트)에 기반한 논의가 이뤄져야 한다는 것과 그 팩트를 분석하고 해석하는 것에 통찰력이 필요하다는 것. 이것이 중요한 이유는 바로 우리가 데이터 홍수, 즉 빅데이터(Big Data) 시대를 살기 때문이다. 데이터를 잘못 해석하면 그 급류에 휩쓸린다. 반대로 잘 해석하면 불확실한 위험에 빠지지 않고 미래 가치 창출의 주인공이 된다.
데이터는 최근 폭발적으로 쏟아져나온다. 스마트폰을 비롯한 단말기와 소셜미디어의 활성화, 사물인터넷(IoT)의 확산에 힘입어 데이터가 감당할 수 없을 정도로 급증했다. 유튜브만 해도 1분마다 수백만 건의 신규 조회가 발생한다.
데이터가 많아지자 원하는 데이터를 찾을 확률은 오히려 더 떨어졌다. 관련이 없거나 쓸모없는 데이터도 덩달아 늘어난 탓이다. 분석 가능한 데이터 역시 거의 파편화했다. 이런 문제를 해결하기 위해 데이터 전문업체들이 관리 소프트웨어를 개발해 운영한다. 하지만 대기업이나 공공기관과 달리 중소기업과 개인은 이 비싼 소프트웨어를 쓸 수 없거니와 사실 쓸 필요도 없다. 원하는 데이터 수준이 높지 않아 이미 공개된 데이터만 잘 살펴봐도 되기 때문이다.
카드사 등의 온라인 결제금액 비중을 보면 반려견 관련 용품 소비행태가 어떻게 바뀌고 있는지 잘 드러난다. 출처=KT그룹 빅데이터 시스템
신규 창업을 준비하는 A라는 사람이 있다. 그는 아이템으로 아기용품과 반려견 용품을 놓고 고민한다. 통계자료부터 챙겨본다. 통계청 발표에 따르면 2021년 출생아 수는 26만500명이다. 전년보다 4.3%(1만1800명) 줄었다. 지난해 5월 농림축산검역본부에 따르면 2020년 총 23만5637마리의 반려견이 신규 등록됐다. 전년 대비 11% 증가했다. 씀씀이는 아기 부모가 반려견주보다 평균 5배(75만 원 vs 15만 원)는 더 많다. 그러나 미래 전망을 보면 반려견 시장의 지속 성장이 기대됐다. A씨는 반려견 용품 사업을 하기로 하고 조금 더 조사해보기로 한다.
금융 빅데이터 플랫폼인 ‘대박 날 지도’에 들어가 보니 KT그룹 빅데이터 시스템의 반려동물시장 자료가 있다. 반려견주 가운데 1인 가구와 시니어 가구의 비중이 커졌다. 일반용품과 간식·사료보다 패션과 미용 수요가, 또 그 장소로 반려견 호텔 비중이 각각 커지는 것으로 나타났다. A씨는 반려견 미용 사업을 할 마땅한 장소 몇 곳을 찾아 상권 분석 작업에 들어갔다.
과거엔 이런 정보를 찾으려면 창업 전문가나 컨설팅업체에 의뢰해야 했다. 지금은 스스로 웹을 통해 웬만한 정보를 얻을 수 있다. 통신사, 금융사, 카드사, 시장조사기관 등이 무료로 제공하는 빅데이터도 있다. A씨가 이용한 서비스만 해도 금융 빅데이터 플랫폼 ‘대박 날 지도’, KT와 BC카드로 이뤄진 ‘KT 빅데이터 시스템’, 소상공인시장진흥공단의 ‘상권 정보시스템’, 서울신용보증재단의 ‘서울시 우리 마을 가게 상권 분석 서비스’ 등이다.
1인 세대 관광소비 비중 변화
코로나 팬데믹 이후 자신만을 위한 시간을 가질 목적으로 혼자 떠나는 여행 수요가 급증했다.
출처=BC카드 소비 데이터
정부의 ‘데이터 바우처’ 서비스(kdata.or.kr/datavoucher)를 이용하면 공짜로 고품질의 데이터를 얻을 수 있다. 이 데이터 지원금제도는 초기 중견기업, 중소기업, 소상공인, 예비창업자 등 수요자가 원하는 데이터를 신청해 선정되면 관련 데이터를 가진 기관을 통해 공급받고 그 대가를 정부 예산으로 내는 사업이다.
수요자는 공짜라서 좋다. 공급자는 남아도는 데이터를 가치 있게 팔 수 있어 좋다. 정부는 더 많은 데이터 개방을 계기로 4차산업의 핵심 엔진인 빅데이터 시장을 활성화할 수 있다. 2022년에만 총 1241억 원의 예산을 책정했다.
다만, 수요자는 매년 2~3월에 일괄적으로 수요자 등록을 하고 선정이 되어야만 서비스를 이용할 수 있다. 원하는 데이터가 정작 없을 가능성도 있다. 이 한계에도 불구하고 데이터 바우처는 시장조사 자금이 부족한 사업자, 특히 중소기업과 소상공인, 예비창업자에게 매우 유용하다.
빅데이터는 이론적으로 전수조사할 수 있다. 실시간 정보를 얻을 수 있다. 과거와 비교해 원하고자 하는 데이터를 추출하고 가공하는 것도 쉬워졌다. 그런데 데이터양이 늘어났다고 데이터의 질과 활용 가치까지 곧바로 커지는 것은 아니다. 특히 미래 전망이나 활용 가치 예측은 여전히 어렵다. 데이터양은 이미 알고 있는 사실을 확인하고 검증하는 것에 그칠 수도 있다. 빅데이터라고 분석했더니 주변 몇 사람에게 물어봐도 알 만한 사실인 경우도 있다.
결국 스몰데이터든 빅데이터든 그 속에 숨겨진 핵심 사항과 그 가치, 특히 사람들이 원하는 가치를 제때 잘 포착하는 것이 중요하다. 이 능력은 저절로 생겨나지 않는다. 데이터를 많이 경험하고, 특히 다른 발상도 하면서 어느덧 길러지는 통찰력이다. 이 능력은 빅데이터 시대에 창업가든, 월급쟁이든 경쟁자보다 우위에 서게 만들어 준다.
그러니 아무쪼록 데이터를 자주 접해보고 친해지는 것이 좋겠다. 딱딱한 수치일지라도 자신의 관심 분야라면 즐거운 놀잇감이 될 수 있다. 야구팬에게 좋아하는 선수나 구단 관련 데이터가 그러할 것이다. 이렇게 데이터에 관심을 기울이다 보면 어느 날 그 분야에서 스티븐 레빗 교수 못지않은 통찰력을 가진 자신을 발견할 것이다. 바로 빅데이터 승자의 탄생이다.
필자 신화수는 30년간 기술산업 분야를 취재했으며 전자신문 편집국장, 문화체육관광부 홍보협력관, IT조선 이사 등을 역임했다. 기술로 세상을 바꾸는 사람들을 응원한다.