본문으로 바로가기

빅데이터의 정의(DEFINITION)



미국의 IT 자문기관 가트너(Gartner)는 빅데이터를 다음과 같이 정의하였다.


"빅데이터란 높은 통찰력, 의사결정, 프로세스 자동화를 위해 비용 효과가 높은 혁신적인 정보처리 과정을 요하며, 대용량의 데이터 규모(high-volume), 빠른 속도(high-velocity), 높은 다양성(high-variety)을 지닌 정보 자산이다."


3V라 해서 국내외를 막론하고 빈번히 쓰이고 있는 가장 유명한 정의 같다. 어떤 논문, 정책, 잡지를 보더라도 거의 항상 등장한다.

그만큼 다소 남용되고 있는 문장이기도 한 것 같다.


양이 문제의 시작이지만, 그게 전부는 아니다.

여러 문헌을 살펴 본 결과 전문가들은 빅데이터라는 단어의 홍수현상?을 그리 반기시지는 않는 것 같았다.

빅데이터의 '빅'은 말그대로 'Big' 같은 데이터의 양적 의미만 가지는 것이 아니기 때문이다. 게다가 원래 빅데이터라는 단어는 쓰이고 있었고.


때문에 빅데이터에 대한 정의는 그것을 다루는 기관의 특성에 따라 차이를 보이는 것 같다.


맥킨지는 2011년 보고서[각주:1]에서 

"빅데이터란 전형적인 데이터베이스 소프트웨어 툴의 능력으로 수집, 저장, 관리, 분석할 수 없는 규모의 데이터 집합을 의미한다"

데이터 집단의 크기에 집중한다.


삼성경제연구소(2010)도 크기.

"기존의 관리 분석 체계로는 감당할 수 없을 정도의 거대한 데이터의 집합을 지칭한다"


국가정보화전략위원회(2011)는 효용성 및 기술적 측면에 초점을 맞춰 정의하였다.

"대용량 데이터를 활용, 분석하여 가치있는 정보를 추출하고, 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술이다"


채승병, 함유근(2012)은 협의적 정의와 광의적 정의를 모두 소개한다.[각주:2]

"보통 수십에서 수천 테라바이트 정도의 거대한 크기를 갖고, 여러 가지 다양한 비정형 데이터를 포함하고 있으며, 생성-유통-소비(이용)가 몇 초에서 몇 시간 단위로 일어나 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합"


"빅데이터란 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합, 그리고 이를 관리, 분석하기 위해 필요한 인력과 조직 및 관련 기술까지 포괄하는 용어이다"



  1. [빅데이터: 혁신, 경쟁, 생산성을 위한 차세대 프론티어] 였던 것 같다. [본문으로]
  2. 협의적 정의는 데이터 크기에 초점, 광의적 정의는 그런 큰 데이터를 처리하기 위해 필요한 인력, 조직, 제반 기술까지 고려한 것이다. [본문으로]