빅데이터의 정의(DEFINITION)
미국의 IT 자문기관 가트너(Gartner)는 빅데이터를 다음과 같이 정의하였다.
"빅데이터란 높은 통찰력, 의사결정, 프로세스 자동화를 위해 비용 효과가 높은 혁신적인 정보처리 과정을 요하며, 대용량의 데이터 규모(high-volume), 빠른 속도(high-velocity), 높은 다양성(high-variety)을 지닌 정보 자산이다."
3V라 해서 국내외를 막론하고 빈번히 쓰이고 있는 가장 유명한 정의 같다. 어떤 논문, 정책, 잡지를 보더라도 거의 항상 등장한다.
그만큼 다소 남용되고 있는 문장이기도 한 것 같다.
양이 문제의 시작이지만, 그게 전부는 아니다.
여러 문헌을 살펴 본 결과 전문가들은 빅데이터라는 단어의 홍수현상?을 그리 반기시지는 않는 것 같았다.
빅데이터의 '빅'은 말그대로 'Big' 같은 데이터의 양적 의미만 가지는 것이 아니기 때문이다. 게다가 원래 빅데이터라는 단어는 쓰이고 있었고.
때문에 빅데이터에 대한 정의는 그것을 다루는 기관의 특성에 따라 차이를 보이는 것 같다.
"빅데이터란 전형적인 데이터베이스 소프트웨어 툴의 능력으로 수집, 저장, 관리, 분석할 수 없는 규모의 데이터 집합을 의미한다"
데이터 집단의 크기에 집중한다.
삼성경제연구소(2010)도 크기.
"기존의 관리 분석 체계로는 감당할 수 없을 정도의 거대한 데이터의 집합을 지칭한다"
국가정보화전략위원회(2011)는 효용성 및 기술적 측면에 초점을 맞춰 정의하였다.
"대용량 데이터를 활용, 분석하여 가치있는 정보를 추출하고, 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술이다"
"보통 수십에서 수천 테라바이트 정도의 거대한 크기를 갖고, 여러 가지 다양한 비정형 데이터를 포함하고 있으며, 생성-유통-소비(이용)가 몇 초에서 몇 시간 단위로 일어나 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합"
"빅데이터란 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합, 그리고 이를 관리, 분석하기 위해 필요한 인력과 조직 및 관련 기술까지 포괄하는 용어이다"
'ㆍ DB, AI' 카테고리의 다른 글
[빅데이터] 교육과정, 필요 역량 (0) | 2016.12.12 |
---|---|
[빅데이터 활용] 필요 인력 직무 구분 (0) | 2016.11.25 |
[빅데이터] 분석기술: 오피니언 마이닝(Opinion Mining) (0) | 2016.11.17 |
[빅데이터] 5세 미만 다빈도 질병 비교(외래편) (0) | 2016.11.13 |
[DB] Data Mining: Definition, Software (0) | 2016.10.16 |