[빅데이터] 비정형 데이터(Unstructured Data): 특징, 수집, 분석
Gartner는 비정형 데이터(unstructured data)를 사전 정의된 데이터 모델을 따르지 않는 컨텐츠로 정의한다. 비정형 데이터? 특징과 종류!- 사람이 만든(human-generated) 그리고 인간 중심(people-oriented)의 경향성을 띠고 있다.- 언어 분석이 가능한 텍스트 데이터- 또는 그보다 더 구조화 되지 않은 멀티미디어 데이터- 예를 들어 블로그의 글, SNS 내의 정보, 이미지, 영상 등이다. 비정형 데이터 수집 기술- Crawling, RSS, Open API, Streaming, FTP 비정형 데이터 분석의 문제점구조화되지 않은 데이터이기 때문에, 특정 분석 기법을 쓰기 마련이다. 자동화를 통해서 데이터를 분석 가능한 형태로 스캔하고, 형식화하게 된다. 이때, 중요한..