본문 바로가기
컴퓨터공학

빅데이터의 3가지 특성과 각각의 개념에 대하여

by A&Mcorp. 2022. 8. 9.
반응형

빅데이터의 3가지 특성과 개념

빅데이터가 사물인터넷의 발달과 함께 굉장히 중요한 요소로 떠오르고 있다. 빅데이터의 특징과 개념에 대해서 알아보자.

빅데이터의 첫번째 특징인 볼륨(Volume)은 데이터의 양을 말한다. 그러나, 단순히 데이터의 양을 많이 수집, 저장 한다고해서 빅데이터라 불리지는 않습니다. 최근 사물인터넷의 활성 기로에서 데이터의 양 보다는 기존에 관리하지 않았던 데이터를 가져와 분석 하는 빅데이터 분석 사례가 늘고 있는 것과 같이 과거에 사용하지 않거나, 관리하지 않았던 데이터들을 사용의 범주로 가져오고 있는데요. 이렇게 등장한 데이터 역시 빅데이터라고 보면 됩니다. 관심 대상이 아니었던 데이터, 무심히 발생하거나 존재했던 데이터가 이제 빅데이터 분석의 대상이 되어 새로운 이벤트나 비지니스가 되는 형상입니다. 즉, 단순히 데이터의 양이 많다는 것이 아닌 과거에 사용하지 않았던지, 기존에 관리가 되지 않안던지 관계 없이 다양하고 방대한 데이터를 이용하여 활용할 수 있다고 말할 수 있는 것이 빅데이터의 특징인 볼륨으로 생각됩니다.

 

빅데이터의 3가지 특성과 개념


빅데이터의 두번째 특징인 데이터의 입출력 속도(Velocity)는 단순히 빠르다라는 의미와 함께 데이터의 수집과 적재 처리와 분석 - 예측(결과) 이 모든 단계의 신속성과 긴밀성 역시 속도의 개념으로 보는 것이 빅데이터 입니다. 단순히 고성능의 H/W(CPU, Storage)에서의 속도를 의미하지 않는다는 것이죠. 이러한 속도의 개념에서 전통적인 관계형 데이터베이스 (Oracle, DB2, MySQL 등)와 분산형 NoSQL(IBM Cloudant, Mongo DB, Cassandra, Couch DB 등) 데이터베이스로 구분하여 접근 할 필요가 있습니다. 전통적인 관계형DB는 데이터의 통합 위크플로워와 분석 위크플로워의 분리한 형태로 정밀한 분석이나 대용량 데이터의 신속한 분석을 주로 다루고 있습니다. NoSQL 데이터베이스는 분산형 DB로 분산DB와 분산처리로 실시간 또는 병렬처리로 Velocity를 커버합니다.  즉, 속도의 개념과 실시간 처리 모두가 빅데이터의 특징인 Velocity이라고 봐야 합니다.


빅데이터의 세번째 특징인 데이터의 다양성(Variety)은 앞서 말씀드린 첫번째 개념과 상충되는 부분이 있다고 생각됩니다. 볼륨에서도 언급한 것 처럼 새로운 데이터를 관심의 영역으로 가져온 것이 빅데이터라는 것입니다. 이렇게 다양한 데이터와 실시간으로 변화하는 데이터를 다루는 것이 바로 빅데이터의 특징이라는 보시면 됩니다.

반응형