빅데이터가 사물인터넷의 발달과 함께 굉장히 중요한 요소로 떠오르고 있다. 빅데이터의 특징과 개념에 대해서 알아보자.
빅데이터의 첫번째 특징인 볼륨(Volume)은 데이터의 양을 말한다. 그러나, 단순히 데이터의 양을 많이 수집, 저장 한다고해서 빅데이터라 불리지는 않습니다. 최근 사물인터넷의 활성 기로에서 데이터의 양 보다는 기존에 관리하지 않았던 데이터를 가져와 분석 하는 빅데이터 분석 사례가 늘고 있는 것과 같이 과거에 사용하지 않거나, 관리하지 않았던 데이터들을 사용의 범주로 가져오고 있는데요. 이렇게 등장한 데이터 역시 빅데이터라고 보면 됩니다. 관심 대상이 아니었던 데이터, 무심히 발생하거나 존재했던 데이터가 이제 빅데이터 분석의 대상이 되어 새로운 이벤트나 비지니스가 되는 형상입니다. 즉, 단순히 데이터의 양이 많다는 것이 아닌 과거에 사용하지 않았던지, 기존에 관리가 되지 않안던지 관계 없이 다양하고 방대한 데이터를 이용하여 활용할 수 있다고 말할 수 있는 것이 빅데이터의 특징인 볼륨으로 생각됩니다.
빅데이터의 두번째 특징인 데이터의 입출력 속도(Velocity)는 단순히 빠르다라는 의미와 함께 데이터의 수집과 적재 처리와 분석 - 예측(결과) 이 모든 단계의 신속성과 긴밀성 역시 속도의 개념으로 보는 것이 빅데이터 입니다. 단순히 고성능의 H/W(CPU, Storage)에서의 속도를 의미하지 않는다는 것이죠. 이러한 속도의 개념에서 전통적인 관계형 데이터베이스 (Oracle, DB2, MySQL 등)와 분산형 NoSQL(IBM Cloudant, Mongo DB, Cassandra, Couch DB 등) 데이터베이스로 구분하여 접근 할 필요가 있습니다. 전통적인 관계형DB는 데이터의 통합 위크플로워와 분석 위크플로워의 분리한 형태로 정밀한 분석이나 대용량 데이터의 신속한 분석을 주로 다루고 있습니다. NoSQL 데이터베이스는 분산형 DB로 분산DB와 분산처리로 실시간 또는 병렬처리로 Velocity를 커버합니다. 즉, 속도의 개념과 실시간 처리 모두가 빅데이터의 특징인 Velocity이라고 봐야 합니다.
빅데이터의 세번째 특징인 데이터의 다양성(Variety)은 앞서 말씀드린 첫번째 개념과 상충되는 부분이 있다고 생각됩니다. 볼륨에서도 언급한 것 처럼 새로운 데이터를 관심의 영역으로 가져온 것이 빅데이터라는 것입니다. 이렇게 다양한 데이터와 실시간으로 변화하는 데이터를 다루는 것이 바로 빅데이터의 특징이라는 보시면 됩니다.
'컴퓨터공학' 카테고리의 다른 글
전처리기의 종류 및 사용법, 중복 컴파일 방지 방법 (0) | 2022.08.10 |
---|---|
기능적 요구사항과 비기능적 요구사항을 비교 설명 (0) | 2022.08.09 |
시스템의 기능이 되는 요구의 정의에 대하여 인지하고 요구사항 정의가 어려운 이유 (0) | 2022.08.09 |