2012년 10월 20일 토요일

기업의 성공적인 빅데이터 관리 플랫폼 3가지 원칙

1. 적절한 빅데이터 저장소 선택
자사 요구에 가장 적절한 기술이 무엇인지 먼저 이해해야 한다.
어떤 기업에는 NoSQL와 같은 것이 더 적절한 빅데이터 저장소 및 프레임워크 소프트웨어가 될 수 있다. 하둡은 뛰어난 확장성을 제공하고 구현 비용도 상대적으로 저렴하다. 또 혼합되어 있는 데이터 유형을 처리하는 데 탁월하다. 그러나 실시간 데이터 스트리밍에는 적절하지 못하다.
하둡이나 NoSQL, 분석 데이터 스토어 등 백엔드 기술을 선택할 때 가장 중요한 것은 자사 데이터의 볼륨, 다양성, 속도에 매칭되는 기술이 무엇이냐는 것이다. 각 기술들은 모두 장단점을 갖고 있으며 기업은 백엔드 기술을 선택하기 전에 이러한 장단점부터 이해하고 있어야 한다.
2. 깊이 있는 현업 지식을 갖출 것

빅데이터 프로젝트는 근본적으로 소프트웨어 및 컴퓨팅 기술자들의 투입을 요구한다. 그러나 이것이 비기술자를 배제하라는 뜻은 아니다. 다른 어떤 프로젝트보다도 빅데이터 프로젝트에는 비즈니스 현업 인력과 기술 인력이 협력이 요구된다. 어떤 데이터가 어디에 사용되는지, 얼마나 빨리 실무에 반영할 수 있는지, 당면한 비즈니스 문제를 해결할 수 있는지는 현업에서 지식을 제공할 수 있다. 현업의 지식은 빅데이터 프로젝트에 대단히 중요하며 이 지식이 배제될 때 기업은 많은 시행착오를 거치게 된다. 결과적으로 잘못된 판단으로 빅데이터 프로젝트 또한 실패하게 될 것이다.
3. 적절한 리포팅과 분석 툴을 적용할 것

빅데이터용 리포팅과 분석 툴들은 세 가지 주요 특성

첫째 빅데이터, 전통적인 데이터 등을 포함해 모든 필요한 데이터 소스에 곧바로(native) 인텔리전트 액세스를 제공해야 한다는 것이다. 모든 필요한 데이터 소스에 제공해야 한다는 것이다. 오늘날 기업들은 전통적이지 않은 유형의 빅데이터를 전통적인 유형인 관계형 데이터와 결합 및 혼합하려 하고 있다.

두 번째, 데이터 아키텍처는 데이터 볼륨 확장에 따라 필연적으로 확장된다. 따라서 기업은 확장성이 뛰어나고 현대적 아키텍처를 구현해야 한다. 그렇지 않을 경우 프론트엔드의 리포팅과 분석 툴은 데이터 양이 기하학적으로 증가하게 되면서 기능을 제대로 수행하지 못할 수 있다.

세 번째로 기업이 사용하는 툴은 반드시 빅데이터의 지연 현상이나 다양성을 처리할 수 있어야 한다. 시스템 센서나 폭주하는 웹사이트로부터 데이터가 대용량 데이터 볼륨 내로 실시간 전송되고 데이터가 들어오는 즉시 사용 가능한 것으로 신속히 만들어낼 수 있어야 한다.

이때 중요한 것은 기업이 해결하려는 비즈니스 문제가 무엇인지 알고 있어야 한다는 것이다. 또 당면 과제를 해결하기 위해 얼마나 빨리 이 데이터를 사용할 수 있느냐도 중요하다. [출처] 전자신문

댓글 없음:

댓글 쓰기