빅데이터 분석
거인 길들이기
거인 길들이기
빅데이터는 무시할 수 없으며, 분석 도구 성능의 급격한 저하 또는 단일 시스템의 분석에 필요한 데이터를 모두 보유할 수 없는 문제로 빅데이터 문제가 도래될 수 있습니다. 빅데이터 문제는 증가하는 데이터 양, 속도, 데이터의 다양성에 대처하기 위해 새로운 분석 방법을 요구합니다. 이를 위해 분산 컴퓨팅 패러다임이 필요하며, 안정적이고 확장 가능한 분산 컴퓨팅에 가장 많이 사용되는 오픈 소스는 Apache™ Hadoop® 입니다.
하둡이 빅데이터 분석을 시작하는 데에 필요한 모든 것은 아닙니다. 고속도로 네트워크가 자동차 운송에 프레임워크을 제공하는 것과 같이 하둡은 빅데이터 분석에 프레임워크만 제공할 뿐입니다. 고속도로 네트워크를 이용하기 위해 차량이 있어야 하는 것과 마찬가지로 하둡의 데이터 분석을 이용하기 위해 이러한 프레임워크의 고급 분석을 수행할 수 있는 새로운 툴이 필요합니다.
Megaputer는 빅데이터 분석을 위한 분산 컴퓨팅을 지원하는 고급 분석의 혁신 시스템을 제공합니다. PolyAnalyst-H™ 시스템은Hadoop®을 실행하는 상대적으로 낮은 등급의 기계 클러스터에서의 분산 저장 및 분석을 지원합니다.
PolyAnalyst-H는 고급 빅데이터의 고급 텍스트 분석을 실행하기 위한 사용하기 쉬운 시스템이며 이는 빅데이터 분석을 위한 툴의 광범위한 사용에 있어서의 어려움을 극복하도록 해 줍니다.
Hadoop® and Spark™ are registered trademarks or trademarks of the Apache Software Foundation.