PolyAnalyst scores extremely well by providing a complete environment in which any research worker could data mine his or her own data.
David McIlroy, Chief Analyst of Master Foods, Belgium
빠르고 적절하게
사람들은 의사소통하고 그들의 경험들을 자연 언어에 담아냅니다. 따라서 기업에 사용 가능한 데이터 80% 이상이 자유 텍스트로 저장됩니다. 이러한 데이터는 귀중한 인사이트를 제공할 수 있지만, 이는 텍스트들을 이용할 수 있게 해 주는 올바른 툴을 사용할 때 비로소 가능합니다.
텍스트 문서에서 정보를 추출하는 것은 쉽지 않습니다. 언어는 수많은 단계의 구조와 복잡성을 가지고 있어서 텍스트 문서에 산재된 지식을 추출하기 쉽게 만드는 툴이 필요합니다. 자동화된 텍스트 분석이 업무를 얼마나 간편하게 하는지 확인해보세요.
텍스트 분석의 주된 업무는 방대한 텍스트 데이터에서 관련 사실을 추출하고 정리하는 것입니다. 예를 들어 기업은 뉴스 보도에서 기업 관계, 기술, 제품, 인수 비용, 핵심 직원 등과 같은 경쟁사에 관한 정보를 추출해야 할 수 있습니다. 제약회사는 증상, 사용법, 기간, 형태, 적용 빈도, 가능한 부작용 등 약의 사용을 설명하는 사실을 알기 위해 환자 의학 기록을 자세히 살펴봐야 합니다. Megaputer는 다양한 분야에서의 사실 추출에 필요한 툴과 솔루션을 제공합니다.
종종 미리 정의된 카테고리와 연관된 텍스트 문서 패턴을 식별해야 합니다. 이러한 작업은 문서 코딩(document coding)으로 불리우며, 콜센터 기록, 텍스트 설문 응답, 리뷰 등의 분석에 사용됩니다. 같은 의미를 전달하는 다른 단어들은 같은 범주로 분류 되어야 합니다. Megaputer는 언어학과 의미론과 패턴인식의 결합에 기반하거나 머신러닝에 기반하여 문서 코딩을 자동화하는 툴을 제공합니다.
상당한 문서 모음을 구조화 할때, 분석하려는 문서의 내용이나 구조에 대한 가이드가 없을 수도 있습니다. 이러한 경우 처음 해야하는 일은 문서 클러스터링을 다루는 것이고, 이는 문서가 다루고 있는 대략적인 주제의 모음을 정하고, 다른 주제에 속하는 문서를 다른 그룹으로 분류하는 일을 포함합니다. Megaputer는 잠재 의미 분석(Latent Semantic Analysis)과 다른 고급 분석에 기반한 문서 클러스터링을 제공합니다.
분류의 목표는 문서의 핵심 주제를 구분하는 것입니다. 기업은 매일 수천건의 고객 요청이 있으며, 각각의 요청은 각 분야마다 능통한 지원 담당자에 의해 다뤄져야 합니다. 각각의 요청이 어떤 담당자에게 지정되는지를 결정하기 위해서는, 요청의 핵심 주제를 자동적으로 구분하고 다양한 담당들의 핵심 역량을 비교한 후 매치시켜야 합니다. 당사는 문서를 쉽게 분류할 수 있는 유용한 문서 분류 툴을 제공합니다.
사건, 브랜드, 제품에 대한 여론의 정확한 평가는 기업이 현명한 결정을 내리는데 도움을 줍니다. 리뷰어가 대상에 대한 태도를 분명하게 나타내면 감정 분류는 쉬워집니다. 하지만 예를 들어 “샤워실에 뜨거울 물이 없습니다.” 와 같은 리뷰는 사실에 기반해 있고 부정적 단어는 없지만 근본적인 감정은 다른 이야기를 하고 있습니다. Megaputer는 다양한 상황에서의 감정 분석을 가능하게 하는 툴과 솔루션을 제공합니다.
모든 문서를 읽기 전에 짧은 써머리를 볼 수 있는 능력은 분석가의 업무 효율성을 크게 향상시킵니다. 기존의 문서 요약은 인간 분석가에 의해 행해졌지만, 폭발적으로 증가하는 문서를 사람이 분석하기는 힘들어지고 있습니다. Megaputer는 모든 문서를 읽고 자동적으로 요약해주는 툴과 솔루션을 제공해주어, 가장 중요하고 유용한 소수의 문장들을 찾아줍니다.
다른 국가의 사람들은 각자의 언어로 텍스트 분석을 해야 합니다. Megaputer는 16가지 언어의 모국어 텍스트 분석을 위한 정교한 자연어 처리 툴을 제공합니다. 모든 문서를 하나의 언어로 변환하고 텍스트 분석을 하고자 한다면, 기계 번역을 이용해도 됩니다 (당사도 지원 가능합니다). 하지만 기계 번역은 특히 아시아권 언어에 있어서 수많은 에러를 발생시킵니다. 오리지널 언어의 모국어 자연 언어 처리(NLP)는 더욱 정확한 분석을 전달합니다.
PolyAnalyst scores extremely well by providing a complete environment in which any research worker could data mine his or her own data.
David McIlroy, Chief Analyst of Master Foods, Belgium