9.3.17

Hadoop 기반 Data Lake를 통한 새로운 비지니스 분석 강화하기

다양한 데이터를 관리하는 것은 중요하지만 그것이 단지 끝을 의미하지는 않습니다. 정통한 관리자의 최종 목표는 비용 중심에서 데이터를 캡처하는 것이 아니라 비즈니스 가치를 제고하고 데이터에서 조직의 효율성을 높이는 것입니다. 이런 가치에 도달할 있는 길은 분석을 통한 것입니다. 이러한 맥락에서 Hadoop 기반 Data Lake 새로운 분석에 대한 Best Practice 제공할 있습니다.

1        과거의 분석을 보완하는 고급 분석

간단히 말해서 조직(기업) Reporting, OLAP SQL 기반으로 기존 분석을 보존해야 뿐만 아니라 마이닝, 클러스터링, 그래프 작성, 통계 자연 언어 처리 기술을 기반으로 고급 분석을 보완해야합니다.

전통적인 형태의 분석 보고는 대부분 알고 있고 시간이 지남에 따라 모니터링해야하는 사실 비즈니스 엔티티를 추적하는 사용됩니다. 새롭고 진보된 형태의 분석 기술은 새로운 통찰력을 형성하고 새로운 사업 기회를 개발하기 위해서 이전에 모르는 사실을 발견하고 매우 다양한 사실, 사건 개체 특성( : 고객 행동, 파트너 안정성 운영 메트릭) 함께 연결하는데 사용합니다.

전통적인 분석은 표준 보고서 큐브에서 있듯이 매우 정확하고 구조화 출력을 위해 관계형 플랫폼에서 깨끗한 데이터를 필요로 하는 경향이 있습니다. 그러나 오늘날의 분석은 지나친(강박적인) 정확도  또는 구조화가 필요없이 가치의 발견과 복잡한 연결을 촉진하기 때문에 원시적이고 상세한 데이터에 중점을 두고 있습니다.

데이터 요구 사항의 차이점을 고려할 , 점점 많은 데이터 웨어하우스 데이터 관리 팀이 관계형 데이터베이스와 Hadoop 기반 Data Lake 모두에서 작업을 합니다.

2        다양한 형태의 동시 분석

분석에서 가장 강력한 트렌드 중 하나는 각 방법이 동일한 문제에 대해 다른 것을 알려주기 때문에 여러 형태의 분석을 사용하는 것입니다. 여러 분석 결과를 함께 연결하면 비즈니스 이점에 대한 포괄적 인 통찰력을 얻을 수 있습니다.

Hadoop 기반 Data Lake는 원본 상태의 데이터를 캡처 및 관리 할 때 여러 가지 형태의 분석을 위해 쉽게 용도를 변경할 수 있습니다. 개별 Data Lake의 설계 및 데이터 내용에 따라 OLAP, SQL 및 기타 관계형 기술을 기반으로 한 집합 기반 분석과 마이닝, 클러스터링, 그래프, 통계 및 NLP를 기반으로 하는 알고리즘 분석을 모두 지원할 수 있습니다.

3        통합된 셀프 서비스의 베스트 사례

오늘날 가장 바람직한 새로운 분석 기법 중 하나는 여러 가지 관련 셀프 서비스, 데이터 중심 작업을 순서대로 연결하는 것입니다. 일반적으로 이 순서는 데이터 액세스, 탐색, 준비, 시각화 및 분석입니다.

예를 들어 사용자가 데이터에 액세스하고 탐색 할 때 가장 최근의 변동 문제의 근본 원인 또는 수익을 저해하는 비용 센터와 같은 의미 있는 정보를 발견 할 수 있습니다. 발견 후에는 학습 한 내용을 기반으로 데이터 세트를 신속하게 준비한 다음 사전 처리 된 데이터 세트를 동료들과 공유하거나 추가 분석 및 시각화를 위해 데이터 세트를 다른 도구로 원활하게 이동하고자 합니다.

여러 가지 도구 유형 (다중 단계 프로세스에서 한 단계에 하나씩)이 사용되며 원활한 핸드 오프를 위해 도구가 긴밀하게 통합되어 있다고 가정합니다. 이 다단계 분석 프로세스는 Hadoop 기반 데이터 레이크와 잘 작동하지만 사용자에게 셀프 서비스를 지원하는 통합 도구 세트가 제공 될 때만 효과적입니다. 셀프 서비스는 모든 사람을 위한 것이 아닙니다. 신중하게 관리되는 특정 사용자 클래스에 제공 될 때 성공합니다.

4        인간 언어, 텍스트 기타 비정형 데이터의 가치

이론적으로 파일에 모든 데이터 또는 기타 디지털 정보를 넣을 수 있으며 Hadoop은이를 관리하고 분석 처리를 위해 사용할 수 있습니다. 구조화되지 않은 데이터 범주 내에서 파일 기반의 인간 언어 및 기타 텍스트는 이미 분석을 통해 활용되고 있습니다.

"킬러 앱"은 고객, 잠재 고객 및 다른 사람들 (아마도 콜센터 앱의 소셜 미디어 또는 텍스트 필드에서 가져온 의견)의 소리들을 스캔하여 당신의 회사, 제품 및 서비스에 대한 시장의 내용을 결정하는 감성 분석입니다.

또 다른 예로, 보험 청구 프로세스는 손실에 관한 텍스트를 대량으로 캡처합니다. 보험 회사는 이것을 호수에서 수집하고, 관심 대상 엔티티에 대한 사실을 추출하고, 출력 데이터를 사용하여 사기 탐지 및 보험 수리적 계산에서 분석 응용 프로그램을 확장합니다. 비슷한 텍스트 기반 분석은 의료 서비스의 환자 결과 분석 (보험 회사와 서비스 제공 업체)에서 볼 수 있습니다.

No comments:

Post a Comment