18.9.17

SAP Data Hub 소개

1         데이터 관리의 새로운 과제

기업은 다양한 크기의 데이터를 관리하고 오늘날 비즈니스 가치를 추출 엄청난 어려움에 직면 있습니다. 데이터는 사실상 모든 방향에서 비즈니스로 유입됩니다. 새로운 기술 비즈니스 변형은 촉매 역할을 하며 클라우드, 모바일, IoT (Internet of Things) 소셜 미디어에서 데이터 량이 급격히 증가합니다. 데이터는 계속 흐르고 볼륨은 계속 증가합니다. 모든 데이터의 잠재력을 활용할 있는 기업은 가치를 실현하고 시장의 혼란을 이기고 이끌어 있는 방법을 찾을 있습니다. 그러나 다른 사람들에게는 이러한 급격한 증가가 있을 있으며, 급속하게 성장하는 이기종 분산 데이터를 모든 크기, 형식 형태로 관리하는 것이 더욱 어렵습니다 [그림 1].

그림 1 엔터프라이즈 데이터 환경의 복잡도 증가

엔터프라이즈 데이터 환경의 주요 문제점은 다음과 같습니다.
1. 데이터는 기업 전체에서 사일로 (다양한 형식의 파일, 하나 이상의 Hadoop / Data Lake, DWH (multiple data warehouses)) 보관됩니다. 사용자 그룹 (IT, 비즈니스 분석가, 데이터 엔지니어, 데이터 과학자 데이터 담당자 포함) 데이터에 쉽게 액세스하고 작업 없습니다. 사용 가능한 도구를 사용하여 데이터를 엔터프라이즈 데이터 비즈니스 프로세스와 연결하는 것은 종종 복잡하고 시간이 많이 걸리고 비용이 많이 듭니다.
2. 데이터 기술은 기업의 준비가 부족한 경우가 많습니다. 데이터 이니셔티브를 위한 여러 기술, 종종 서로 다른 기술을 사용하는 복잡한 시스템 환경에 대한 거버넌스, 시스템 전반에 걸친 처리 일정 계획 자동화, 개별 기술의 분리 모니터링 추적 기능, 보안 액세스 제어 관리가 거의 없거나 부족합니다.
3. 자원에 대한 높은 투자로 기업 전체에서 시나리오를 생산하기위한 많은 노력과 비즈니스 요구를 해결하기위한 많은 통합 (오픈 소스) 기술 – Machine Learning, Hadoop, Spark, Kafka, Casandra 필요합니다. 생산 시스템에서 서로 다른 기술 간의 높은 통합 노력은 비즈니스 가치 창출을 방해합니다.
4. 데이터 이니셔티브의 가치를 구현, 확장 창출하기 위해서는 전문화 기술이 필요합니다. 기업은 모든 데이터를 가치에 따라 효율적으로 저장하고 액세스하기를 원합니다. 개별 요구 사항을 가진 다양한 개발자 그룹, 데이터 과학자, 비즈니스 웨어하우스 관리자 비즈니스 분석가 간의 강력한 협력이 필요합니다. 개발자, 데이터 과학자, 비즈니스 분석가 관리자가 사용하는 도구는 다릅니다. 따라서 비즈니스 시나리오를 수행하기 위해 많은 수의 도구와 기술이 정기적으로 필요하므로 비용과 복잡성이 증가하고 프로세스 속도가 느려집니다. 결과적으로 데이터 이니셔티브에 대한 대규모 투자는 유형의 비즈니스 가치로 쉽게 전환되지 않습니다.

2         SAP DATA HUB 사용하여 모든 사용자를 위한 빅 데이터와 엔터프라이즈 데이터 관리

SAP Data Hub (그림 2) IT, 비즈니스 분석가, 데이터 과학자, 데이터 엔지니어링 데이터 담당자(steward) 같은 모든 사용자 그룹의 전반적인 환경에서 데이터를 처리하고 조율하는 엔터프라이즈 서비스 전반의 데이터 기반 프로세스를 위한 통합 계층을 제공합니다. 디지털 환경에서 데이터를 통합하고 준비하여 비지니스 의사결정을 합니다. 오픈 소스 통합, 클라우드 배포 타사 인터페이스를 갖춘 개방형 데이터 중심 아키텍처를 제공합니다. SAP Data Hub 내장 SAP Vora에서 제공하는 대규모 분산 처리 서버리스(serverless) 컴퓨팅 기능을 활용합니다.
SAP Data Hub 새로운 범주의 소프트웨어 솔루션을 구축하고 점점 다양한 데이터 환경에서 데이터 통합 데이터 중심 프로세스 구축과 같은 기업 고객에게 새롭고 어려운 문제에 대한 종합적인 해답을 제시합니다. 솔루션은 복잡한 환경에서 데이터 통합, 데이터 조정(Orchestration) 데이터 거버넌스 기능을 처리하고 대형 데이터 처리를 활용하여 서버리스 컴퓨팅 패러다임을 기반으로 독보적 강력한 데이터 파이프 라인을 만듭니다. 데이터 프로세스는 원활하고 통합 엔터프라이즈 모니터링 랜드 스케이프 관리 기능을 통해 전사적으로 관리, 공유 분산 있습니다.

그림 2 SAP Data Hub 아키텍처

SAP Data Hub 프레미스, 클라우드 또는 하이브리드 환경에 배포 있도록 제작되었습니다. 기존 고객은 데이터 통합, 데이터 가상화 데이터 복제를 위한 SAP Data Service, SLT, SAP HANA Smart data Integration 같은 데이터 통합 ​​도구를 계속 사용하지만 SAP Data Hub 사용하면 기본 통합 도구의 통합 엔드 엔드 모니터링의 추가 이점을 누리게 됩니다.
SAP Data Hub에는 엔터프라이즈 데이터를 데이터와 연결하는 엔드 엔드 데이터 환경을 관리하기위한 허브 관리(Hub Management) 위한 최신 UI 포함되어 있습니다. 데이터 과학자를 위한 랜드 스케이프 세그먼트 사본 생성이 가능하며, 이것은 데이터 거버넌스 요구 사항을 충족시키기 위해 지우거나 파괴 있으며 리소스 최적화를 위한 운영 환경과 격리를 제공합니다. 정책 관리 기능에 의해 제공되는 세분화된 엔드 엔드 보안을 통해 기업 대용량 데이터의 모든 데이터에 대한 액세스 제어를 일관되게 관리합니다.
데이터 검색 기능에는 원본을 떠나지 않고도 기본적으로 데이터 프로파일 링이 포함됩니다. 모든 형태의 데이터 메타 데이터 저장소를 관리하여 데이터 계보를 제공하고 영향 분석을 가능하게 합니다. SAP Data Hub에서 기본적으로 SAP EIM 도구가 제공하는 풍부한 데이터 변환, 품질 풍부함을 제공합니다.
SAP Data Hub 강력한 기능 하나는 데이터를 다른 형식 ( : AWS S3, HDFS)으로 연결하고 분석을 위해 SAP Vora 액세스 있게 해주는 데이터 파이프라인입니다. 모든 기능은 그림 3 요약되어 있습니다. 기존 데이터 처리 도구를 사용하고 SAP Data Hub에서 조정할 있을 뿐만 아니라 사용하기 쉬운 고급 데이터 파이프 라인을 제공하여 필요한 경우 다양한 소스에서 필요한 데이터를 이동할 있습니다. Amazon S3 Hadoop HDFS, HDFS SAP Vora, SAP Vora HDFS 변환합니다.

그림 3 SAP Data Hub 1.1 주요 기능

3         데이터 관리 게임의 변화

SAP Data Hub 엔터프라이즈 데이터 관리에서 게임 체인저입니다. 솔루션의 목표는 현재 엔터프라이즈 데이터에서 사용할 있는 것과 동일한 풍부한 데이터 액세스, 데이터 변환, 데이터 품질, 데이터 보강(enrichment), 데이터 관리, 데이터 흐름/계보(lineage) 영향 분석 기능을 데이터로 제공하는 것입니다.
SAP Data Hub 현대 기업에서 복잡한 데이터 네트워크에 대한 전례 없는 가시성과 액세스를 제공합니다. Hadoop Amazon S3 같은 소스에서부터 SAP HANA ERP 이르기까지 전체 데이터 환경에 대해 광범위하고 자세하며 이해하기 쉬운 관점을 제공함으로써 SAP Data Hub 조직이 데이터 소스, 사용, 상호 연결, 품질 영향을 깊이 이해할 있도록 도와줍니다. 이를 통해 기업은 데이터로부터 새로운 기회를 찾고 새로운 데이터 문제를 해결하며 데이터가 필요한 곳으로 이동하도록 보장합니다.
이는 특히 온라인 마케팅 구매부터 디지털화 공급 유통 체인에 이르기까지 상업 또는 산업 인터넷을 통해 많은 비즈니스가 실행될 관련이 있습니다. 비즈니스 성공이 점차 커짐에 따라 복잡한 데이터 시스템의 정보와 여러 데이터 유형의 대용량 데이터를 연결하여 비즈니스 결정 실행을 유도하는 기능을 요구합니다.

기능 차별화 요소
데이터가 어디에 있든 (사내 구축 , 클라우드, 애플리케이션, 데이터 웨어하우스, 데이터 레이크, SAP 또는 SAP 소스) 데이터를 중앙 집중화하지 않고도 데이터 환경과 상호 연결을 완전하고 완벽하게 파악할 있습니다.
데이터 상태(health) 요약을 제공하는 데이터 품질 스코어 카드를 만듭니다.
데이터 품질, 데이터 액세스 가능성 데이터 파이프 라인과 관련된 문제를 확인하고 문제를 해결합니다.
데이터 액세스 가능성 데이터 정책을 손쉽게 관리하여 기업 전체의 보안을 통해 적절한 데이터 거버넌스를 보장합니다.
시스템을 통해 흐르는 데이터의 출처와 내역을 이해할 뿐만 아니라 기본 데이터의 변경이 데이터 계보(lineage) 영향 분석을 통해 결과 분석 또는 다른 데이터 종점에 미치는 영향을 확인합니다.

장점
출발지 또는 목적지와 상관없이 이동해야하는 곳에서 신속하게 데이터를 가져옵니다.
다양한 데이터 소스 응용 프로그램에서 작업하여 포괄적 개방형 데이터 환경 조성
빠르고 강력한 데이터 파이프 라인 생성
복잡한 다중 단계 데이터 파이프 라인을 손쉽게 만들 있습니다.
소스에서 데이터 수정 보강
데이터 흐름을 조율합니다.
분산 로컬 처리로 강력한 데이터 흐름을 신속하게 실행합니다.
데이터 흐름 가시성, 무결성 보안 보장
전체 환경에서 시스템 자산 이해
액세스 정책 생성 적용
계보 영향 분석 수행

4         SAP Data Hub 장점 활용

데이터 과학자, 개발자, 데이터 관리자 비즈니스 분석가의 모든 사용자 그룹을 대상으로 다양한 데이터 소스를 사용하여 복잡한 엔터프라이즈 환경에서 여러 엔터프라이즈 데이터 소스를 연결하는 필요한 데이터 관리 문제가 있는 경우 SAP Data Hub 살펴보십시오. 사용 가능한 기능 로드맵을 확인하여 사용 사례를 SAP Data Hub 비교하고 SAP Data Hub 프로젝트를 지금 시작하십시오. SAP Data Hub 시작하려면 sap.com/datahub 방문하십시오.