Data Intelligence 비지니스 사례 - 제조 공정의 품질 예측
이번 글에서는 제조 공정에서 발생하는 제품 품질의 이슈에 대해 개선하고 예방하기 위해 SAP Data Intelligence를 활용하여 품질 예측 모델의 개발 검증 및 실시간 스코어링 태스크를 통해 제조 공정의 품질을 실시간 모니터링하는 비지니스 사례를 소개합니다.
배경 및 목표
폴리머 제조 공정 과정에서 발생하는 제품 품질 이슈로 많은 비용과 시간이 낭비되고 있습니다.
공장 관리자는 제조 과정에서 품질이 저하될 때 데이터 패턴을 발견하여 품질 저하를 방지하기 위해 사전 예방 조치를 취하길 원합니다.
데이터 관리와 머신 러닝 기술을 활용하여 제조 과정에서 발생되는 제품의 센서 데이터를 실시간 모니터링하여 제품 품질을 예측하는 데이터 프로세스를 구축하려고 합니다.
데이터 프로세스 구성도
SAP BTP 솔루션인 Data Intelligence Cloud, DWC, SAC를 사용하여 구성합니다.
데이터 소스
- S/4HANA - Batch, Stock, Quality, Supplier, Notification Data
- OSISoft PI System - Sensor Data
SAP BTP
- Data Intelligence Cloud - 품질 예측 모형 개발, 실시간 스코어링 파이프라인 태스크
- Data Warehouse Cloud - Top Floor인 S/4HANA 마스터 데이터와 Shop Floor인 PI System의 센서 데이터를 결합, 예측된 결과 데이터 저장
- SAP Analytics Cloud - 원천 및 예측 데이터의 시각화
예측 모형 개발 및 검증
Data Intelligence의 ML Scenario Manager의 JupyterLab에서 Python과 HANA ML을 사용하여 예측 모델을 개발하고 검증합니다.
ML Scenario Manager - 모델 개발 관리
JupyterLab - 모델 개발 환경 도구
탐색적 데이터 분석(EDA)
DWC 연결 및 학습 데이터 조회
Label 결측치 Box Plot
Label Instance 수
Feature 상관 관계
예측 모델 개발 및 검증
분류 분석 모델 - XGBoot 알고리즘
분류 분석 모델 성능 평가 - AUC(Area Under the Curve)
ROC(Receiver Operating Characteristic) Curve
속성 중요도(Contribution)
Real-time Scoring Task
Data Intelligence의 Modeler에서 실시간 스코어링 처리를 위한 Pipeline를 개발하고 실행하여 자동화합니다.
• OSP 센서 데이터와 ERP 마스터 데이터를 결합 루틴 - Python Operator을 활용하여 프로그램 작성
• 실시간 스코어링 루틴 - DI Data Lake에 저장된 품질 예측 모형 읽어오기, NodeJS Operator를 활용하여 실시간 입력 데이터에 대한 스코어링 처리, 예측된 결과 데이터를 DWC Table에 실시간으로 저장
참고) 소스 코드는 github에 upload될 예정입니다.