🔧 활용 도구: Python Pandas · Power BI / Grafana · MLflow · Kafka · PostgreSQL / Data Lake
ETL 실습, 시계열 분석, 이상치 탐지 ML 모델, 실시간 KPI 대시보드 구축에 바로 사용 가능한 공정 센서 데이터를 생성합니다.
ETL 실습, 시계열 분석, 이상치 탐지 ML 모델, 실시간 KPI 대시보드 구축에 바로 사용 가능한 공정 센서 데이터를 생성합니다.
생성 설정
개 공장
개 라인
간격
행
센서 컬럼 선택
분석 난이도 (ML Difficulty)
이상 데이터 설정 (Anomaly Injection)
출력 포맷
// 생성 버튼을 눌러 시작...
-
총 행수
-
평균값
-
최댓값
-
최솟값
-
결측치
데이터 미리보기
🔍 품질 검사 데이터: 측정값 4개 컬럼 + OK/NG 라벨 + 불량 유형/심각도로 구성됩니다.
이진 분류 모델(OK/NG), 이상치 탐지, SPC(통계적 공정 관리) 실습에 활용하세요.
이진 분류 모델(OK/NG), 이상치 탐지, SPC(통계적 공정 관리) 실습에 활용하세요.
생성 설정
불량 유형
측정값 설정 (mean ± std)
분석 난이도
출력 포맷
// 생성 버튼을 눌러 시작...
-
총 검사수
-
양품 (OK)
-
불량 (NG)
-
불량률
데이터 미리보기
⚙️ 설비 유지보수 데이터: 런타임, 진동, 온도, 오일 레벨, RUL(잔여수명), 고장 라벨이 포함됩니다.
예지보전(PHM) 모델 — 고장 분류, RUL 회귀, failure_within_24h 이진 분류 실습에 활용하세요.
예지보전(PHM) 모델 — 고장 분류, RUL 회귀, failure_within_24h 이진 분류 실습에 활용하세요.
생성 설정
분석 난이도
출력 포맷
// 생성 버튼을 눌러 시작...
-
총 행수
-
고장 이벤트
-
24h내 고장예정
데이터 미리보기
🏭 생산 KPI 데이터: OEE, 가동률, 성능률, 품질률, UPH, 다운타임, 에너지 소비량이 포함됩니다.
OEE 대시보드, KPI 트렌드 분석, 예측 모델 실습에 활용하세요.
OEE 대시보드, KPI 트렌드 분석, 예측 모델 실습에 활용하세요.
생성 설정
개 공장
개 라인
시계열 특성
분석 난이도
출력 포맷
// 생성 버튼을 눌러 시작...
-
총 행수
-
평균 OEE
-
총 생산량
데이터 미리보기
관리자가 스트리밍을 시작하면 아래에 실시간 데이터가 표시됩니다. Google Sheets에 데이터를 실시간으로 받으려면 아래 안내를 따라 연결하세요.
스트림 상태
STOPPED
데이터 유형
-
컬럼 목록
생성 속도
-
총 메시지
-
MySQL 저장
-
Grafana 연결 정보 (MySQL)
아래 정보로 Grafana → MySQL Data Source를 설정하세요
MySQL
localhost:3306
teamchemy
teamchemy
강사에게 문의
실시간 스트림 뷰어
0 msg
// 관리자가 스트리밍을 시작하면 여기에 표시됩니다...
Google Sheets 실시간 연동
서버가 스트리밍 중 3초마다 내 Google Sheets로 데이터를 직접 전송합니다.
아래 Apps Script를 웹 앱으로 배포하고 생성된 URL을 등록하세요.
아래 Apps Script를 웹 앱으로 배포하고 생성된 URL을 등록하세요.
1
Google Sheets 열기 → 확장 프로그램 → Apps Script
2
위 코드 전체 복사 → 편집기에 붙여넣기 → Ctrl+S 저장
3
배포 → 새 배포 → 유형: 웹 앱 선택
4
실행 계정: 나 / 액세스 권한: 모든 사용자 → 배포
5
권한 요청 승인 → 웹 앱 URL 복사
6
아래 입력란에 URL 붙여넣기 → 등록 버튼 클릭
Power BI 실시간 연동
Streaming Dataset
Power BI 스트리밍 데이터 세트(API)의 Push URL을 등록하면,
스트리밍 중 3초마다 Power BI로 데이터를 자동 전송합니다. 실시간 대시보드를 바로 만들어보세요.
스트리밍 중 3초마다 Power BI로 데이터를 자동 전송합니다. 실시간 대시보드를 바로 만들어보세요.
1
powerbi.com → 내 작업 영역 → 새로 만들기 → 스트리밍 데이터 세트
2
API 선택 → 데이터 세트 이름 입력 (예: MFG_Stream)
3
값의 스트림 항목 추가 — 아래 컬럼 스키마 참고
4
기록 데이터 분석 ON (선택, 보고서 작성 시 필요)
5
만들기 → Push URL 복사
6
아래 입력란에 붙여넣기 → 등록
// 스트리밍 시작 후 자동으로 컬럼 목록이 표시됩니다
✓ Power BI 연결됨
📋 데이터 스키마 가이드: 각 탭에서 생성되는 데이터의 컬럼 정의, 타입, 범위를 확인하세요.
센서/공정 데이터 스키마
| 컬럼명 | 타입 | 설명 | 범위/예시 |
|---|---|---|---|
| timestamp | DATETIME | 측정 시각 (UTC) | 2024-01-01 ~ |
| factory_id | VARCHAR | 공장 ID | F01~F05 |
| line_id | VARCHAR | 생산라인 ID | L01~L10 |
| equipment_id | VARCHAR | 설비 고유 ID | EQ-F01-L01-01 |
| temperature_c | FLOAT | 공정 온도 | 180 ~ 250 ℃ |
| pressure_bar | FLOAT | 공정 압력 | 2 ~ 8 bar |
| vibration_mm_s | FLOAT | 진동 (RMS) | 0.1 ~ 3.0 mm/s |
| process_status | ENUM | 공정 상태 | RUNNING/ALARM/WARNING/STOP |
| shift | VARCHAR | 교대 근무 | 주간1/주간2/야간 |
설비 유지보수 스키마
| 컬럼명 | 타입 | 설명 | 범위/예시 |
|---|---|---|---|
| timestamp | DATETIME | 관측 시각 | 매 4시간 |
| equipment_id | VARCHAR | 설비 ID | PRESS-001~ |
| runtime_hours | INT | 누적 가동 시간 | 0 ~ 10000 |
| vibration_rms | FLOAT | 진동 RMS | 0.5 ~ 5.0 |
| rul_hours | INT | 잔여 수명 시간 | 0 ~ 720 |
| maintenance_label | ENUM | 정비 라벨 (ML 타겟) | NORMAL/ALARM/PM/FAILURE |
| failure_within_24h | INT | 24h내 고장 여부 | 0 / 1 |
품질 검사 스키마
| 컬럼명 | 타입 | 설명 | 범위/예시 |
|---|---|---|---|
| inspection_id | VARCHAR | 검사 일련번호 | INS-000001~ |
| lot_id | VARCHAR | 로트 ID (50개/로트) | LOT-0001~ |
| m1_value ~ m4_value | FLOAT | 측정값 (정규분포) | 설정값 기반 |
| inspection_result | ENUM | 검사 결과 (ML 타겟) | OK / NG |
| defect_type | VARCHAR | 불량 유형 | dimensional/surface/... |
| defect_severity | ENUM | 불량 심각도 | MINOR/MAJOR/CRITICAL |
| rework_flag | INT | 재작업 여부 | 0 / 1 |
생산 KPI 스키마
| 컬럼명 | 타입 | 설명 | 범위/예시 |
|---|---|---|---|
| date | DATE | 집계 날짜 | 일별/교대별 |
| oee_pct | FLOAT | OEE (%) | 0 ~ 100 |
| availability_pct | FLOAT | 가동률 (%) | 60 ~ 99 |
| performance_pct | FLOAT | 성능률 (%) | 60 ~ 99 |
| quality_pct | FLOAT | 품질률 (%) | 85 ~ 99.9 |
| uph | INT | 시간당 생산량 | 0 ~ |
| downtime_min | INT | 비가동 시간 (분) | 0 ~ |
| event | VARCHAR | 이벤트 | 설비고장/PM/자재부족/... |
활용 도구 매핑
| 도구 | 추천 데이터 |
|---|---|
| 🐍 Python / Pandas | 센서·KPI CSV → ETL, 상관분석, 통계 실습 |
| 📊 Power BI / Grafana | KPI CSV → OEE 대시보드, 실시간 센서 대시보드 |
| 🤖 MLflow / Scikit-learn | 설비 CSV (failure_within_24h 타겟) → 예지보전 모델 |
| 🔄 Apache Airflow | KPI/품질 CSV → 일배치 파이프라인, 스케줄링 |
| ⚡ Kafka / Flink | 스트리밍 JSONL → 실시간 이상감지, CEP |
| 📊 Google Sheets | 스트리밍 → Apps Script 웹훅 → 실시간 대시보드 |
| 🗄️ InfluxDB + Grafana | 스트리밍 → PHP 프록시 → InfluxDB → Grafana |