결측치(Missing Value)란 데이터셋에서 값이 기록되지 않은 항목입니다. 결측 비율과 패턴(무작위·연속·컬럼 집중)에 따라 분석 결과와 보간 전략이 달라집니다. 샘플 데이터 또는 CSV / XLSX 파일을 직접 업로드해 탐지 결과를 확인하세요.
데이터 소스
결측 비율 15% 패턴
이상치 비율 5%
전체 셀 수
결측 셀 수
결측 비율
완전한 행 비율
이상치 셀 수
이상치 비율
결측 히트맵 — Y축: 변수 · X축: 관측치
정상
결측
이상치
컬럼별 결측 비율
시간 축 결측 분포
분석을 실행하면 해석이 표시됩니다.
이상치(Outlier)는 다른 데이터와 크게 다른 값으로, 센서 오류·이벤트·노이즈 등이 원인입니다. Z-Score는 평균·표준편차 기반, IQR은 사분위수 기반으로 이상치를 탐지합니다. 업로드한 파일이 있으면 해당 데이터로 자동 전환됩니다.
데이터 소스
이상치 강도 컬럼 방법
Z-Score 임계값 2.5 IQR 배수 1.5
전체 관측치
탐지된 이상치
이상치 비율
정상 범위
산점도 — 이상치 강조
정상
이상치
분포 히스토그램 + 탐지 경계
탐지된 이상치 목록
#인덱스Z-ScoreIQR 판정상태
탐지 실행 후 결과가 표시됩니다
분석을 실행하면 해석이 표시됩니다.
결측치 보간(Imputation)은 누락된 값을 통계적·수학적 방법으로 채우는 과정입니다. 방법에 따라 결과가 크게 달라지며, RMSE로 원본 대비 정확도를 비교할 수 있습니다. 업로드한 파일이 있으면 해당 데이터로 자동 전환됩니다.
데이터 소스
결측 비율 20% 패턴 컬럼
보간 방법 선택
보간 전/후 비교
원본 (참조)
결측 포함 데이터
보간 결과
방법별 RMSE 비교 (낮을수록 정확)
현재 방법 RMSE
최우수 방법
최저 방법
보간 실행 후 결과가 표시됩니다.
박스플롯(Box Plot)은 Min · Q1 · Median · Q3 · Max 5가지 요약 통계를 하나의 그래프로 시각화합니다. 단계별로 추가 버튼을 눌러 각 요소가 어떻게 박스플롯을 구성하는지 순서대로 확인하세요.
데이터 소스
컬럼
원시 데이터
단계별 박스플롯 구성
1 / 6
5수치 요약 통계 — 단계별 공개
통계량단계
박스플롯 시뮬레이션