서버사이드 Python NLP — KoNLPy · scikit-learn · wordcloud 라이브러리를 활용한 한국어 텍스트 전처리 실습입니다. 엑셀/CSV를 업로드하거나 텍스트를 직접 입력하고 분석을 실행하세요. Pyodide 없이 FastAPI 서버에서 실행되어 빠릅니다.
KoNLPy Okt KoNLPy Kkma TF-IDF N-그램 워드클라우드 품사 분포
📂 데이터 입력
📂
파일을 드래그하거나 클릭하여 선택
.xlsx · .xls · .csv · .txt / 텍스트 컬럼 자동 감지
⚙️ 분석 설정
토크나이저
품사 필터
최소 글자 수
최대 단어 수
추가 불용어 (쉼표 구분)
빈도 Top 20
전체 빈도 테이블
#단어빈도비율
TF-IDF 점수 Top 20
TF-IDF 테이블
#단어점수
💡 TF-IDF(Term Frequency–Inverse Document Frequency) — 문서 전체에서 자주 쓰이지 않지만 특정 문서에서 자주 등장하는 단어에 높은 점수를 부여합니다.
바이그램 (연속 2-단어 쌍) Top 20
💡 바이그램 — 연속으로 등장하는 단어 쌍의 빈도입니다. 함께 자주 쓰이는 단어 조합을 파악할 수 있습니다.
품사 분포
품사별 통계
모양 배경
wordcloud
워드클라우드 생성 중...