서버사이드 Python NLP — KoNLPy · scikit-learn · wordcloud 라이브러리를 활용한 한국어 텍스트 전처리 실습입니다.
엑셀/CSV를 업로드하거나 텍스트를 직접 입력하고 분석을 실행하세요. Pyodide 없이 FastAPI 서버에서 실행되어 빠릅니다.
KoNLPy OktKoNLPy KkmaTF-IDFN-그램워드클라우드품사 분포
📂 데이터 입력
📂
파일을 드래그하거나 클릭하여 선택
.xlsx · .xls · .csv · .txt / 텍스트 컬럼 자동 감지
⚙️ 분석 설정
토크나이저
품사 필터
최소 글자 수
최대 단어 수
추가 불용어 (쉼표 구분)
빈도 Top 20
전체 빈도 테이블
#
단어
빈도
비율
TF-IDF 점수 Top 20
TF-IDF 테이블
#
단어
점수
💡 TF-IDF(Term Frequency–Inverse Document Frequency) — 문서 전체에서 자주 쓰이지 않지만 특정 문서에서 자주 등장하는 단어에 높은 점수를 부여합니다.
바이그램 (연속 2-단어 쌍) Top 20
💡 바이그램 — 연속으로 등장하는 단어 쌍의 빈도입니다. 함께 자주 쓰이는 단어 조합을 파악할 수 있습니다.