demo.mp4
영어 문장의 문법성 오류 및 오타를 자동으로 교정하는 GEC (Grammatical Error Correction) 프로젝트입니다.
RoBERTa 기반 GEC 모델을 파인튜닝하여, 실제 학습된 모델이 교정한 결과를 Gradio 웹 인터페이스로 시각화합니다.
roberta_gector_k5000_noCE_1900K폴더 내 학습된 모델(model.safetensors)을 불러와 실제 추론 수행
- 문장 내 오류(시제, 단수/복수, 철자, 어순 등)를 인식해 자연스럽게 교정
| 상태 | 색상 | 의미 |
|---|---|---|
| 🟥 | 빨간색 | 오류 단어 |
| 🟩 | 초록색 | 교정 단어 |
- 모든 교정 결과(입력문장, 교정문, 예측 태그)를
correction_log.csv로 자동 저장
- 웹 UI에서 교정 결과를 CSV 파일로 즉시 다운로드 가능
아래 명령어 한 줄로 실행 환경을 자동 세팅할 수 있습니다.
pip install -r requirements.txtrequirements.txt에는 torch, transformers, gradio, numpy 등 실행에 필요한 주요 라이브러리와 버전이 포함되어 있습니다.
python app3.py실행 후 브라우저에서 자동으로 열립니다: http://127.0.0.1:7860
- 문장을 입력
- [교정하기] 버튼 클릭
- 아래에 빨강/초록 하이라이트로 수정 차이 표시
- 교정 결과를 CSV로 다운로드 가능
| 항목 | 내용 |
|---|---|
| Base Model | RoBERTa |
| Fine-tuned Task | Grammar & Spelling Error Correction |
| Training Dataset | 약 1.9M 문장 (synthetic + BEA 기반) |
| Training Objective | Token-level edit-tag classification (KEEP, REPLACE, DELETE, ADD, TRANSFORM 등) |
| 이름 | 역할 | 연락처 |
|---|---|---|
| 이서율 (SeoYool Lee) | AI / NLP Research & Development | 📧 dldmstj0531@gmail.com |
| 오정탁 (Jungtak Oh) | AI / NLP Research & Development | 📧 jungtak99@gmail.com |
| 김아람 (Ahram Kim) | AI / NLP Research & Development | 📧 ahram0223@naver.com |
| 황호성 (Hosung Hwang) | AI / NLP Research & Development | 📧 hhs6228@gmail.com |
| 박재영 (Jaeyoung Park) | AI / NLP Research & Development | 📧 kingjea0624@gmail.com |
Team "오탁수정" (LikeLion Team 2)