- 프로젝트: lawRadar
- 앱
-
billview: 의안별 주요 내용 DB 보유
-
geovote: 우리 지역구 의원이 어떤 의안에 찬/반 DB 보유
-
의원 성향 분석 시스템: 지역구별 의원의 표결 패턴을 트리맵으로 시각화
-
법안 개정 흐름 추적: 시간순 법안 변화를 직관적으로 표현하는 타임라인 시각화
-
맞춤형 추천 엔진: 사용자 관심사 기반 법안/의원 추천 알고리즘 구현
-
실시간 입법 통계: 대수별, 정당별, 지역별 입법 활동 통계 대시보드 구축
-
주제: 국회 의안 및 의원 데이터를 활용한 입법 활동 분석 서비스 개발
-
목표: 복잡한 정치/법안 정보를 데이터 기반으로 직관적으로 제공하여 국민의 정치 효능감 및 투명성을 강화
- 기존 국회 의안정보시스템은 데이터 접근성과 시각화 부족 → 국민들이 법안/의원의 실제 활동을 이해하기 어려움
- 정치 무관심 및 불신이 심화되는 상황에서 데이터 분석 + 시각화 기반 서비스 제공 필요
- 데이터 수집
- 의안정보시스템 OPEN API 및 OPEN WATCH 활용하여 6,500여 건 법안 데이터와 의원별 표결 데이터 190만 건 수집
- 의원(943명)의 프로필, 지역구, 정당 정보 크롤링 및 정제
- 데이터 전처리
- 불용어 사전 구축 및 법률 문서 특화 전처리 수행
- TF-IDF, N-gram 기반 텍스트 분석을 통한 핵심 키워드 추출
- 법률 문서의 복잡성을 줄이기 위한 요약 규칙 정의
- 데이터 분석 및 모델링
- K-means, Elkan 알고리즘 기반 클러스터링 → 법안 주제 자동 분류
- GEMINI API 활용하여 법안 요약 및 주제 카테고리 분류 자동화
- 카드뉴스용 메시지 생성 모델 구축 (시민 친화적 문구 변환)
- 시스템 개발
- DB 모델링 (6,543개 법안, 1,942,711개 표결 데이터, 의원 정보 통합)
- Flask + AWS EC2 환경에서 웹서비스 프로토타입 배포
- 법안 개정 흐름 및 의원별 투표 성향 시각화 (Treemap, 차트)
- Python: 데이터 수집, 분석, API 연동
- Pandas, NumPy: 데이터 처리
- Scikit-learn: 클러스터링, 키워드 추출
- NLTK, KoNLPy: 형태소 분석, 불용어 처리
- Flask: 웹 서비스 구현
- MySQL: 대규모 법안/표결 데이터베이스 구축
- AWS EC2: 서버 배포 및 운영
- Matplotlib, Seaborn, D3.js: 데이터 시각화
- 서비스 기능 구현
- 지역구 의원 성향 및 투표 기록 확인
- 법/정당/의원별 맞춤형 법안 추천
- 법안 개정 흐름 시각화 및 클러스터 기반 주제 분류
- 관심 법안 스크랩 및 입법 통계 차트 제공
- 데이터 분석 성과
- 법안 6,543건을 13개 주요 카테고리로 분류 (교육, 경제, 복지, 국방 등)
- 전세사기, 임대차 보호 등 사회적 이슈 법안을 클러스터링으로 자동 탐지
- 카드뉴스 변환 기능으로 시민 친화적 법안 설명 제공
- 시각화 및 UX 개선
- 트리맵 시각화를 통해 의원별 법안 발의 비중 직관적 확인
- DB와 연동된 웹서비스 프로토타입 구현 (실제 접속 가능)
- 정치 투명성 강화: 의원 활동 및 법안 발의 현황을 쉽게 확인 가능
- 국민 참여 확대: 일반 사용자가 이해하기 어려운 법안을 요약/시각화하여 친근하게 전달
- 데이터 기반 정책 검증: 특정 정당/의원의 입법 경향 분석 가능