테스트 코드 추가/수정
설명
기존 보안 평가 테스트셋은 정상 100개, 악성 100개를 임의로 균등 구성해 테스트했으나, 실제 전체 링크 모집단에서 정상/악성 비율이 왜 1:1인지 근거가 부족하다는 피드백이 있었다.
전체 링크 데이터에서 정상 링크와 악성 링크의 실제 분포를 먼저 조사하고, 확인된 비율에 맞춰 평가용 테스트셋을 재구축한다. 이후 새 테스트셋으로 기존 탐지 파이프라인을 재평가하고, 기존 220개 데이터셋 기반 결과와 비교한다.
🗒 체크리스트
테스트 코드 추가/수정
설명
기존 보안 평가 테스트셋은 정상 100개, 악성 100개를 임의로 균등 구성해 테스트했으나, 실제 전체 링크 모집단에서 정상/악성 비율이 왜 1:1인지 근거가 부족하다는 피드백이 있었다.
전체 링크 데이터에서 정상 링크와 악성 링크의 실제 분포를 먼저 조사하고, 확인된 비율에 맞춰 평가용 테스트셋을 재구축한다. 이후 새 테스트셋으로 기존 탐지 파이프라인을 재평가하고, 기존 220개 데이터셋 기반 결과와 비교한다.
🗒 체크리스트