### 추천 풀 생성 룰 관련 - 포크 떠온 레포는 제거하자 (어케 할 건지는 알아봐야함) - 스타/포크 수 아다리가 좀 안 맞는다 -> distinct count를 해야 한다 - 풀 형성 관련해서 데이터 날리는 걸로는 어전히 star가 그래도 유의미하지 않을까 (vs 상재: issue!!) ### 기억해둘 정보 - 레포의 60%는 스타 1개, 30%는 커밋 1개 - 포크는 그냥 공유용일 수 있어보인다(교육) -> 신뢰하기 어려움 - 레포 이름은 사용자가 이름 바뀌면 바뀌고, 탈퇴하면 날라가기 때문에 살아있는지 검사에 주의해야 한다 (id는 ㄱㅊ) - id로 URL 땡기는 등의 API 가능 - 죽으면(탈퇴하면) 안나옴 - 커밋 별로 없이 유명한 건 간단하며 유용한 거거나 논문 같은 것들 - 이슈 없이 유명한 건 간단한 거나 교재 같은 것 .. 비슷 ... 아님 풀리퀘 conversation에 나오기도 함 ### 기타 아이디어 - 웹 UI에서 add한 건지 아님 push한 건지도 확인되면 유의미한 피쳐일듯 - 봇이 푸시한 것도 변별되는가? -> 아마 유의미한 피쳐 - 활동의 다양성 (type 종류 수) - 최근 업데이트가 없어도 계속 스타가 찍히는 케이스들도 얼마나 있을까? - 책 솔루션?? ### 커밋 메시지의 컨벤션 - 오탈자 잡는 커밋이라던가 - 근데 요새는 보통 이슈로 처리함 ### 구루 유저 ### als로 간단하게 임베딩 뽑아서 클러스터링 해보면?
추천 풀 생성 룰 관련
기억해둘 정보
기타 아이디어
커밋 메시지의 컨벤션
구루 유저
als로 간단하게 임베딩 뽑아서 클러스터링 해보면?