Skip to content

탐색 및 추천 레포 풀 생성 로직  #2

@dane805

Description

@dane805

추천 풀 생성 룰 관련

  • 포크 떠온 레포는 제거하자 (어케 할 건지는 알아봐야함)
  • 스타/포크 수 아다리가 좀 안 맞는다 -> distinct count를 해야 한다
  • 풀 형성 관련해서 데이터 날리는 걸로는 어전히 star가 그래도 유의미하지 않을까 (vs 상재: issue!!)

기억해둘 정보

  • 레포의 60%는 스타 1개, 30%는 커밋 1개
  • 포크는 그냥 공유용일 수 있어보인다(교육) -> 신뢰하기 어려움
  • 레포 이름은 사용자가 이름 바뀌면 바뀌고, 탈퇴하면 날라가기 때문에 살아있는지 검사에 주의해야 한다 (id는 ㄱㅊ)
    • id로 URL 땡기는 등의 API 가능
    • 죽으면(탈퇴하면) 안나옴
  • 커밋 별로 없이 유명한 건 간단하며 유용한 거거나 논문 같은 것들
  • 이슈 없이 유명한 건 간단한 거나 교재 같은 것 .. 비슷 ... 아님 풀리퀘 conversation에 나오기도 함

기타 아이디어

  • 웹 UI에서 add한 건지 아님 push한 건지도 확인되면 유의미한 피쳐일듯
  • 봇이 푸시한 것도 변별되는가? -> 아마 유의미한 피쳐
  • 활동의 다양성 (type 종류 수)
  • 최근 업데이트가 없어도 계속 스타가 찍히는 케이스들도 얼마나 있을까?
    • 책 솔루션??

커밋 메시지의 컨벤션

  • 오탈자 잡는 커밋이라던가
  • 근데 요새는 보통 이슈로 처리함

구루 유저

als로 간단하게 임베딩 뽑아서 클러스터링 해보면?

Metadata

Metadata

Labels

No labels
No labels

Type

No type
No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions