강의노트에서 상관계수가 0에 가까우면 선형 상관관계가 미약하거나 없는 것이라고 배웠습니다.
그래서 상관계수가 0.0에 가깝게 나오는 가상 데이터 2가지를 만들고 산점도로 그려서 형태를 비교해 보았습니다.
코드를 실행하고 그려보니, 두 그래프 모두 판다스와 넘파이에서는 상관계수가 0에 가깝게 계산됩니다.
1번은 정말로 아무 관계가 없어서 0인 게 직관적으로 이해가 갑니다.
하지만 2번은 규칙성이 눈에 보이는데도
수치상으로는 1번과 똑같이 상관관계 없음으로 분류됩니다.
앤스콤 콰르텟 내용 부분에서 "수치만 믿으면 재앙을 초래한다"고 한 게 바로 이런 경우를 말하는 것 같은데,
이처럼 그래프 상으로 명확한 대칭이나 패턴이 보이는데도 상관계수가 0이 나오는 구조적인 이유가 무엇인지 궁금합니다.
상관계수라는 지표는 오직 한쪽 방향으로 쭉 뻗는 직선만을 평가할 수 있는 한계가 있는 건가요?
강의노트에서 상관계수가 0에 가까우면 선형 상관관계가 미약하거나 없는 것이라고 배웠습니다.
그래서 상관계수가 0.0에 가깝게 나오는 가상 데이터 2가지를 만들고 산점도로 그려서 형태를 비교해 보았습니다.
코드를 실행하고 그려보니, 두 그래프 모두 판다스와 넘파이에서는 상관계수가 0에 가깝게 계산됩니다.
1번은 정말로 아무 관계가 없어서 0인 게 직관적으로 이해가 갑니다.
하지만 2번은 규칙성이 눈에 보이는데도
수치상으로는 1번과 똑같이 상관관계 없음으로 분류됩니다.
앤스콤 콰르텟 내용 부분에서 "수치만 믿으면 재앙을 초래한다"고 한 게 바로 이런 경우를 말하는 것 같은데,
이처럼 그래프 상으로 명확한 대칭이나 패턴이 보이는데도 상관계수가 0이 나오는 구조적인 이유가 무엇인지 궁금합니다.
상관계수라는 지표는 오직 한쪽 방향으로 쭉 뻗는 직선만을 평가할 수 있는 한계가 있는 건가요?