You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
22장의 5단계와 6단계를 공부하면서 전처리 순서에 대해 교재의 5단계 코드를 보면 dropna()로 결측치가 있는 행을 먼저 지운 다음에, 6단계에서 train_test_split()으로 훈련 세트와 테스트 세트를 나눕니다. 이처럼 결측치가 있는 샘플을 먼저 삭제하는 방식과 데이터를 먼저 분할하고 전처리를 하는 방식 중 어떤것이 실용적인지 알고 싶습니다.
22장의 5단계와 6단계를 공부하면서 전처리 순서에 대해 교재의 5단계 코드를 보면 dropna()로 결측치가 있는 행을 먼저 지운 다음에, 6단계에서 train_test_split()으로 훈련 세트와 테스트 세트를 나눕니다. 이처럼 결측치가 있는 샘플을 먼저 삭제하는 방식과 데이터를 먼저 분할하고 전처리를 하는 방식 중 어떤것이 실용적인지 알고 싶습니다.