Skip to content

(권*희) (강의노트 22장) 전처리와 데이터분할 순서 #165

@d03020

Description

@d03020

22장의 5단계와 6단계를 공부하면서 전처리 순서에 대해 교재의 5단계 코드를 보면 dropna()로 결측치가 있는 행을 먼저 지운 다음에, 6단계에서 train_test_split()으로 훈련 세트와 테스트 세트를 나눕니다. 이처럼 결측치가 있는 샘플을 먼저 삭제하는 방식과 데이터를 먼저 분할하고 전처리를 하는 방식 중 어떤것이 실용적인지 알고 싶습니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions