Scikit-Learn(SkLearn) Pipeline
•
데이터 전처리에서 학습까지의 과정을 하나로 연결해주는 것
•
Scikit-learn 파이프라인을 사용하면 데이터 전처리 및 학습의 모든 단계를 포함하는 단일 개체를 만들 수 있다.
•
파이프라인에 작업(변수 선택, 표준화, 모형 클래스 등)을 등록만 해주면 기존 과정을 한 번에 처리할 수 있다.
사용 이점
•
train과 test 데이터 손실을 피할 수 있다.
•
교차검증 및 기타 모델 선택 유형을 쉽게 만든다.
•
재현성이 증가한다.