DecisionTreeClassifier 2

[빅데이터분석기사] 실기 3회 2유형 풀이(Python)

여행 보험 패키지 데이터 - 예측할 값(y) : TravelInsurance (여행보험 패키지를 구매했는지 여부, 0:구매안함, 1:구매) - 평가 : roc-auc 평가지표 - data : t2-1-train.csv, t2-a-test.csv - 제출형식 # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-certification/t2-1-train.csv") test = pd.read_csv("../input/big-data-analytics-certification/t2-1-test.csv") # EDA # 데이터 사이즈 train.shape, test.shape # 샘플 확인 trai..

[빅데이터분석기사] 실기 2회 2유형 풀이(Python)

전자상거래 배송 데이터 제품 배송 시간에 맞춰 배송되었는지 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 배송 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻는 예측 확률값을 다음과 같은 형식의 CSV 파일로 생성하시오.(제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) (유의사항) - 성능이 우수한 예측모형을 구현하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, 모형 앙상블 등이 수반되어야 한다. - 수험번호.csv 파일이 만들어지도록 코드를 제출한다. - 제출한 모델의 성능은 ROC-AUC 형태로 읽어들인다. 데이터 파일 읽기 예제 - import pandas as pd - X_test = pd.rea..