2유형 3

[빅데이터분석기사] 작업형 2유형 연습문제 #3

생존여부 예측모델 만들기 학습용 데이터(X_train, y_train)을 이용하여 생존 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측값을 다음과 같은 형식의 CSV 파일로 생성하시오(제출한 모델의 성능은 accuracy 평가지표에 따라 채점) (가) 제공 데이터 목록 - y_train : 생존여부(학습용) - X_train, X_test : 승객 정보(학습용 및 평가용) (나) 데이터 형식 및 내용 - y_train (712명 데이터) 시험환경 세팅은 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임 유의사항 - 성능이 우수한 예측모형을 구축하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, ..

[빅데이터분석기사] 실기 4회 2유형 풀이(Python)

자동차 시장 세분화 - 자동차 회사는 새로운 전략을 수립하기 위해 4개의 시장으로 세분화했습니다. - 기존 고객 분류 자료를 바탕으로 신규 고객이 어떤 분류에 속할지 예측해주세요! - 예측할 값(y) : "Segmentation" (1, 2, 3, 4) - 평가 : Macro f1-score - data : train.csv, test.csv - 제출형식 답안 제출 참고 - 아래 코드 예측변수와 수험번호를 개인별로 변경하여 활용 - pd.DataFrame({'ID' : test.ID, 'Segmentation' : pred})).to_csv('003000000.csv', index=False) 노트북 구분 - basic : 수치형 데이터만 활용 -> 학습 및 test 데이터 예측 - intermediat..

[빅데이터분석기사] 실기 3회 2유형 풀이(Python)

여행 보험 패키지 데이터 - 예측할 값(y) : TravelInsurance (여행보험 패키지를 구매했는지 여부, 0:구매안함, 1:구매) - 평가 : roc-auc 평가지표 - data : t2-1-train.csv, t2-a-test.csv - 제출형식 # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-certification/t2-1-train.csv") test = pd.read_csv("../input/big-data-analytics-certification/t2-1-test.csv") # EDA # 데이터 사이즈 train.shape, test.shape # 샘플 확인 trai..