반응형

실기 79

[빅데이터분석기사] 실기 3유형 단일표본 T검정(Python)

단일표본 다음은 22명의 학생들이 국어시험에서 받은 점수이다. 학생들의 평균이 75보다 크다고 할 수 있는가? - 귀무가설(H0) : 모평균은 mu와 같다. 학생들의 평균은 75이다. - 대립가설(H1) : 모평균은 mu보다 크다. 학생들의 평균은 75보다 크다. - 모집단은 정규분포를 따르고, 표본의 크기가 충분히 크다고 가정했을 때 검정통계량, p-value, 검정결과를 출력하시오. from scipy.stats import ttest_1samp # 데이터 scores = [75, 80, 68, 72, 77, 82, 81, 79, 70, 74, 76, 78, 81, 73, 81, 78, 75, 72, 74, 79, 78, 79] mu = 75 st, rv = stats.ttest_1samp(score..

[빅데이터분석기사] 실기 3유형 독립표본 T검정(Python)

독립표본 어떤 특정 약물을 복용한 사람들의 평균 체온이 복용하지 않은 사람들의 평균 체온과 유의미하게 다른지 검정해보려고 한다. - 약물을 복용한 그룹과 복용하지 않은 그룹의 체온 데이터가 각각 주어져있다고 가정한다. - 각 그룹의 체온은 정규분포를 따른다고 가정한다. - 검정통계량, p-value, 검정결과를 출력하시오 from scipy import stats # 데이터 수집 group1 = [36.8, 36.7, 37.1, 36.9, 37.2, 36.8, 36.9, 37.1, 36.7, 37.1] group2 = [36.5, 36.6, 36.3, 36.6, 36.9, 36.7, 36.7, 36.8, 36.5, 36.7] # 가설검정 st, rv = stats.ttest_ind(group1, grou..

[빅데이터분석기사] 실기 3유형 대응(쌍체)표본 T검정(Python)

대응(쌍체) 표본 주어진 데이터는 고혈압 환자 치료 전후의 혈압이다. 해당 치료가 효과가 있는지 대응(쌍체) 표본 t-검정을 진행하시오 - 귀무가설(H0) : μ >= 0 - 대립가설(H1) : μ < 0 - μ = (치료 후 혈압 - 치료 전 혈압)의 평균 - 유의수준 : 0.05 1. μ의 표본평균은?(소수 둘째자리까지 반올림) 2. 검정통계량 값은?(소수 넷째자리까지 반올림) 3. p-값은?(소수 넷째자리까지 반올림) 4. 가설검정의 결과는? (유의수준 5%) import pandas as pd pd = pd.read_csv("/kaggle/input/bigdatacertificationkr/high_blood_pressure.csv") import scipy import stats df['diff..

[빅데이터분석기사] 실기 4회 2유형 풀이(Python)

자동차 시장 세분화 - 자동차 회사는 새로운 전략을 수립하기 위해 4개의 시장으로 세분화했습니다. - 기존 고객 분류 자료를 바탕으로 신규 고객이 어떤 분류에 속할지 예측해주세요! - 예측할 값(y) : "Segmentation" (1, 2, 3, 4) - 평가 : Macro f1-score - data : train.csv, test.csv - 제출형식 답안 제출 참고 - 아래 코드 예측변수와 수험번호를 개인별로 변경하여 활용 - pd.DataFrame({'ID' : test.ID, 'Segmentation' : pred})).to_csv('003000000.csv', index=False) 노트북 구분 - basic : 수치형 데이터만 활용 -> 학습 및 test 데이터 예측 - intermediat..

[빅데이터분석기사] 실기 4회 1유형 풀이(Python)

문제 1 - age 컬럼의 3사분위수와 1사분위수의 차를 절대값으로 구하고, 소수점 버려서 정수로 출력 - data_path : ../input/bigdatacertificationkr/basic1.csv import pandas as pd df = pd.read_csv("../input/bigdatacertificationkr/basic1.csv") # print("1사분위 : ", df['age'].quantile(0.25)) # print("3사분위 : ". df['age'].quantile(0.75)) result = abs(df['age'].quantile(0.25) - df['age'].quantile(0.75)) # print("절대값 차이 : ", result) print(int(resul..

[빅데이터분석기사] 실기 3회 2유형 풀이(Python)

여행 보험 패키지 데이터 - 예측할 값(y) : TravelInsurance (여행보험 패키지를 구매했는지 여부, 0:구매안함, 1:구매) - 평가 : roc-auc 평가지표 - data : t2-1-train.csv, t2-a-test.csv - 제출형식 # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-certification/t2-1-train.csv") test = pd.read_csv("../input/big-data-analytics-certification/t2-1-test.csv") # EDA # 데이터 사이즈 train.shape, test.shape # 샘플 확인 trai..

[빅데이터분석기사] 실기 3회 1유형 풀이(Python)

문제1 - 2022년 데이터 중 2022년 중앙값보다 큰 값의 데이터 수 - data : t1-data2.csv import pandas as pd df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year') m = df.loc["2022년"].median() print(sum(df.loc["2022년", :] > m)) 문제2 - 결측치 데이터(행)을 제거하고, 앞에서부터 60% 데이터만 활용해, 'f1' 컬럼 3사분위 값을 구하시오. - 60%가 소수점일 경우 절사(예 : 36.6 일 때 36으로 계산) import pandas as pd df = pd.read_csv("../input/big-d..

[빅데이터분석기사] 실기 2회 2유형 풀이(Python)

전자상거래 배송 데이터 제품 배송 시간에 맞춰 배송되었는지 예측모델 만들기 학습용 데이터 (X_train, y_train)을 이용하여 배송 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻는 예측 확률값을 다음과 같은 형식의 CSV 파일로 생성하시오.(제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) (유의사항) - 성능이 우수한 예측모형을 구현하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, 모형 앙상블 등이 수반되어야 한다. - 수험번호.csv 파일이 만들어지도록 코드를 제출한다. - 제출한 모델의 성능은 ROC-AUC 형태로 읽어들인다. 데이터 파일 읽기 예제 - import pandas as pd - X_test = pd.rea..

[빅데이터분석기사] 실기 2회 1유형 풀이(Python)

문제 1 - 데이터셋(basic1.csv)의 'f5' 컬럼을 기준으로 상위 10개의 데이터를 구하고, - 'f5' 컬럼 10개 중 최소값으로 데이터를 대체한 후, - 'age' 컬럼에서 80 이상인 데이터의 'f5' 컬럼 평균값 구하기 # 라이브러리 및 데이터 불러오기 import pandas as pd df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv') df.head() # f5 컬럼을 기준으로 내림차순 정렬 df = df.sort_value('f5' ascending = False) df.head(10) # 최소값 찾기 min = df['f5'][:10].min() min df.iloc[:10, -1] = min df.head(10) # 8..

[빅데이터분석기사] 작업형 1유형 연습문제 #3

데이터 출처(월드컵 출전선수 골기록 데이터) : https://www.kaggle.com/darinhawley/fifa-world-cup-goalscorers-19302018 FIFA World Cup Goalscorers 1930-2018 List of all FIFA World Cup goalscoreres 1930-2018 www.kaggle.com 데이터 URL : https://raw.githubusercontent.com/Datamanim/datarepo/main/worldcup/worldcupgoals.csv import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/worldcu..

반응형