빅데이터분석기사/코드

[빅데이터분석기사] 6회 실기시험부터 적용되는 작업형 3유형 풀이

EveningPrimrose 2023. 5. 23. 00:38
반응형

안녕하세요!

 

빅데이터분석기사 3회 필기시험에 붙고나서 3회 실기시험에 떨어지고,

한동안 빅데이터분석기사를 쳐다도 안보다가 이제 슬슬 공부하려던 차인데

갑자기 한국데이터산업진흥원 측에서 출제 유형이 변경된다고 올리셨더라구요!

 

빅데이터분석기사 6회 실기시험부터 적용되는 출제유형(작업형 3유형 추가)

 

바로 단답형 유형이 없어지고, 작업형 제3유형이 추가된 것인데요,

작업형으로만 이루어진 실기시험이 더 좋을지는 본격적으로 공부해봐야 알 수 있을 것 같네요.

 

각설하고, 한국데이터산업진흥원에서 올린 작업형 제3유형 문제는 아래와 같습니다!

 

 

통계분석 파트인데, 첫 출제이니만큼 쉽게 나올런지.. 알수가 없습니다.

 

import pandas as pd
a = pd.read_csv("data/blood_pressure.csv")

# (a) (치료 후 혈압 - 치료 전 혈압)의 평균
mu = (a['bp_after'] - a['bp_before']).mean()
mu = round(mu, 2)
print(f'표본 평균 : {mu}')

# (b) paried t-test 이기 때문에 scipy 패키지 사용
from scipy.stats import ttest_rel
# alternative = 'two-sided'가 디폴트 설정인데 paired t-test는 'greater' 지정 필요
statistics, p_value = ttest_rel(a['bp_before'], a['bp_after'], alternative = 'greater')
statistics = round(statistics, 2)
print(f'검정통계량 : {statistics}')

# (c) 귀무가설 : 치료가 효과가 없다, 대립가성 : 치료가 효과가 있다.
p_value = round(p_value, 4)
if p_value <= 0.05 :
  print(f'p- 값이 {p_value}로 유의수준 0.05 하에서 기각하고 이는 치료의 효과가 통계적으로 유의미함을 의미한다.')
else :
  print(f'p- 값이 {p_value}로 유의수준 0.05 하에서 채택하고 이는 치료의 효과가 통계적으로 유의미하지 못함을 의미한다.')

 

문제가 a, b, c 이런식으로 나와서 어떻게 답안을 입력해야할지 알 수는 없지만

일단 출력에 맞는 print만 해도 되지 않을까.. 라는 개인적인 생각입니다.

 

 

반응형