귀무가설 5

[빅데이터분석기사] 실기 3유형 정규성 검정 Shapiro-Wilks(Python)

정규성 검정(Shapiro-Wilks) 12명의 수험생이 빅데이터 분석기사 시험에서 받은 점수이다. Shapiro-Wilk 검정을 사용하여 데이터가 정규 분포를 따르는지 검증하시오. - 귀무가설(H0) : 데이터는 정규 분포를 따른다. - 대립가설(H1) : 데이터는 정규 분포를 따르지 않는다. Shapiro-Wilk 검정 통계량, p-value, 검증결과를 출력하시오. from scipy import stats data = [75, 83, 81, 92, 68, 77, 78, 80, 85, 95, 79, 89] # Shapiro-Wilk 검정 수행 st, va = stats.shapiro(data) # 결과 출력 print("Shapiro-Wilk 검정 통계량 : ", st) print("p-value ..

[빅데이터분석기사] 실기 3유형 단일표본 T검정(Python)

단일표본 다음은 22명의 학생들이 국어시험에서 받은 점수이다. 학생들의 평균이 75보다 크다고 할 수 있는가? - 귀무가설(H0) : 모평균은 mu와 같다. 학생들의 평균은 75이다. - 대립가설(H1) : 모평균은 mu보다 크다. 학생들의 평균은 75보다 크다. - 모집단은 정규분포를 따르고, 표본의 크기가 충분히 크다고 가정했을 때 검정통계량, p-value, 검정결과를 출력하시오. from scipy.stats import ttest_1samp # 데이터 scores = [75, 80, 68, 72, 77, 82, 81, 79, 70, 74, 76, 78, 81, 73, 81, 78, 75, 72, 74, 79, 78, 79] mu = 75 st, rv = stats.ttest_1samp(score..

[빅데이터분석기사] 실기 3유형 독립표본 T검정(Python)

독립표본 어떤 특정 약물을 복용한 사람들의 평균 체온이 복용하지 않은 사람들의 평균 체온과 유의미하게 다른지 검정해보려고 한다. - 약물을 복용한 그룹과 복용하지 않은 그룹의 체온 데이터가 각각 주어져있다고 가정한다. - 각 그룹의 체온은 정규분포를 따른다고 가정한다. - 검정통계량, p-value, 검정결과를 출력하시오 from scipy import stats # 데이터 수집 group1 = [36.8, 36.7, 37.1, 36.9, 37.2, 36.8, 36.9, 37.1, 36.7, 37.1] group2 = [36.5, 36.6, 36.3, 36.6, 36.9, 36.7, 36.7, 36.8, 36.5, 36.7] # 가설검정 st, rv = stats.ttest_ind(group1, grou..

[빅데이터분석기사] 6회 실기시험부터 적용되는 작업형 3유형 풀이

안녕하세요! 빅데이터분석기사 3회 필기시험에 붙고나서 3회 실기시험에 떨어지고, 한동안 빅데이터분석기사를 쳐다도 안보다가 이제 슬슬 공부하려던 차인데 갑자기 한국데이터산업진흥원 측에서 출제 유형이 변경된다고 올리셨더라구요! 바로 단답형 유형이 없어지고, 작업형 제3유형이 추가된 것인데요, 작업형으로만 이루어진 실기시험이 더 좋을지는 본격적으로 공부해봐야 알 수 있을 것 같네요. 각설하고, 한국데이터산업진흥원에서 올린 작업형 제3유형 문제는 아래와 같습니다! 통계분석 파트인데, 첫 출제이니만큼 쉽게 나올런지.. 알수가 없습니다. import pandas as pd a = pd.read_csv("data/blood_pressure.csv") # (a) (치료 후 혈압 - 치료 전 혈압)의 평균 mu = (a..

[빅데이터분석기사] 교차분석(Cross-tabulation Analysis)

교차분석(Cross-tabulation Anlaysis) 비교 대상이 되는 항목들의 빈도를 이용하여 자료 간 관계의 유의성을 파악할 때 사용한다. 주로 '범주형' 자료 간의 관계를 확인하는 데 쓰이며, 전체 비율을 통해 예상빈도를 구하여 실제빈도와의 차이를 대조하는 방식이다. 아래는 당뇨환자 25명과 당뇨가 없는 정상인 75명의 인원 총 100명의 비만 유무를 조사한 결과이다. 100명 가운데 비만(20)과 정상(80) 체중의 구성비가 1:4이므로 당뇨환자군 안에서 비만과 정상의 비율 역시 1:4, 비환자군 안에서도 1:4의 비율로 환자 수가 도출될 것을 예상해 볼 수 있다. 이를 기대빈도(예상빈도)라 한다. 당연히 실제로 빈도수는 예상과 다를 것이다. 관측빈도 부분을 보면 당뇨환자 25명 중 비만인 사..