3유형 6

[빅데이터분석기사] 실기 3유형 회귀모형(상관계수)(Python)

회귀모형(상관계수) iris에서 Sepal Length와 Sepal Width의 상관계수를 계산하고 소수 둘째자리까지 출력하시오 import pandas as pd from sklearn.datasets import load_iris # iris 데이터셋 로드 iris = load_iris() df = pd.DataFrame(iris.data, column=iris.feature_names) # Sepal Length와 Sepal Width의 상관계수 계산 correlation = df.corr() result = correlation.loc['sepal length (cm)', 'sepal width (cm)'] print(round(result), 2))

[빅데이터분석기사] 실기 3유형 정규성 검정 Shapiro-Wilks(Python)

정규성 검정(Shapiro-Wilks) 12명의 수험생이 빅데이터 분석기사 시험에서 받은 점수이다. Shapiro-Wilk 검정을 사용하여 데이터가 정규 분포를 따르는지 검증하시오. - 귀무가설(H0) : 데이터는 정규 분포를 따른다. - 대립가설(H1) : 데이터는 정규 분포를 따르지 않는다. Shapiro-Wilk 검정 통계량, p-value, 검증결과를 출력하시오. from scipy import stats data = [75, 83, 81, 92, 68, 77, 78, 80, 85, 95, 79, 89] # Shapiro-Wilk 검정 수행 st, va = stats.shapiro(data) # 결과 출력 print("Shapiro-Wilk 검정 통계량 : ", st) print("p-value ..

[빅데이터분석기사] 실기 3유형 일원배치법(Python)

일원배치법 세가지 다른 교육 방법(A, B, C)을 사용하여 수험생들의 시험 성적을 개선시키는 효과를 평가하고자 한다. 30명의 학생들을 무작위로 세 그룹으로 배정하여 교육을 실시하였고, 시험을 보고 성적을 측정하였다. - 귀무가설(H0) : 세 그룹(A, B, C) 간의 평균 성적 차이가 없다. - 대립가설(H1 또는 Ha) : 세 그룹(A, B, C) 간의 평균 성적 차이가 있다. 일원배치법을 수행하여 그룹 간의 평균 성적 차이가 있는지 검정하시오. 1. f값(소수 둘째자리) 2. p값(소수 여섯째자리) 3. 검정결과 출력 import pandas as pd import scipy.stats as stats # 데이터 groupA = [85, 92, 78, 88, 83, 90, 76, 84, 92, ..

[빅데이터분석기사] 실기 3유형 단일표본 T검정(Python)

단일표본 다음은 22명의 학생들이 국어시험에서 받은 점수이다. 학생들의 평균이 75보다 크다고 할 수 있는가? - 귀무가설(H0) : 모평균은 mu와 같다. 학생들의 평균은 75이다. - 대립가설(H1) : 모평균은 mu보다 크다. 학생들의 평균은 75보다 크다. - 모집단은 정규분포를 따르고, 표본의 크기가 충분히 크다고 가정했을 때 검정통계량, p-value, 검정결과를 출력하시오. from scipy.stats import ttest_1samp # 데이터 scores = [75, 80, 68, 72, 77, 82, 81, 79, 70, 74, 76, 78, 81, 73, 81, 78, 75, 72, 74, 79, 78, 79] mu = 75 st, rv = stats.ttest_1samp(score..

[빅데이터분석기사] 실기 3유형 독립표본 T검정(Python)

독립표본 어떤 특정 약물을 복용한 사람들의 평균 체온이 복용하지 않은 사람들의 평균 체온과 유의미하게 다른지 검정해보려고 한다. - 약물을 복용한 그룹과 복용하지 않은 그룹의 체온 데이터가 각각 주어져있다고 가정한다. - 각 그룹의 체온은 정규분포를 따른다고 가정한다. - 검정통계량, p-value, 검정결과를 출력하시오 from scipy import stats # 데이터 수집 group1 = [36.8, 36.7, 37.1, 36.9, 37.2, 36.8, 36.9, 37.1, 36.7, 37.1] group2 = [36.5, 36.6, 36.3, 36.6, 36.9, 36.7, 36.7, 36.8, 36.5, 36.7] # 가설검정 st, rv = stats.ttest_ind(group1, grou..

[빅데이터분석기사] 실기 3유형 대응(쌍체)표본 T검정(Python)

대응(쌍체) 표본 주어진 데이터는 고혈압 환자 치료 전후의 혈압이다. 해당 치료가 효과가 있는지 대응(쌍체) 표본 t-검정을 진행하시오 - 귀무가설(H0) : μ >= 0 - 대립가설(H1) : μ < 0 - μ = (치료 후 혈압 - 치료 전 혈압)의 평균 - 유의수준 : 0.05 1. μ의 표본평균은?(소수 둘째자리까지 반올림) 2. 검정통계량 값은?(소수 넷째자리까지 반올림) 3. p-값은?(소수 넷째자리까지 반올림) 4. 가설검정의 결과는? (유의수준 5%) import pandas as pd pd = pd.read_csv("/kaggle/input/bigdatacertificationkr/high_blood_pressure.csv") import scipy import stats df['diff..