anova 2

[빅데이터분석기사] 실기 3유형 일원배치법(Python)

일원배치법 세가지 다른 교육 방법(A, B, C)을 사용하여 수험생들의 시험 성적을 개선시키는 효과를 평가하고자 한다. 30명의 학생들을 무작위로 세 그룹으로 배정하여 교육을 실시하였고, 시험을 보고 성적을 측정하였다. - 귀무가설(H0) : 세 그룹(A, B, C) 간의 평균 성적 차이가 없다. - 대립가설(H1 또는 Ha) : 세 그룹(A, B, C) 간의 평균 성적 차이가 있다. 일원배치법을 수행하여 그룹 간의 평균 성적 차이가 있는지 검정하시오. 1. f값(소수 둘째자리) 2. p값(소수 여섯째자리) 3. 검정결과 출력 import pandas as pd import scipy.stats as stats # 데이터 groupA = [85, 92, 78, 88, 83, 90, 76, 84, 92, ..

[빅데이터분석기사] 분산분석(Analysis of Variance, ANOVA)

분산분석(=변량분석) 자료 간의 차이를 대조시키는 분석기법이다. 여기서 분산은 평균을 중심으로 데이터가 얼마나 퍼져있는지를 표현하는 통계량이다. 만약 데이터의 퍼짐이 없고 모든 개별 데이터값들이 동일하다면, 편차가 없으므로 분산은 '0'이 될 것이다. A학급 경우가 바로 분산이 0이 되는 경우다. 각 대표 학생 4명의 점수가 모두 100점으로 평균이 100이라 편차가 없기 때문이다. 편차가 없다는 의미는 데이터가 좌표상에서 모두 한 점에 찍힌다는 말과 같다. C학급과 D학급은 일단 평균이 같다. 그런데 학생별 점수 데이터를 확인해보면 C학급에 비해 D학급의 대표 학생별 점수 편차가 더 크다는 것을 확인할 수 있다. 실제로 공식에 대입해 편차를 구하고 분산을 계산해보면, C학급은 1,933, D학급은 10..