빅데이터분석기사

[빅데이터분석기사] 빅분기 제6회 실기 시험 합격 후기

EveningPrimrose 2023. 6. 25. 02:18
반응형

안녕하세요!

 

3회차 빅데이터분석기사 필기시험을 합격한 다음에

가볍게 시도한 3회차 실기 시험에 떨어지고

주구장창 다른 자격증 시험에 푹 빠져있다가 

6회차 시험이 되서야 실기시험에 다시 응시하게 되었습니다.

 

그런데 하필이면 이번 6회차 시험부터 단답형 유형이 없어지고

통계분석 관련 작업형 3유형이 추가되었는데요,

 

빅데이터분석기사 6회 시험부터는 단답형이 없어지고 작업형 3유형이 추가된다.

 

이번 6회 실기시험에서는 이 3유형이 말도 많고 탈도 많더라구요.

자세한 이야기는 빅데이터분석기사 시험을 한번 소개해드리고 적어보겠습니다!

 

 


빅데이터분석기사란?

 

빅데이터분석기사는 한국데이터산업진흥원에서 주관하는 기사 시험으로

필기시험과 실기시험을 차례로 합격하시면 자격을 얻게 됩니다.

 

실기시험은 작업형1~3 유형의 문제들을 파이썬이나 R로 풀어내셔야하며

컴퓨터가 있는 고사장에서 코딩을 하면서 푸는 방식입니다.

실제 시험에서는 웹사이트에 접속해서 문제를 풀게되는데

한국데이터산업진흥원에서 응시환경을 체험할 수 있도록 해놨더라구요.

 

응시환경 체험은 아래 사이트를 참고해주세요!

클릭하시면 시험환경 사이트로 이동합니다

 

시험 시간은 오전 10시부터 13시까지, 3시간 동안 진행되는데

시험시간의 절반이 지난 11시 30분부터는 중도퇴실이 가능합니다!

 

그리고 10시 30분부터는 화장실을 가게 해주는데, 

의아했던점이 11시 30분 이후로 화장실을 가게되면

중도퇴실자와 마주칠 수 있을텐데 이래도 되나 싶긴 하더라구요.

 

시험문제는 작업형1 3문제(각 10점), 작업형2 1문제(40점), 작업형3 2문제(각 15점)을 푸셔야 하고

과락점수는 따로 없기 때문에 60점만 넘기시면 합격하게 됩니다!

 

 


시험 공부방법은?

 

저는 지난 3회차 실기 시험에서 떨어졌던 경험이 있었기 때문에

이번 6회차 실기 시험은 한달전부터 시작해서 합격해보자! 라는 목표가 있었습니다.

 

참고로 저는 IT 전공자이며, 통계쪽은 조금 접하긴 했지만 

하고있는 업무에서 통계를 전혀 사용하지 않아 낯선 상태였습니다.

 

그래서 어떤 언어로 빅데이터분석기사 실기 시험 준비를 할까 하다가

향후 활용도가 높은 파이썬(Python)으로 선택해서 열심히 공부했습니다.

 

실기 수험서가 거의없던 과거와는 달리 6회차 정도 되니까 

어느정도 시험 복기도 되고, 관련 강의나 유튜브 영상도 올라오고

확실히 시험공부하기에는 환경이 좋아졌더라구요!

 

그럼에도 파이썬에 익숙하지 않다면 어떻게 해야할지 감이 안잡히실텐데

그럴때는 완성된 코드를 그냥 타이핑해가면서 익숙해지는수밖에 없겠더라구요.

 

코드에 전혀 감이 없으신분들은 아래 위키독스에서

판다스 사용법을 체계적으로 익힐 수 있는데다가

이미지를 클릭하시면 판다스 노트 사이트로 이동합니다

 

아래 '퇴근후딴짓'님의 캐글사이트에 작업형 유형별 코드와 풀이 동영상도 있습니다.

이미지를 클릭하시면 퇴근후딴짓님의 캐글 사이트로 이동합니다

 

저는 개인적으로 코딩은 책으로 공부하는것보다 

직접 코드를 타이핑하면서 에러를 만나고,

이걸 해결하는 과정에서 실력이 늘더라구요.

 

그래서 열심히 코드 타이핑을 반복하면서

시험에 응시할 수 있는 수준까지 맞춘 것 같습니다!

 


시험 후기는?

 

 

시험 준비물수험표와 신분증을 챙겨가시면 되는데

수험표는 시험 웹사이트 접속할 때 ID가 수험번호이니 필요하더라구요.

 

그리고 꼭 dir과 help 사용법을 익혀가시길 권장드립니다.

그도 그럴것이, 코드 자동완성이 안되는 IDE 환경이어서

대/소문자가 틀리거나 오타가 나면 에러가 뜨는데 

실제 시험장에서 에러를 맞이하게 되면 매우 혼란스럽더라구요.

 

이번 시험은 작업형1의 3번째 문제와 작업형3의 2번째 문제가 이슈인 듯 한데요,

작업형1-3주어진 문제가 읽는사람마다 해석이 달라질 수 있다는 점,

작업형3-2주어진 패키지에 없는 statsmodel을 사용해서 풀어야 한다는 점이 있었습니다.

 

그래서 일부 수험자들은 한국데이터산업진흥원에 문의글을 남기는 등 대응하고 있더라구요.

사실 저도 작업형3-2번 문제는 dir과 help를 아무리 써도 풀수가 없겠어서 0, 1로 찍고 나왔습니다.

 

(작업형 1유형)

 - 1번 문제 : 시계열 데이터를 전처리하는 문제가 나왔습니다. 보통 dt.year, dt.month, dt.day 정도만 해볼텐데 이 문제는 '분'을 묻는 문제라, dt로 뽑는 방법을 몰라서 혼란이 있었던 문제였습니다. 그래서 수험생들은 정답은 3으로 알고있는데 변수로 뽑는 방법을 몰라 print(3)을 하신 분들이 많은 것 같더라구요.

 

 - 2번 문제 : 교사 1인당 학생 수를 구하는 문제가 나왔습니다. 문제를 제대로 읽지 않은 분들은 '교사'를 출력하라는 조건을 못보고 오답을 입력하신분도 있는 것 같더라구요. 정답은 6으로 예상합니다.

 

 - 3번 문제 : 논란의 3번 문제입니다. '연도별 월평균'이라는 키워드가 수험생들의 혼란을 일으킨 것 같은데, 정답은 4329로 예상됩니다.

 

(작업형 2유형)

 - 작업형 2유형은 무난한 분류문제로 출제되었다는 의견이 많더라구요. 주어진 데이터에 결측치도 없어서 단순히 라벨 인코딩이나 원핫인코딩으로 범주형 변수들을 인코딩해준 뒤 RandomForestClassifier로 모델을 만들어주고 제출해주면 40점은 받을 수 있을 것으로 예상됩니다.

 

(작업형 3유형)

 - 1번 문제 : 카이제곱 적합도 검정에 대한 문제가 나왔습니다. 사실 3유형은 ttest나 anova 정도, 더 가면 shapiro같은 정규성 검정, levene같은 등분산 검정이 나오고 카이제곱은 나오지 않을거라는 예측이 있었는데 보기 좋게 빗나갔네요. 그래도 저는 help와 dir을 써가면서 풀어는 냈는데 수험생들의 답이 두가지로 나뉘는 것 같습니다. 확률로 카이검정 했으면 정답이 (0.787, 0.005, 1.000)으로 나오는 듯 하고, 확률에 데이터 수를 곱해서 했으면 (0.787, 0.997, 0.802)로 나오는 것 같더라구요. 정확한건 채점결과가 나와봐야 알 수 있을 것 같습니다.

 

 - 2번 문제 : 논란의 2번 문제입니다. 다중회귀분석에 대한 문제가 나왔고 파이썬으로 응시하신분들은 statsmodel 패키지를 사용해야하나 공지된 패키지에는 statsmodel 패키지가 빠져있었습니다. R로 응시하신분들은 상대적으로 풀기 쉬우셨을수도 있지만, 파이썬만 공부한 저로써는 대응하지 못하고 장렬히 전사했습니다. sklearn으로 회귀계수 구하고 scipy나 numpy로 값을 구할수도 있다고 하지만 통계 전공자가 아니면 회귀 공식을 알수도 없고해서 대응하기 어려웠을 것으로 예상됩니다. 해당 문제는 답안도 분분하며, 어떻게 처리할지는 채점결과가 나와봐야 알 수 있을 듯 합니다. 

 

 

저는 작업형3-2를 제외하고 모두 풀긴 풀었는데, 답안이 애매한게 몇가지 껴있어서

작업형2에서 점수가 잘나와야지만 빅데이터분석기사 실기 시험에 합격하겠네요..

 

빅데이터분석기사 6회 시험 가채점 결과는 2023.7.7.에 공개된다고 하니 

그때 시험결과를 가지고 다시 돌아오겠습니다 :)

 

 

+++++++++ 7.7에 가답안 발표가 났고, 저는 85점으로 합격하게 되었습니다.

 

제6회 빅데이터분석기사 실기 합격

 

다행히도 꽤나 고득점으로 합격했고, 3유형은 비율을 카이제곱한 것이 틀린 요인이었던 것 같습니다(p-value가 1.0..)

 

앞서 언급드렸던 애매한 문제들이 논란이 되었고, 한국데이터산업진흥원에서 아래와 같이 답변을 했는데요,

 

 

3유형 6번문제-2, 3이 전원 정답처리가 되어서 수험생들 모두 10점이 올라간 효과로

이번 6회차 빅데이터분석기사 시험은 합격률이 굉장히 높을 것으로 예상됩니다.

 

혹시 빅데이터분석기사 시험 관련 궁금한 점은 댓글 달아주시면 성심성의껏 답변 드리겠습니다 :)

 

 

반응형