빅데이터분석기사/코드

[빅데이터분석기사] 실기 시험 준비 전 꿀팁

EveningPrimrose 2021. 11. 11. 01:38
반응형

안녕하세요!

 

요전번에 빅데이터분석기사 필기 시험에 합격하고

본격적으로 빅데이터분석기사 실기 시험에 대비하려고 하는데, 

 

한국데이터산업진흥원에서 빅데이터분석기사 실기시험 응시 가이드 문서를 올려준게 있더라구요!

 

  ※ 원문은 아래 파일을 참고

[K-DATA] 빅데이터분석기사 실기시험 응시가이드.pdf
0.53MB

 

제약사항에서 몇가지 팁이 있어서 공유하고자 글을 적습니다!

 

 

1. 라인별 실행, 그래프 기능, 단축키, 자동완성 기능 미제공

 → 라인별 실행이 되지 않는다는 것은 전체 분석 코드를 한 번에 실행하라는 의미이므로, 분석을 하면서 각 단계별 코드 결과를 확인하기보다 데이터 불러오기부터 머신러닝 수행까지 전체 핵심코드를 한번에 수행해야 함

 → 단축키와 자동완성 기능이 제공되지 않는다는 것은 코드를 외워서 응시해야한다는 의미

 

2. 코드 실행 시간은 1분으로 제한

 → 수 만건 이상의 대량 데이터는 시험에서 다루지 않음(데이터가 많을수록, 변수가 많을수록 실행 시간이 오래 걸림)

 → 그리드서치(Grid Search)나 랜덤서치(Random Search)와 같이 알고리즘의 최적 하이퍼 파라미터를 탐색하는 과정은 제외

 

3. 패키지는 추가 설치할 수 없으며, 제공된 패키지만 이용 가능

 → 한국데이터산업진흥원에서 공지한 파이썬 주요 라이브러리는 총 39개의 패키지이며, 이 중 데이터 처리 관련 기본 패키지는 numpy(14)와 pandas(15), 분석과 관련된 패키지는 scikit-learn(26), scipy(27), xgboost(38)이 있음.

 → 딥러닝이나 텍스트분석과 관련된 패키지는 제공되지 않으므로, 기본 데이터 처리와 분석, 머신러닝 알고리즘 분석과 관련된 문제를 출제함을 의미

 

  ※ 파이썬 제공 패키지 리스트는 아래 파일을 참고

파이썬패키지.txt
0.00MB

 

 

또한, 유형별 예시문제를 공개하고 있습니다.

 

  ※ 예시문제 원본은 아래 파일을 참고

유형별 예시문제.pdf
0.13MB

 

예시문제를 통해 수준과 난이도를 가늠해보면

'데이터의 정제 및 변환을 할 줄 아는가',

'학습 및 테스트 데이터에 머신러닝 알고리즘을 적용하고 예측값을 csv파일로 저장할 수 있는가'

등과 같이 전체적인 과정을 무난하게 수행하는 수준으로

 

파이썬으로 결측치와 이상값 등 데이터 정제, 데이터 변환 및 생성 등 데이터 처리의 기본을 익히고,

데이터 불러오기→머신러닝 알고리즘의 적용→학습모델로 테스트 데이터 예측 및 파일 저장 등 일련의 기본 과정을 실수 없이 수행해야 합니다.

 

 

그럼, 저도 오늘부터 빅데이터분석기사 실기시험 공부를 시작해보겠습니다!

반응형