안녕하세요!
요전번에 빅데이터분석기사 필기 시험에 합격하고
본격적으로 빅데이터분석기사 실기 시험에 대비하려고 하는데,
한국데이터산업진흥원에서 빅데이터분석기사 실기시험 응시 가이드 문서를 올려준게 있더라구요!
※ 원문은 아래 파일을 참고
제약사항에서 몇가지 팁이 있어서 공유하고자 글을 적습니다!
1. 라인별 실행, 그래프 기능, 단축키, 자동완성 기능 미제공
→ 라인별 실행이 되지 않는다는 것은 전체 분석 코드를 한 번에 실행하라는 의미이므로, 분석을 하면서 각 단계별 코드 결과를 확인하기보다 데이터 불러오기부터 머신러닝 수행까지 전체 핵심코드를 한번에 수행해야 함
→ 단축키와 자동완성 기능이 제공되지 않는다는 것은 코드를 외워서 응시해야한다는 의미
2. 코드 실행 시간은 1분으로 제한
→ 수 만건 이상의 대량 데이터는 시험에서 다루지 않음(데이터가 많을수록, 변수가 많을수록 실행 시간이 오래 걸림)
→ 그리드서치(Grid Search)나 랜덤서치(Random Search)와 같이 알고리즘의 최적 하이퍼 파라미터를 탐색하는 과정은 제외
3. 패키지는 추가 설치할 수 없으며, 제공된 패키지만 이용 가능
→ 한국데이터산업진흥원에서 공지한 파이썬 주요 라이브러리는 총 39개의 패키지이며, 이 중 데이터 처리 관련 기본 패키지는 numpy(14)와 pandas(15), 분석과 관련된 패키지는 scikit-learn(26), scipy(27), xgboost(38)이 있음.
→ 딥러닝이나 텍스트분석과 관련된 패키지는 제공되지 않으므로, 기본 데이터 처리와 분석, 머신러닝 알고리즘 분석과 관련된 문제를 출제함을 의미
※ 파이썬 제공 패키지 리스트는 아래 파일을 참고
또한, 유형별 예시문제를 공개하고 있습니다.
※ 예시문제 원본은 아래 파일을 참고
예시문제를 통해 수준과 난이도를 가늠해보면
'데이터의 정제 및 변환을 할 줄 아는가',
'학습 및 테스트 데이터에 머신러닝 알고리즘을 적용하고 예측값을 csv파일로 저장할 수 있는가'
등과 같이 전체적인 과정을 무난하게 수행하는 수준으로
파이썬으로 결측치와 이상값 등 데이터 정제, 데이터 변환 및 생성 등 데이터 처리의 기본을 익히고,
데이터 불러오기→머신러닝 알고리즘의 적용→학습모델로 테스트 데이터 예측 및 파일 저장 등 일련의 기본 과정을 실수 없이 수행해야 합니다.
그럼, 저도 오늘부터 빅데이터분석기사 실기시험 공부를 시작해보겠습니다!
'빅데이터분석기사 > 코드' 카테고리의 다른 글
[빅데이터분석기사] 데이터탐색과 데이터정제 실습 (2) (0) | 2022.06.07 |
---|---|
[빅데이터분석기사] 데이터탐색과 데이터정제 실습 (1) (0) | 2022.06.06 |
[빅데이터분석기사] 파이썬 데이터 정제 실습 (0) | 2022.06.03 |
[빅데이터분석기사] 파이썬(Python) 기초 - 자료형 if문 반복문 (0) | 2022.05.31 |
[빅데이터분석기사] 파이썬 머신러닝(ML) 기본 틀 맛보기 (0) | 2021.12.03 |