빅데이터분석기사

[빅데이터분석기사] 제3회 실기 시험 불합격 후기

EveningPrimrose 2022. 5. 17. 01:21
반응형

안녕하세요!

 

일전에 빅데이터분석기사 필기시험에 응시해서 합격한 후

지난 12월 4일에 빅데이터분석기사 실기시험에 응시하고 왔습니다!

 

저는 IT 전공자에 전산실 기획업무를 담당하고 있지만

파이썬이나 R 언어를 다룰일이 없어 시험이 어렵게만 느껴졌던거 같습니다(물론 공부를 더 하면 됐겠지만..).

 

빅데이터분석기사 시험이 익숙치 않은분들을 위해 소개를 먼저 해드리고, 후기도 작성해드리겠습니다!

 

 


빅데이터분석기사 시험이란?

 

 

빅데이터분석기사 시험은 한국데이터산업진흥원(K-Data)에서 주관하는 기사급 시험으로

필기시험과 실기시험 두가지를 차례로 합격하시면 자격이 주어지게 됩니다.

 

실기시험은 빅데이터 분석 실무 관련 단답형과 작업형 문제들을 풀어내셔야 하는데

종이에 적어서 제출하는 방식이 아니라 컴퓨터가 있는 고사장에서 작업형으로 문제를 푸셔야 합니다.

웹사이트에 접속해서 문제를 풀게되는데, 응시환경을 체험할 수 있도록 사이트를 오픈해놓았습니다!

 

※ 빅데이터분석기사 실기시험 응시환경

이미지를 클릭하시면 사이트로 이동합니다.

 

시험시간은 오전 10시~13시까지 총 3시간동안 진행되는데,

여타의 시험과 같이 시험시간의 절반이 지난 11시 30분부터는 중도퇴실이 가능합니다!

 

시험문제는 단답형 10문제, 작업형(1) 3문제, 작업형(2) 1문제를 푸셔야하고,

필기시험과는 다르게 과목별로 과락점수는 없으므로 어떻게든 합격선인 60점을 넘기시면 됩니다!

작업형 문제는 빅데이터 분석 관련 예시문이 주어지고,

이 예시문을 파이썬이나 R로 풀어서 제출하면 됩니다!

 

 


시험은 어떻게 공부했는지?

 

 

후기들을 찾아보니 대부분의 수험생분들이 단기간에 공부해서 합격하더라구요,

그래서 파이썬이나 R을 다뤄본적이 없었어도 벼락치기를 결심했었더라죠..

 

벼락치기임에도 향후 활용도가 높은 파이썬으로 언어를 선택해서 공부했습니다!

파이썬용 빅데이터분석기사 실기 수험서는 아래 데이터캠퍼스 책이 유일하더라구요.

 

클릭하시면 서적정보로 이동합니다

 

 


시험은 어떻게 봤는지?

 

 

저는 대구광역시의 한국디지털직업전문학교에서 시험에 응시했습니다!

 

준비물은 신분증, 수험표를 챙겨가시면 되는데,

굳이 수험표가 없더라도 감독관님께서 시험 응시환경에 로그인한 이름을 보고 인정해주시긴 하더라구요!

 

단답형은 어찌어찌 모두 풀었는데,

작업형은 실전에 들어가니까 help, dir 명령어를 써서

가까스로 풀어보려고 노력해봐도 오류가 잡히질 않아서 멘붕이 왔습니다..

 

빅데이터분석기사 실기 시험이 쉽다고 하신분들은 정말 대단하신 듯 하네요..

결국 모두 핑계고 제가 공부를 안한 탓이긴 하죠 ;)

 

다음번 시험에 응시하실분들과 저를 위해 어떤문제가 나오는지 기재해드릴테니 참고해주세요!

 

[단답형]

향상도, 분포, 범주화, 최소최대정규화, 앙상블, 중심연결법, SVM, 인공신경망계산문제(0.13), 거리, 명목형

 

[작업형(1)]

1. 상위 70% 추출 후 사분위수 Q1의 값 구하기

import pandas as pd

a = pd.read_csv('/data')
a = al.iloc[: int(len(a)*0.7)]
answer = a['xl'].describe()['25%']
print(answer)

 

2. 2000년도 감염자 수의 평균보다 큰 나라의 개수 구하기

import pandas as pd

a = pd.read_csv('/data')
mean = a[a.index == 2000].mean(axis = 1)

answer = a[a.columns()[0]>mean].tolist()
answer = len(answer)
print(answer)

 

3. 결측치 비율이 가장 높은 변수명 구하기

import pandas as pd

a = pd.read_csv('/data')
print((a.isnull().sum()/len(a)).sort_values(ascending=False).index[0])

 

[작업형(2)]

import pandas as pd

a = pd.read_csv('/data')
b = pd.read_csv('/data')

y_train = a[['y']]
x_train = a.drop(columns = ['y'], axis = 1)

id = x_test.index

print(x_train.isnull().sum())
print(y_train.isnull().sum())
print(x_test.isnull().sum())

from sklearn.preprocessing import LabelEncoder
encoder = LabelEncoder()
x_train['x1'] = encoder.fit_transform(x_train['x1'])
x_train['x2'] = encoder.fit_transform(x_train['x2'])
x_train['x3'] = encoder.fit_transform(x_train['x3'])
x_train['x4'] = encoder.fit_transform(x_train['x4'])

x_test['x1'] = encoder.fit_transform(x_test['x1'])
x_test['x2'] = encoder.fit_transform(x_test['x2'])
x_test['x3'] = encoder.fit_transform(x_test['x3'])
x_test['x4'] = encoder.fit_transform(x_test['x4'])

train = pd.concat([x_train, y_train], axis = 1)
corr = train.corr()['y].sort_values(ascending = False)

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(x_train, y_train)
r2 = model.score()
print(r2)

pred = model.predict_proba(x_test)
pred = pred[:, 1]
answer = pd.DataFrame({'index' : id, 'y_pred' : pred})

print(answer)

answer.to_csv('0030020000_csv', index = False)

 

저는 작업형에서 완성을 못해서 보나마나 불합격이네요..

다음번 실기시험에는 열심히 준비해서 꼭 합격해보겠습니다 :)

반응형