반응형

분류 전체보기 186

[ADsP] 제30회 데이터분석준전문가(ADsP) 시험 합격 후기

안녕하세요! 지난번 28회차 데이터분석준전문가(ADsP) 시험에서 54점으로 떨어져서 30회차 시험에 재도전했고, 그 과정을 리뷰해보도록 하겠습니다. 분명 재도전인데 책을 펴보니 아리송한 말들로 가득하더라구요.. ㅎㅎ 데이터분석준전문가(ADsP) 시험이란? 데이터분석준전문가(ADsP)는 국가공인 자격으로, 데이터기획이나 데이터분석 관련 내용이 주제인데요, 여타 기사자격증처럼 필기와 실기로 나누어지는 시험이 아니라 한번만 응시해서 합격하시면 됩니다! 시험 유형은 PBT(Paper Based Test) 방식의 시험으로, 객관식 40문제, 주관식 10문제로 이루어져있습니다. 문제당 점수의 차등은 없고, 각 2점씩해서 100점 만점인 시험입니다. 과목은 데이터 이해 / 데이터분석 기획 / 데이터분석 3과목으로 ..

[ADsP] 제28회 데이터분석준전문가 시험 불합격 후기

안녕하세요! 데이터 산업이 4차산업혁명의 신사업으로 떠오르면서, 저도 한번 배워봐야겠다는 생각으로 관련 자격증을 찾아보다가 데이터분석준전문가(ADsP)를 찾았는데요, 한국데이터산업진흥원에서 주관하는 데이터분석준전문가(ADsP) 28회 시험을 준비하면서 시험 접수, 어떻게 공부했는지, 시험은 어떻게 봤는지에 대한 후기를 작성해보겠습니다! 데이터분석준전문가(ADsP) 시험이란? 데이터분석준전문가(ADsP)는 국가공인 자격으로, 데이터기획이나 데이터분석 관련 내용이 주제인데요, 여타 기사자격증처럼 필기와 실기로 나누어지는 시험이 아니라 한번만 응시하면 됩니다! 시험 유형은 PBT(Paper Based Test) 방식의 시험으로, 객관식 40문제, 주관식 10문제로 이루어져있습니다. 문제당 점수의 차등은 없고,..

[빅데이터분석기사] 모델평가

1. 데이터 불러오기 및 데이터셋 분할 # 분석 데이터 불러오기 import warnings warnings.filterwarnings("ignore") import pandas as pd data = pd.read_csv('Fvote.csv', encoding='utf-8') # 특성치와 레이블 데이터셋 구분 X = data[data.columns[1:13]] y = data[['vote']] # 훈련 데이터, 테스트 데이터 분할 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42) 2. Grid Search..

[빅데이터분석기사] 순환신경망(Recurrent Neural Network)

핵심요약 순환신경망(Recurrent Neural Network)은 시간 순서가 있는 데이터를 잘 예측하도록 설계된 인공신경망 모델들 중 하나이다. 과거의 신호를 기억할 수 있는 장치(Hidden State)를 두어 입력신호를 순환, 반복하는 순환적 구조를 갖고 있어서 시간적 순서 특성을 추출하는데 용이하다. 특징 일반적인 인공신경망이 은닉층을 통해 한꺼번에 가중치 연산이 이루어 지는 것과 비교해서 순환신경망은 이전 데이터의 가중치 연산이 다음 데이터에 일정 부분 영향을 줄 수 있도록 구성되어 있다. 이러한 구조는 시간 순서의 정보가 중요한 데이터에서 이전 데이터를 보고 다음 데이터를 예측하는데 도움을 준다. 순차 데이터(Sequential Data) 순서나 시간이 전체 데이터에서 의미가 있으며 그 순서..

[빅데이터분석기사] 합성곱신경망(Convolutional Neural Network)

핵심요약 합성곱신경망(CNN)은 인공신경망 모델의 하나로 패턴을 찾아 이미지를 분석하는데 특화된 알고리즘이다. 주요 구성은 크게 합성곱(Convolution) 연산과 풀링(Pooling) 연산으로 나눌 수 있다. 합성곱 원본 이미지와 영상의 패턴을 추출할 수 있는 필터(Filter)를 이용하여 특징을 추출하는 과정이다. 필터는 원본 이미지를 움직이면서(Stribe) 이미지의 특징을 뽑아내는 결과물(Feature Map)을 만든다. 결과물(Feature Map)은 원본 이미지릐 인접한 픽셀 간 연관성 있는 패턴 정보를 잃지 않고 반영할 수 있다. 풀링(Pooling) 합성곱 연산을 통해 나온 결과물에서 대푯값들만 뽑아내는 과정이다. 이미지 패턴 정보를 단순화, 추상화하는 작업으로 생각할 수 있다. 풀링의 ..

[빅데이터분석기사] 모델훈련과 튜닝

1. 데이터 불러오기 및 데이터셋 분할 # 분석 데이터 불러오기 import warning warning.filterwarnings("ignore") import pandas as pd data = pd.read_csv('Fvote.csv', encoding='utf-8') # 특성치와 레이블 데이터셋 구분 X = data[data.columns[1:13]] y = data[['vote']] # 훈련 데이터, 테스트 데이터 분할 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, statify=y, random_state=42) 2. Grid Search # ..

[빅데이터분석기사] 데이터 스케일링

1. 데이터 불러오기 및 확인 # 분석데이터(선거행동) 불러와서 데이터 확인 import pandas as pd data = pd.read_csv("Fvote.csv', encoding='utf-8') data.head() data.describe() data.hist(figsize=(20, 10)) 2. 특성(X)과 레이블(y) 나누기 # 특성 변수와 레이블 변수 나누기 X = data.loc[:, 'gender_female':'score_intention'] y = data[['vote']] # 특성변수와 레이블 변수 행열확인 print(X.shape) print(y.shape) (211, 13) (211, 1) 3. train-test 데이터셋 나누기 # 학습용 데이터(train)와 테스트용 데이터..

[빅데이터분석기사] 데이터셋 분할과 모델검증

1. 특성치(X), 레이블(y) 나누기 # 데이터셋 불러오기 및 확인 import warnings warning.filterwarnings("ignore") import pandas as pd data = pd.read_csv('Fvote.csv', encoding='utf-8') data.head() # 특성변수 데이터셋 나누기 # 방법1 : 특성이름으로 데이터셋 나누기 X = data[['gender_female', gender_male', 'region_Chungcheong', 'region_Honam' 'region_Others', region_Sudo', 'region_Youngnam', 'edu', 'income', 'age', 'score_gov', 'score_pregress', 'scor..

[빅데이터분석기사] 범주변수의 변환(one-hot-encoding)

1. 데이터범주-연속-레이블로 나누기 # vote(유권자 선거행동) 데이터셋 불러오기 및 확인 import pandas as pd data = pd.read_csv('vote.csv', encoding='utf-8') data.head() # 범주변수와 기타 변수를 각각 X1과 XY로 나누기 X1 = data[['gender', 'region']] XY = data[['edu', 'income', 'age', 'score_gov', 'score_progress', 'score_intention', 'vote', 'parties']] 2. 범주형 변수의 One-hot-encoding 변환 # 성별(gender)과 출신지역(region)의 숫자를 문자로 변환 X1['gender'] = X1['gender']..

[빅데이터분석기사] 심층신경망(Deep Neural Network)

핵심요약 심층신경망(Deep Neural Network)은 인공신경망(Aritificial Neural Network)과 동일한 구조와 동작 방식을 갖고 있다. 심층신경망은 단지 인공신경망에서 은닉층(Hidden Layer)의 깊이가 깊어진 형태를 말한다. 신경망의 발전계기 인공신경망의 기본 아이디어가 나온 것은 1950년대이고 이후에 발전을 거듭하지만 불과 2000년대 중반까지만 해도 사람들로 하여금 그다지 알려지고 활용되던 기술이 아니었다. 여기에는 몇 가지 이유가 있는데 하나는 당시에 GPU와 같은 수많은 가중치를 빠르게 계산할 수 있는 자원(Resource)이 충분치 않았고, 사람이 원하는 수준으로 성능을 올리기 위해서 필요했던 충분한 양의 데이터(Data)를 모으기에도 인프라가 부족했다. 또한 ..

반응형