분류 4

[빅데이터분석기사] 빅분기 제6회 실기 시험 합격 후기

안녕하세요! 3회차 빅데이터분석기사 필기시험을 합격한 다음에 가볍게 시도한 3회차 실기 시험에 떨어지고 주구장창 다른 자격증 시험에 푹 빠져있다가 6회차 시험이 되서야 실기시험에 다시 응시하게 되었습니다. 그런데 하필이면 이번 6회차 시험부터 단답형 유형이 없어지고 통계분석 관련 작업형 3유형이 추가되었는데요, 이번 6회 실기시험에서는 이 3유형이 말도 많고 탈도 많더라구요. 자세한 이야기는 빅데이터분석기사 시험을 한번 소개해드리고 적어보겠습니다! 빅데이터분석기사란? 빅데이터분석기사는 한국데이터산업진흥원에서 주관하는 기사 시험으로 필기시험과 실기시험을 차례로 합격하시면 자격을 얻게 됩니다. 실기시험은 작업형1~3 유형의 문제들을 파이썬이나 R로 풀어내셔야하며 컴퓨터가 있는 고사장에서 코딩을 하면서 푸는 ..

[빅데이터분석기사] 합성곱신경망(Convolutional Neural Network)

핵심요약 합성곱신경망(CNN)은 인공신경망 모델의 하나로 패턴을 찾아 이미지를 분석하는데 특화된 알고리즘이다. 주요 구성은 크게 합성곱(Convolution) 연산과 풀링(Pooling) 연산으로 나눌 수 있다. 합성곱 원본 이미지와 영상의 패턴을 추출할 수 있는 필터(Filter)를 이용하여 특징을 추출하는 과정이다. 필터는 원본 이미지를 움직이면서(Stribe) 이미지의 특징을 뽑아내는 결과물(Feature Map)을 만든다. 결과물(Feature Map)은 원본 이미지릐 인접한 픽셀 간 연관성 있는 패턴 정보를 잃지 않고 반영할 수 있다. 풀링(Pooling) 합성곱 연산을 통해 나온 결과물에서 대푯값들만 뽑아내는 과정이다. 이미지 패턴 정보를 단순화, 추상화하는 작업으로 생각할 수 있다. 풀링의 ..

[빅데이터분석기사] 의사결정나무(Decision Tree)

의사결정나무 일종의 분류 기법이다. 전체 집단을 계속 양분하는 분류기법으로써 분기가 발생하는 포인트(=노드)에는 기준이 되는 질문이 있어 기준 질문에 부합하냐(YES), 부합하지 않느냐(NO)에 따라 노드 이동의 방향이 결정된다. 의사결정나무 모형은 분류(classification)와 회귀예측(regression) 모두 가능한 알고리즘이다. 분류나무 모형은 불연속적(이산형 자료)인 값을 예측한다. 예를 들어 분류 모델은 다음과 같은 질문에 대한 답을 예측한다. '수신된 이메일이 스팸인가 아닌가?', '이 사진이 강아지인가 고양이인가 또는 햄스터인가?'와 같은 질문에 답을 내기 적합한 비지도 분류 알고리즘 모형이다. 한편 회귀분석의 한 갈래인 회귀나무 모형은 연속적인 값을 예측한다. 예를 들어 회귀 모델은..

[빅데이터분석기사] 파이썬 머신러닝(ML) 기본 틀 맛보기

일단 아래의 머신러닝 전 과정을 한번 훑고, 세부적으로 공부할 것 ---분석데이터 검토--- import pandas as pd data=pd.read_csv('데이터명', encoding='utf-8') data.head() print(data.shape()) ---특성(X)과 레이블(y) 나누기--- X1=data[['a', 'b', 'c']] y=data[['z']] ---train, test 데이터셋 나누기--- from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X1, y, stratify=y, random_state=42) ---정규화(MinMax)--- fr..