빅데이터분석기사 55

[빅데이터분석기사] 파이썬 머신러닝(ML) 기본 틀 맛보기

일단 아래의 머신러닝 전 과정을 한번 훑고, 세부적으로 공부할 것 ---분석데이터 검토--- import pandas as pd data=pd.read_csv('데이터명', encoding='utf-8') data.head() print(data.shape()) ---특성(X)과 레이블(y) 나누기--- X1=data[['a', 'b', 'c']] y=data[['z']] ---train, test 데이터셋 나누기--- from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X1, y, stratify=y, random_state=42) ---정규화(MinMax)--- fr..

[빅데이터분석기사] 교차분석(Cross-tabulation Analysis)

교차분석(Cross-tabulation Anlaysis) 비교 대상이 되는 항목들의 빈도를 이용하여 자료 간 관계의 유의성을 파악할 때 사용한다. 주로 '범주형' 자료 간의 관계를 확인하는 데 쓰이며, 전체 비율을 통해 예상빈도를 구하여 실제빈도와의 차이를 대조하는 방식이다. 아래는 당뇨환자 25명과 당뇨가 없는 정상인 75명의 인원 총 100명의 비만 유무를 조사한 결과이다. 100명 가운데 비만(20)과 정상(80) 체중의 구성비가 1:4이므로 당뇨환자군 안에서 비만과 정상의 비율 역시 1:4, 비환자군 안에서도 1:4의 비율로 환자 수가 도출될 것을 예상해 볼 수 있다. 이를 기대빈도(예상빈도)라 한다. 당연히 실제로 빈도수는 예상과 다를 것이다. 관측빈도 부분을 보면 당뇨환자 25명 중 비만인 사..

[빅데이터분석기사] 연관규칙분석(Association Rule Analysis)

연관분석 연관분석이란, 대량의 트랜잭션 정보로부터 개별 데이터(변수) 사이에서 연관규칙(x면 y가 발생)을 찾는 것을 말한다. 가령 슈퍼마켓의 구매내역에서 특정 물건의 판매 발생 빈도를 기반으로 'A 물건을 구매하는 사람들은 B 물건을 구매하는 경향이 있다.'라는 규칙을 찾을 수 있다. 다른 말로 장바구니 분석(Market Basket)이라 한다. 연관규칙 조건 결과의 빈도수를 기반으로 표현되기 때문에 비교적 결과를 쉽게 이해할 수 있다. 구매내역의 자료 구조를 가지기 때문에 특별한 전처리 과정을 필요로 하지 않는다. 그러나 품목의 개수가 늘어남에 따라 분석에 필요한 계산의 수가 기하급수적으로 증가하는 단점이 있다. 넷플릭스(Netflex)도 연관규칙을 추천 알고리즘에 적용했다. A영화에 대한 시청 결과..

[빅데이터분석기사] 실기 시험 준비 전 꿀팁

안녕하세요! 요전번에 빅데이터분석기사 필기 시험에 합격하고 본격적으로 빅데이터분석기사 실기 시험에 대비하려고 하는데, 한국데이터산업진흥원에서 빅데이터분석기사 실기시험 응시 가이드 문서를 올려준게 있더라구요! ※ 원문은 아래 파일을 참고 제약사항에서 몇가지 팁이 있어서 공유하고자 글을 적습니다! 1. 라인별 실행, 그래프 기능, 단축키, 자동완성 기능 미제공 → 라인별 실행이 되지 않는다는 것은 전체 분석 코드를 한 번에 실행하라는 의미이므로, 분석을 하면서 각 단계별 코드 결과를 확인하기보다 데이터 불러오기부터 머신러닝 수행까지 전체 핵심코드를 한번에 수행해야 함 → 단축키와 자동완성 기능이 제공되지 않는다는 것은 코드를 외워서 응시해야한다는 의미 2. 코드 실행 시간은 1분으로 제한 → 수 만건 이상의..

[빅데이터분석기사] 제3회 빅데이터분석기사 필기 시험 후기

안녕하세요! 지난 빅데이터분석기사 2회 시험의 합격률이 필기 41.2%, 실기 59.2%라고 하는데요, 저는 필기시험을 55점으로 탈락하고, 다시 3회차 필기시험에 재도전하게 되었습니다! 간략하게 빅데이터분석기사 소개부터 해드리고, 시험후기를 적어드리겠습니다 :) 빅데이터분석기사 시험이란? 빅데이터분석기사 시험은 한국데이터산업진흥원에서 주관하는 기사급 시험으로, 필기시험, 그리고 실기시험 두가지를 응시하여 합격하시면 자격이 주어지게 됩니다! 필기시험은 PBT(Paper Based Test) 방식의 시험입니다. 문제는 모두 객관식이고, 총 80문제입니다! 빅데이터분석기사는 아래 중 하나에 해당하시면 응시하실 수 있습니다. 1. 대학졸업자등 또는 졸업예정자 (전공 무관) 2. 3년제 전문대학 졸업자등으로서 ..