정규화 4

[SQLD] 제40회 SQL 개발자(SQLD) 시험 합격 후기

안녕하세요! 오늘은 한국데이터산업진흥원에서 주관하는 SQL 개발자(SQLD) 시험에 응시하고 왔습니다! SQLD는 정보처리기사의 한 과목인 데이터베이스 과목과 유사한 시험이라고 보시면 되는데요, SQLD 시험을 준비하면서 어떻게 공부했는지, 시험은 어땠는지에 대한 리뷰를 작성해보겠습니다. SQL 개발자(SQLD) 시험이란? SQL 개발자(SQLD)는 국가공인 자격으로, 데이터모델이나 SQL 활용 관련 내용이 주제인데요, 여타 기사자격증처럼 필기와 실기로 나누어지는 시험이 아니라 한번만 응시하면 됩니다! 시험 유형은 PBT(Paper Based Test) 방식의 시험으로, 객관식 30문제, 주관식 10문제로 이루어져있습니다. 문제당 점수의 차등은 없고, 각 2점씩해서 100점 만점인 시험입니다. 과목은 데..

SQL개발자(SQLD) 2022.07.11

[빅데이터분석기사] 데이터 스케일링

1. 데이터 불러오기 및 확인 # 분석데이터(선거행동) 불러와서 데이터 확인 import pandas as pd data = pd.read_csv("Fvote.csv', encoding='utf-8') data.head() data.describe() data.hist(figsize=(20, 10)) 2. 특성(X)과 레이블(y) 나누기 # 특성 변수와 레이블 변수 나누기 X = data.loc[:, 'gender_female':'score_intention'] y = data[['vote']] # 특성변수와 레이블 변수 행열확인 print(X.shape) print(y.shape) (211, 13) (211, 1) 3. train-test 데이터셋 나누기 # 학습용 데이터(train)와 테스트용 데이터..

[빅데이터분석기사] 파이썬 데이터 정제 실습

1. 데이터 불러오기 및 탐색 import pandas as pd data = pd.read_csv('house_raw.csv') data.head() data.describe() data.hist(bins=50, figsize=(20, 15)) array([, ], [ ], [, ]], dtype=object) 2. 선형회귀 적용(정제 전 데이터) # 특성데이터셋, 레이블 데이터셋 나누기 X = data[data.column[0:5]] y = data[["house_value"]] # 학습용 데이터(tarin)와 테스트용 데이터(test) 구분을 위한 라이브러리 불러오기 from sklearn.model_selection import train_test_split X_train, X_test, y_tr..

[빅데이터분석기사] 주성분분석(Principal Component Analysis)

주성분분석 여러 특성(feature) 가운데 대표 특성을 찾아 분석하는 방식으로, 대표 특성의 선별은 자료의 차원을 고차원에서 하위 차원으로 축소하는(차원축소) 기법을 활용한다. 차원축소기법에 대한 이해가 주성분 분석의 시작이자 끝이며 여기서는 2차원을 1차원으로 축소하는 범위로 한정해 설명하고자 한다. 분산, 차원축소를 위한 주성분의 선택 기준 위 그림과 같이 차원축소를 위한 정사영의 시작은 무엇을 기준으로 선택되는 것일까? 선택에 따라 데이터의 실제 특성을 보존할 수도 있고 반대로 잃을 수도 있다. C1을 참고하면 우린 자연스럽게 데이터 간 거리가 가장 큰 쪽이 가장 강력한 데이터 변화 방향이란 사실을 직관적으로 이해할 수 있다. 결국 주성분 선택에 있어 최초로 고려되는 요소는 분산이 가장 큰 하나의..