반응형
# pandas 문법으로 풀이
import pandas as pd
a = pd.read_csv('data/mtcars.csv', index_col=0)
# Min Max Scale은 (X-min) / (max-min)
qsec_max = a['qsec'].max()
qsec_min = a['qsec'].min()
a['minmax_scaled_qsec'] = (a['qsec'] - qsec_min) / (qsec_max - qsec_min)
over_0_5 = a[a['minmax_scaled_qsec'] > 0.5]
nrows = over_0_5.shape[0]
print(f'Pandas 문법 사용 했을 때 0.5보다 큰 레코드 수는 {nrows}')
# sklearn의 MinMaxScaler 사용
import pandas as pd
a = pd.read_csv('data/mtcars.csv', index_col=0)
from sklearn.preprocessing import MinMaxScaler
mms = MinMaxScaler()
# 단일 컬럼에 대해 스케일링 적용 시 데이터[컬럼]이 아니라 데이터[[컬럼]] 적용 필요
a['sklearn_scaled_qsec'] = mms.fit_transform(a[['qsec']])
over_0_5 = a[a['sklearn_scaled_qsec'] > 0.5]
nrows = over_0_5.shape[0]
print(f'sklearn 사용 했을 때 0.5보다 큰 레코드 수는 {nrows}')
반응형
'빅데이터분석기사 > 코드' 카테고리의 다른 글
[빅데이터분석기사] 작업형 1유형 연습문제 #1 (0) | 2023.05.30 |
---|---|
[빅데이터분석기사] 작업형 2유형 예시문제 풀이 (0) | 2023.05.25 |
[빅데이터분석기사] 6회 실기시험부터 적용되는 작업형 3유형 풀이 (1) | 2023.05.23 |
[빅데이터분석기사] 모델평가 (0) | 2022.06.17 |
[빅데이터분석기사] 모델훈련과 튜닝 (0) | 2022.06.14 |