빅데이터분석기사/코드

[빅데이터분석기사] 실기 3회 1유형 풀이(Python)

EveningPrimrose 2023. 6. 16. 00:24
반응형

문제1

 - 2022년 데이터 중 2022년 중앙값보다 큰 값의 데이터 수

 - data : t1-data2.csv

import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year')

m = df.loc["2022년"].median()
print(sum(df.loc["2022년", :] > m))

 

문제2

 - 결측치 데이터(행)을 제거하고, 앞에서부터 60% 데이터만 활용해, 'f1' 컬럼 3사분위 값을 구하시오.

 - 60%가 소수점일 경우 절사(예 : 36.6 일 때 36으로 계산)

import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data1.csv")

df = df.dropna()
df = df.iloc[:int(len(df)*0.6)]
print(df['f1'].quantile(.75))

 

문제3

 - 결측치가 제일 큰 값의 컬럼명을 구하시오

 - data : t1-data1.csv

import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certificataion/t1-data1.csv")
df.head()

# 풀이 1
df = pd.DataFrame(df.isnull().sum(), columns=['cnt_null'])
df = df['cnt_null'].sort_values(ascending=False)
print(df.index[0])

# 풀이 2
# df = df.isnull().sum()
# print(df.index[3])

 

반응형