빅데이터분석기사/코드
[빅데이터분석기사] 실기 3회 1유형 풀이(Python)
EveningPrimrose
2023. 6. 16. 00:24
반응형
문제1
- 2022년 데이터 중 2022년 중앙값보다 큰 값의 데이터 수
- data : t1-data2.csv
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year')
m = df.loc["2022년"].median()
print(sum(df.loc["2022년", :] > m))
문제2
- 결측치 데이터(행)을 제거하고, 앞에서부터 60% 데이터만 활용해, 'f1' 컬럼 3사분위 값을 구하시오.
- 60%가 소수점일 경우 절사(예 : 36.6 일 때 36으로 계산)
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data1.csv")
df = df.dropna()
df = df.iloc[:int(len(df)*0.6)]
print(df['f1'].quantile(.75))
문제3
- 결측치가 제일 큰 값의 컬럼명을 구하시오
- data : t1-data1.csv
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certificataion/t1-data1.csv")
df.head()
# 풀이 1
df = pd.DataFrame(df.isnull().sum(), columns=['cnt_null'])
df = df['cnt_null'].sort_values(ascending=False)
print(df.index[0])
# 풀이 2
# df = df.isnull().sum()
# print(df.index[3])
반응형