반응형
문제1
- 2022년 데이터 중 2022년 중앙값보다 큰 값의 데이터 수
- data : t1-data2.csv
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year')
m = df.loc["2022년"].median()
print(sum(df.loc["2022년", :] > m))
문제2
- 결측치 데이터(행)을 제거하고, 앞에서부터 60% 데이터만 활용해, 'f1' 컬럼 3사분위 값을 구하시오.
- 60%가 소수점일 경우 절사(예 : 36.6 일 때 36으로 계산)
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification/t1-data1.csv")
df = df.dropna()
df = df.iloc[:int(len(df)*0.6)]
print(df['f1'].quantile(.75))
문제3
- 결측치가 제일 큰 값의 컬럼명을 구하시오
- data : t1-data1.csv
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certificataion/t1-data1.csv")
df.head()
# 풀이 1
df = pd.DataFrame(df.isnull().sum(), columns=['cnt_null'])
df = df['cnt_null'].sort_values(ascending=False)
print(df.index[0])
# 풀이 2
# df = df.isnull().sum()
# print(df.index[3])
반응형
'빅데이터분석기사 > 코드' 카테고리의 다른 글
[빅데이터분석기사] 실기 4회 1유형 풀이(Python) (0) | 2023.06.16 |
---|---|
[빅데이터분석기사] 실기 3회 2유형 풀이(Python) (0) | 2023.06.16 |
[빅데이터분석기사] 실기 2회 2유형 풀이(Python) (0) | 2023.06.15 |
[빅데이터분석기사] 실기 2회 1유형 풀이(Python) (0) | 2023.06.14 |
[빅데이터분석기사] 작업형 2유형 연습문제 #2 (0) | 2023.06.14 |