1유형 3

[빅데이터분석기사] 실기 4회 1유형 풀이(Python)

문제 1 - age 컬럼의 3사분위수와 1사분위수의 차를 절대값으로 구하고, 소수점 버려서 정수로 출력 - data_path : ../input/bigdatacertificationkr/basic1.csv import pandas as pd df = pd.read_csv("../input/bigdatacertificationkr/basic1.csv") # print("1사분위 : ", df['age'].quantile(0.25)) # print("3사분위 : ". df['age'].quantile(0.75)) result = abs(df['age'].quantile(0.25) - df['age'].quantile(0.75)) # print("절대값 차이 : ", result) print(int(resul..

[빅데이터분석기사] 실기 3회 1유형 풀이(Python)

문제1 - 2022년 데이터 중 2022년 중앙값보다 큰 값의 데이터 수 - data : t1-data2.csv import pandas as pd df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year') m = df.loc["2022년"].median() print(sum(df.loc["2022년", :] > m)) 문제2 - 결측치 데이터(행)을 제거하고, 앞에서부터 60% 데이터만 활용해, 'f1' 컬럼 3사분위 값을 구하시오. - 60%가 소수점일 경우 절사(예 : 36.6 일 때 36으로 계산) import pandas as pd df = pd.read_csv("../input/big-d..

[빅데이터분석기사] 실기 2회 1유형 풀이(Python)

문제 1 - 데이터셋(basic1.csv)의 'f5' 컬럼을 기준으로 상위 10개의 데이터를 구하고, - 'f5' 컬럼 10개 중 최소값으로 데이터를 대체한 후, - 'age' 컬럼에서 80 이상인 데이터의 'f5' 컬럼 평균값 구하기 # 라이브러리 및 데이터 불러오기 import pandas as pd df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv') df.head() # f5 컬럼을 기준으로 내림차순 정렬 df = df.sort_value('f5' ascending = False) df.head(10) # 최소값 찾기 min = df['f5'][:10].min() min df.iloc[:10, -1] = min df.head(10) # 8..