반응형

전체 글 173

[빅데이터분석기사] 로지스틱 회귀분석(Logistic Regression Analysis)

로지스틱 회귀 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고, 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류하는 기법이다. 0.5 보다 크면 어떤 사건이 일어난다.(성공확률) 0.5 보다 작으면 어떤 사건이 일어나지 않는다.(실패확률) 합격/불합격, 성공/실패, 생존/사망, 진실/거짓 등 이분법적인 결과를 도출하기 위해 주로 사용되는 회귀분석 방식으로 예측을 주목적으로 하는 회귀분석과 차이가 있다. 로지스틱 회귀분석 방법 로지스틱 회귀 분석은 이진 분류를 수행한믄 데 사용된다. 즉, 데이터 샘플을 양성(1) 또는 음성(0) 클래스 둘 중 어디에 속하는지 예측한다. 각 속성(feature)들의 계수 log-odds를 구한 후 시그모이드 함수를 적용하여 실제로 데이터가 해..

[빅데이터분석기사] 회귀분석(Regression Analysis)

회귀분석 일반적으로 예측을 목표하는 통계 분석이다. 예측을 하는 방법에 핵심이 되는 개념이 바로 '추세선'이다. 좌표상에서 데이터의 분포와 앞으로의 변화를 가장 잘 설명할 수 있는 하나의 선을 그려내는 것이 회귀분석의 궁극적인 목적이 된다. 추세선의 의미 직선의 추세선을 수식으로 표현하면, y=ax+b와 같은 1차 방정식이 된다. 여기서 x와 y는 이미 알고 있는 데이터값이다. 여기서 수식을 활용해 데이터 변화의 추세를 확인하는 방법은 x와 y에 들어오는 값을 기준으로 해당 수식을 충족시키는 a(=기울기), b(=절편) 값을 찾는 것이다. 즉, 추세선을 통한 회귀적 예측이란 곧 a, b를 구하는 과정을 말하는 것이다. 여기서 a와 b를 '회귀계수'라 한다. 회귀의 시작, 최소제곱법(=최소자승법 Ordin..

[빅데이터분석기사] 주성분분석(Principal Component Analysis)

주성분분석 여러 특성(feature) 가운데 대표 특성을 찾아 분석하는 방식으로, 대표 특성의 선별은 자료의 차원을 고차원에서 하위 차원으로 축소하는(차원축소) 기법을 활용한다. 차원축소기법에 대한 이해가 주성분 분석의 시작이자 끝이며 여기서는 2차원을 1차원으로 축소하는 범위로 한정해 설명하고자 한다. 분산, 차원축소를 위한 주성분의 선택 기준 위 그림과 같이 차원축소를 위한 정사영의 시작은 무엇을 기준으로 선택되는 것일까? 선택에 따라 데이터의 실제 특성을 보존할 수도 있고 반대로 잃을 수도 있다. C1을 참고하면 우린 자연스럽게 데이터 간 거리가 가장 큰 쪽이 가장 강력한 데이터 변화 방향이란 사실을 직관적으로 이해할 수 있다. 결국 주성분 선택에 있어 최초로 고려되는 요소는 분산이 가장 큰 하나의..

[빅데이터분석기사] 상관분석(Correlation Analysis)

상관분석 상관분석은 x와 y변수 간에 관계가 어떤 선형적인 관계를 갖고 있는지를 파악한다. 두 변수 간의 관계의 강도도 계산할 수 있다. 두 변수가 변하는 패턴이 얼마나 비슷한가를 확인하는 과정이 상관분석이다. 상관관계에 따른 산포도는 아래 그림과 같이 나타낼 수 있으며, x축과 y축으로 구성하여 흩어진 정도를 표현할 수 있다. 공분산(Covariance), X축 분산과 Y축 분산의 평균으로 방향을 알다 상관관계를 표현하는 통계량의 일종으로 x의 분산과 y의 분산을 곱한 것의 기댓값이다. x의 편차와 y의 편차를 서로 곱한 개념임을 수식을 통해 알 수 있다. 만약 첫 번째 항이 (+)이고 두 번째 항이 (+)라면 공분산값은 (+)로 계산된다. 두 항 모두 (-)라도 (+)로 공분산이 나오게 된다. 그러므..

[빅데이터분석기사] 분산분석(Analysis of Variance, ANOVA)

분산분석(=변량분석) 자료 간의 차이를 대조시키는 분석기법이다. 여기서 분산은 평균을 중심으로 데이터가 얼마나 퍼져있는지를 표현하는 통계량이다. 만약 데이터의 퍼짐이 없고 모든 개별 데이터값들이 동일하다면, 편차가 없으므로 분산은 '0'이 될 것이다. A학급 경우가 바로 분산이 0이 되는 경우다. 각 대표 학생 4명의 점수가 모두 100점으로 평균이 100이라 편차가 없기 때문이다. 편차가 없다는 의미는 데이터가 좌표상에서 모두 한 점에 찍힌다는 말과 같다. C학급과 D학급은 일단 평균이 같다. 그런데 학생별 점수 데이터를 확인해보면 C학급에 비해 D학급의 대표 학생별 점수 편차가 더 크다는 것을 확인할 수 있다. 실제로 공식에 대입해 편차를 구하고 분산을 계산해보면, C학급은 1,933, D학급은 10..

[빅데이터분석기사] 교차분석(Cross-tabulation Analysis)

교차분석 교차분석이란, 비교 대상이 되는 항목들의 빈도를 이용하여 자료 간 관계의 유의성을 파악할 때 사용한다. 주로 '범주형' 자료 간의 관계를 확인하는 데 쓰이며, 전체 비율을 통해 예산빈도를 구하여 실제빈도와의 차이를 대조하는 방식이다. 아래는 당뇨 환자 25명과 당뇨가 없는 정상인 75명의 인원 총 100명의 비만 유무를 조사한 결과이다. 100명 가운데 비만(20)과 정상(80) 체중의 구성비가 1:4이므로 당뇨환자군 안에서 비만과 정상의 비율 역시 1:4, 비환자군 안에서도 1:4의 비율로 환자 수가 도출될 것을 예상해 볼 수 있다. 이를 기대빈도(예상빈도)라 한다. 당연히 실제로 빈도수는 예상과 다를 것이다. 관측빈도 부분을 보면 당뇨환자 25명 중 비만인 사람은 10명, 정상체중인 사람은 ..

[전자계산기조직응용기사] 2022년 제1회 필답형 실기 후기

안녕하세요! 필기합격 후 작년 3회차 실기시험을 56점으로 낙방하고 난 뒤, 올해 1회차 실기시험에 다시 응시했습니다! 전자계산기조직응용기사 시험이 생소하신 분들도 분명 있으실테니, 간략하게 소개 먼저 해드리고나서 시험 후기를 알려드리겠습니다! 전자계산기조직응용기사 시험이란? 전자계산기조직응용기사는 한국산업인력공단에서 주관하는 기사급 시험으로 필기시험과 실기시험을 차례로 합격하게 되면 자격이 주어지게 됩니다. 실기시험은 2019년 1회차 시험까지는 필답형+작업형이었는데, 2019년 3회차 시험부터 100% 필답형으로 바뀌게 되었죠! 따라서 PBT(Paper Based Test) 방식의 시험이며, 주관식 20문제를 2시간 이내에 풀어주시면 되고, 시험시간은 9시 30분~11시 30분까지, 시험 시간의 절반..

[정보보안기사] 2022년도 1회차(19회) 실기 시험 불합격 후기

안녕하세요! 지난번 합격했던 정보보안기사 필기 시험에 이어서, 실기 시험을 보고 왔습니다! 이번회차 시험의 이슈는 자격시험 주관 기관이 한국인터넷진흥원(KISA)에서 한국방송통신전파진흥원(KCA)로 변경되었다는 점인데요, 한국인터넷진흥원(KISA) 주관의 시험일 때에는 매 시험이 논란일 정도로 난이도가 어려웠었는데 그나마 이번 시험은 '이걸 어떻게 맞추지?'라는 문제는 없어서 저를 포함한 수험생분들의 체감난이도는 상대적으로 낮았던 것 같습니다! 정보보안기사 시험이란? 정보보안기사는 한국방송통신전파진흥원(KCA)에서 주관하는 기사급 시험으로, 필기시험과 실기시험을 차례로 응시하여 합격하시면 자격이 주어지게 됩니다! 실기시험은 필답형 시험으로 PBT(Paper Based Test) 방식의 시험으로 단답형 1..

정보보안기사 2022.05.20

[정보보안기사] 2022년도 1회차(19회) 필기 시험 합격 후기

안녕하세요! 2022년도 1회차 정보보안기사 필기 시험은 기존의 주관기관인 한국인터넷진흥원(KISA)가 아니라 정보통신기사 등의 자격주관기관인 한국방송통신전파진흥원(KCA) 주관으로 변경되었습니다! 한국인터넷진흥원 주관의 시험일 떄에는 시험 합격률이 매우 낮아서 수차례 공부하고 응시해도 낙방하기 일쑤였었는데요, 그래도 자격주관기관이 변경되고 나서 문제도 좀 쉬워지지 않을까?라는 기대감과 함께 다시 정보보안기사 필기 시험부터 응시하게 되었습니다! 정보보안기사 시험이란? 정보보안기사 시험은 한국방송통신전파진흥원(KCA)에서 주관하는 기사급 시험으로, 필기시험과 실기시험을 차례로 응시하여 합격하시면 자격이 주어지게 됩니다! 필기시험은 PBT(Paper Based Test)으로 진행되며 100문제를 2시간 30..

정보보안기사 2022.05.19

[빅데이터분석기사] 제3회 실기 시험 불합격 후기

안녕하세요! 일전에 빅데이터분석기사 필기시험에 응시해서 합격한 후 지난 12월 4일에 빅데이터분석기사 실기시험에 응시하고 왔습니다! 저는 IT 전공자에 전산실 기획업무를 담당하고 있지만 파이썬이나 R 언어를 다룰일이 없어 시험이 어렵게만 느껴졌던거 같습니다(물론 공부를 더 하면 됐겠지만..). 빅데이터분석기사 시험이 익숙치 않은분들을 위해 소개를 먼저 해드리고, 후기도 작성해드리겠습니다! 빅데이터분석기사 시험이란? 빅데이터분석기사 시험은 한국데이터산업진흥원(K-Data)에서 주관하는 기사급 시험으로 필기시험과 실기시험 두가지를 차례로 합격하시면 자격이 주어지게 됩니다. 실기시험은 빅데이터 분석 실무 관련 단답형과 작업형 문제들을 풀어내셔야 하는데 종이에 적어서 제출하는 방식이 아니라 컴퓨터가 있는 고사장..

반응형