CLUE Future Data Scientist

[Review/Test] ADP 실기 합격 후기 / 제 29회 ADP 문제 복기


안녕하세요! 29회 ADP 자격증 후기를 쪄왔습니다. 사실 시험을 본지 거의 한 달이 꼬박 지나서 기억이 잘 안 나지만! 운 좋게 합격하게 되었네요. 기억을 되짚어 문제 복기를 해보겠습니다.



먼저 합격 점수! 커트라인 75점에서 0.3점 더 높네요 ㅋㅋ 심사위원분들 정말 감사합니다..

image-1



1. 머신러닝

크게 두 문제가 출제되었고, 새끼 문제들이 약 5개씩 있었던 것 같습니다.


1-1. 머신러닝 모델 학습

데이터는 정확히 기억이 안 나는데, Y는 연속형이었습니다. 그런데 문제는 이 Y를 특정 기준으로 나눠서 이진(0,1)으로도 예측하고 그냥 연속형으로도 예측하는 머신러닝을 구현하는 것이었습니다. 그래서 Regression도 하고, Classification도 했었던 기억이.. 저는 둘 다 RandomForest와 GradientBoosting 이용했던 것 같습니다. 그리고 둘 중 더 성능이 높았던 모델을 최종 모델로 선택했습니다.

그리고 항상 문제가 그렇듯, 머신러닝 모델 학습 이전에 EDA와 이상치 처리 등을 진행했습니다. 이런 과정들을 자신만의 논리로 설명하고 정리해서 제출했습니다. 저는 가끔 필요하면 Python 결과 캡처도 넣었던 기억이..


1-2. 야구 데이터

저는 이 문제를 거의 날려서 기계학습 과목 점수가 높지 않네요 ㅋㅋ 데이터 전처리부터 어려웠습니다. 9회까지 각 선수들이 플레이를 적어두고 어떤 플레이 (ex 땅볼)이 Y 승리에 도움이 되는가를 예측하는 알고리즘을 짜는 식이었습니다. 정확한 문제는 기억이 안 나지만 이런 흐름으로 새끼 문제들도 출제되었습니다. 이거는 5개 중에 SMOTE 샘플링하는 문제 하나 정도 풀었는데 나머지는 시간도 부족하고 어려워서 시도도 못하고 제출했습니다.





2. 통계분석

통계 분석이 문제가 많았는데 거의 다 풀었던 것 같습니다. 근데 정확히 기억은 또 안 난다는 점..


2-1. 확률 계산, 이항 분포 -> 정규 근사

이항 분포를 정규 근사해서 Z값 구하고 했던 것 같습니다..

2-2. 베이지안 통계

이 문제가 가장 쉬웠는데, 그냥 베이지안 확률 계산 문제였습니다.

2-3. T-test

two sample T-Test였던 것 같은데.. 귀무가설/대립가설 설정하고 P-value로 가설 검정하는 형식이었습니다.

2-4. F-test

anova로 F-Test하고, 마찬가지로 귀무가설/대립가설 설정하고 F값과 P-value로 가설 검정하는 형식이었습니다. 그리고 이 F-Test 결과가 그룹 간 Y의 평균이 다르다는 결론이 나왔고 그다음 Tueky 사후검정도 진행했습니다.

유일하게 문제가 자세히 생각이 나는데, 자동차 종류(세단, 트럭, 버스, ??)에 따른 사고 피해 정도 데이터였고, F-Test 결과 귀무가설(자동차 종류에 따른 사고 피해 정도에 차이가 없다)가 기각되어서, Tueky Test한 결과, 특히 세단-트럭, 세단-버스일 경우에 P-value 값이 특정 기준(0.05?)보다 작아 사고 피해 정도에 차이가 크게 나는 것으로 확인할 수 있었습니다.



29회가 머신러닝 야구 데이터 문제를 제외하고는 난이도가 상대적으로 어렵지 않았던 것 같습니다. 야구 문제는 범주형 데이터도 다루고 오버샘플링도 다뤘던 것 같습니다. 그래도 클러스터링, 시계열 등의 문제는 없었던 것으로 기억합니다.



꿀팁

시험을 보면서 느꼈던 것은 시험 시간이 4시간임에도 굉장히 부족하다는 점.. 그리고 뒷부분 풀다 보면 앞부분 EDA를 내가 어떻게 진행했는지 기억도 안 난다는 점.. 그래서 개인적으로는 python이나 R 코드를 짤 때부터 조금씩은 주석을 남겨두고 마지막 50분~1시간 정도 남았을 때 30분 안쪽으로 레포트에 할애한 후, 못 푼 문제를 푸는 것을 추천해 드립니다. 레포트를 너무 마지막에 진행하다가 날아가거나 제출을 제대로 못 하면 정말 멘붕이니까요~


그리고 저는 모든 문제에 대해 표 두 개를 만들어서 표 앞에 진행 과정 설명, 표1-코드 복붙, 표2-결론 이런 식으로 작성했습니다. 다음과 같은 예시처럼요! 이 고정 템플릿을 두고 쓰니까 내용이 너무 길어지지 않아서 시간도 아끼고, 결론과 핵심을 (심사위원이 보기에도) 명확히 표현해서 통계분석 결과도 좋지 않았나 생각이 듭니다. 참고만 하세요!

image-2


ADP 실기 응시하는 분들 모두 화이팅! 이 후기가 조금이라도 도움이 되시길 ㅎㅎ