본문 바로가기

1차완료/ML

AWS 에 나와있는 ML Specialty 시험범위 도메인3/4

반응형

도메인 1: 데이터 엔지니어링(채점되는 콘텐츠의 20%)

도메인 2: 탐색적 데이터 분석(채점되는 콘텐츠의 24%)

도메인 3: 모델링(채점되는 콘텐츠의 36%)

도메인 4: 기계 학습 구현 및 운영(채점되는 콘텐츠의 20%)

 

 

도메인 3: 모델링

태스크 설명 3.1: 비즈니스 문제를 ML 문제로 규정

  • ML 을 사용해야 하는 경우와 그렇지 않은 경우를 결정
  • 지도 학습과 비지도 학습의 차이점 이해
  • 분류, 회귀, 예측, 클러스터링, 권장 사항 모델 중에서 선택

태스크 설명 3.2: 특정 ML 문제에 적합한 모델 선택

  • XGBoost, 로지스틱 회귀, K-평균, 선형 회귀, 의사결정 트리, 랜덤 포레스트, RNN, CNN, 앙상블, 전이 학습
  • 모델 배경을 직관적으로 표현

태스크 설명 3.3: ML 모델 훈련

  • 훈련과 검증 간의 데이터 분할(예: 교차 검증)
  • ML 훈련에 최적화된 기법 파악(예: 경사 하강법, 손실 함수, 수렴)
  • 적절한 컴퓨팅 리소스 선택(예: GPU 또는 CPU, 분산 또는 비분산)
    • 적절한 컴퓨팅 플랫폼 선택(Spark 또는 Spark 가 아닌 플랫폼)
  • 모델 업데이트 및 재훈련 
    • 배치 또는 실시간/온라인 버전

태스크 설명 3.4: 하이퍼파라미터 최적화 수행

  • 정규화 수행
    • 드롭 아웃
    • L1/L2
  • 교차 검증 수행
  • 모델 초기화
  • 신경망 아키텍처(계층 및 노드), 학습률, 활성화 함수 이해
  • 트리 기반 모델 이해(트리 수, 레벨 수)
  • 선형 모델 이해(학습률)

태스크 설명 3.5: ML 모델 평가

  • 과대 적합 또는 과소 적합 방지
    • 편향과 분산 감지 및 처리
  • 지표 평가(곡선형 아래 영역[AUC] - 수신기 작동 특성[ROC], 정확도, 정밀도, 재현율, 루트 평균 제곱 오차[RMSE], F1 점수)
  • 혼동 행렬 해석
  • 오프라인 및 온라인 모델 평가 수행(A/B 테스트)
  • 지표를 사용하여 모델 비교(예: 모델 훈련 시간, 모델 품질, 엔지니어링 비용)
  • 교차 검증 수행
반응형