반응형
도메인 1: 데이터 엔지니어링(채점되는 콘텐츠의 20%)
도메인 2: 탐색적 데이터 분석(채점되는 콘텐츠의 24%)
도메인 3: 모델링(채점되는 콘텐츠의 36%)
도메인 4: 기계 학습 구현 및 운영(채점되는 콘텐츠의 20%)
도메인 3: 모델링
태스크 설명 3.1: 비즈니스 문제를 ML 문제로 규정
- ML 을 사용해야 하는 경우와 그렇지 않은 경우를 결정
- 지도 학습과 비지도 학습의 차이점 이해
- 분류, 회귀, 예측, 클러스터링, 권장 사항 모델 중에서 선택
태스크 설명 3.2: 특정 ML 문제에 적합한 모델 선택
- XGBoost, 로지스틱 회귀, K-평균, 선형 회귀, 의사결정 트리, 랜덤 포레스트, RNN, CNN, 앙상블, 전이 학습
- 모델 배경을 직관적으로 표현
태스크 설명 3.3: ML 모델 훈련
- 훈련과 검증 간의 데이터 분할(예: 교차 검증)
- ML 훈련에 최적화된 기법 파악(예: 경사 하강법, 손실 함수, 수렴)
- 적절한 컴퓨팅 리소스 선택(예: GPU 또는 CPU, 분산 또는 비분산)
- 적절한 컴퓨팅 플랫폼 선택(Spark 또는 Spark 가 아닌 플랫폼)
- 모델 업데이트 및 재훈련
- 배치 또는 실시간/온라인 버전
태스크 설명 3.4: 하이퍼파라미터 최적화 수행
- 정규화 수행
- 드롭 아웃
- L1/L2
- 교차 검증 수행
- 모델 초기화
- 신경망 아키텍처(계층 및 노드), 학습률, 활성화 함수 이해
- 트리 기반 모델 이해(트리 수, 레벨 수)
- 선형 모델 이해(학습률)
태스크 설명 3.5: ML 모델 평가
- 과대 적합 또는 과소 적합 방지
- 편향과 분산 감지 및 처리
- 지표 평가(곡선형 아래 영역[AUC] - 수신기 작동 특성[ROC], 정확도, 정밀도, 재현율, 루트 평균 제곱 오차[RMSE], F1 점수)
- 혼동 행렬 해석
- 오프라인 및 온라인 모델 평가 수행(A/B 테스트)
- 지표를 사용하여 모델 비교(예: 모델 훈련 시간, 모델 품질, 엔지니어링 비용)
- 교차 검증 수행
반응형
'1차완료 > ML' 카테고리의 다른 글
AWS 에 나와있는 ML Specialty 시험범위 AWS 서비스 및 기능 (0) | 2024.01.20 |
---|---|
AWS 에 나와있는 ML Specialty 시험범위 도메인4/4 (0) | 2024.01.20 |
AWS 에 나와있는 ML Specialty 시험범위 도메인2/4 (0) | 2024.01.20 |
AWS 에 나와있는 ML Specialty 시험범위 도메인1/4 (0) | 2024.01.20 |
했던거, 남은거 (0) | 2024.01.19 |