반응형
도메인 1: 데이터 엔지니어링(채점되는 콘텐츠의 20%)
도메인 2: 탐색적 데이터 분석(채점되는 콘텐츠의 24%)
도메인 3: 모델링(채점되는 콘텐츠의 36%)
도메인 4: 기계 학습 구현 및 운영(채점되는 콘텐츠의 20%)
도메인 1: 데이터 엔지니어링
태스크 설명 1.1: ML 용 데이터 리포지토리 생성
- 데이터 원본 식별(예: 콘텐츠 및 위치, 사용자 데이터와 같은 주요 소스)
- 스토리지 매체 결정(예: 데이터베이스, Amazon S3, Amazon Elastic File System[Amazon EFS], Amazon Elastic Block Store[Amazon EBS])
태스크 설명 1.2: 데이터 수집 솔루션 식별 및 구현
- 데이터 작업 스타일 및 작업 유형 식별(예: 배치 로드, 스트리밍)
- 데이터 수집 파이프라인 오케스트레이션(배치 기반 ML 워크로드 및 스트리밍 기반 ML 워크로드)
- Amazon Kinesis
- Amazon Kinesis Data Firehose
- Amazon EMR
- AWS Glue
- Amazon Managed Service for Apache Flink
- 작업 예약
태스크 설명 1.3: 데이터 변환 솔루션 식별 및 구현
- 전송 중인 데이터 변환(ETL, AWS Glue, Amazon EMR, AWS Batch)
- MapReduce 를 사용하여 ML 별로 데이터 처리(예: Apache Hadoop, Apache Spark, Apache Hive)
반응형
'1차완료 > ML' 카테고리의 다른 글
AWS 에 나와있는 ML Specialty 시험범위 도메인3/4 (0) | 2024.01.20 |
---|---|
AWS 에 나와있는 ML Specialty 시험범위 도메인2/4 (0) | 2024.01.20 |
했던거, 남은거 (0) | 2024.01.19 |
ML/AI Services (0) | 2024.01.19 |
Amazon SageMaker (0) | 2024.01.19 |