반응형
인공지능 학습용 데이터 구축 과정
임무정의➡️데이터 수집➡️데이터 정제➡️데이터 라벨링➡️인공지능 학습모델에 적용
'인공지능 학습용 데이터 품질관리 프레임워크' 구성요소
- 산업분야 선정
- 데이터 분야 (8)
- 한국어
- 영상 이미지
- 헬스케어
- 교통·물류
- 재난·안전·환경
- 농·축·수산
- 제조·로보틱스
- 문화·스포츠·관광
- 데이터 분야 (8)
- 학습데이터 구축 유형 선택
- 데이터 유형
- 학습 task 유형
- 라벨링 유형
- 품질 기준 선정
- 품질 지표
- 지표 기준
학습데이터 구축 유형 선택 시 고려사항 (3)
- '데이터 유형' 선택
- 원시데이터/원천데이터 유형 의미
- 인공지능에 적용하고자 하는 데이터 형태
- 통일성 있는 데이터 포맷 구축 중요
- '학습 Task 유형' 선택
- 인공지능에 적용하기 위한 적절한 학습모델과 알고리즘 선택
- 1-Cycle 진행을 통해 학습모델 적정성 확인 절차 필수적
- '라벨링 유형' 선정
- 참값 부여에 필요한 어노테이션 방식
- 크라우드워커 등 라벨러들이 라벨링 작업을 수행
- 구축 목적에 맞는 가이드라인 작성이 중요
텍스트 데이터 기반 구축 유형
- 텍스트 분류(Text Classification)
- 텍스트 요약(Text Summary)
- 기계 번역(Machine Translation)
- 순차적 레이블링(Sequence Labeling)
: 입력 시퀀스에 대하여 레이블 시퀀스를 각각 부여하는 작업 (e.g. 태깅 작업) - 질의 응답(Question Answering)
- 음성 인식 (Speech Recognition)
이미지 데이터 기반 구축 유형
- 객체 인식(Object Detection)
- 3D 객체 인식(3D Object Detection)
- 키포인트 검출(Keypoint Detection)
- 얼굴 인식(Face Recognition)
- 이미지 분류(Image Classification)
- 시멘틱 세그멘테이션 (Semantic Segmentation)
- 3D 시멘틱 세그멘테이션(3D Semantic Segmentation)
- 인스턴스 세그멘테이션(Instance Segmentation)
비디오 데이터 기반 구축 유형
- 객체 인식 (Object Detection)
- 이미지 분류 (Image Classification)
- 행동 인식 (Action Recognition)
- 비디오 분류 (Video Classification)
- 자세 추정 (Pose Estimation)
- 비디오 인식 (Video Recognition)
- 키포인트 검출 (Keypoint Detection)
오디오 데이터 기반 구축 유형
- 오디오 분류(Audio Classification)
- 음성 인식(Speech Recognition)
- 텍스트 분류(Text Classification)
- 음성 합성(Speech Synthesis)
출처: 과학기술정보통신부, 한국지능정 보사회진흥원의 「인공지능 학습용 데이터 품질관리 가이드라인 v2.0 - 품질관리 안내서」
반응형
'지식 정보 Knowledge > 업무 공부 Studies' 카테고리의 다른 글
[SQL] PostgreSQL 기초 강의 추천 (Udemy 데이터 역량 강화를 위한 SQL 부트캠프) (0) | 2024.03.31 |
---|---|
[파이썬] 코알못 직장인 파이썬 기초 강의 추천 (Udemy Python 부트캠프) (1) | 2024.03.01 |
[합격 수기] 제56회 DAP 데이터아키텍처 전문가 합격 (데이터 자격 시험/자격증/한국데이터산업진흥원) (2) | 2022.07.04 |
💻자격증 합격률 총정리📈(정보처리기사, 빅데이터분석기사, 정보보안기사, DAP/DAsP, ADP/ADsP, SQLP/SQLD) (0) | 2022.06.29 |
[요약] 인공지능 학습용 데이터 품질관리 안내서_I. 서론 ~ II. 개요 (0) | 2022.04.26 |