지식 정보 Knowledge/업무 공부 Studies

[요약] 인공지능 학습용 데이터 품질관리 안내서_V. 품질관리 프레임워크

H 에이치 2022. 4. 26. 13:09
반응형

 

인공지능 학습용 데이터 구축 과정

임무정의➡️데이터 수집➡️데이터 정제➡️데이터 라벨링➡️인공지능 학습모델에 적용

 

'인공지능 학습용 데이터 품질관리 프레임워크' 구성요소

  1. 산업분야 선정
    • 데이터 분야 (8)
      • 한국어
      • 영상 이미지
      • 헬스케어
      • 교통·물류
      • 재난·안전·환경
      • 농·축·수산
      • 제조·로보틱스
      • 문화·스포츠·관광
  2. 학습데이터 구축 유형 선택
    • 데이터 유형
    • 학습 task 유형
    • 라벨링 유형
  3. 품질 기준 선정
    • 품질 지표
    • 지표 기준

 

학습데이터 구축 유형 선택 시 고려사항 (3)

  1. '데이터 유형' 선택
    • 원시데이터/원천데이터 유형 의미
    • 인공지능에 적용하고자 하는 데이터 형태
    • 통일성 있는 데이터 포맷 구축 중요
  2. '학습 Task 유형' 선택
    • 인공지능에 적용하기 위한 적절한 학습모델과 알고리즘 선택
    • 1-Cycle 진행을 통해 학습모델 적정성 확인 절차 필수적
  3. '라벨링 유형' 선정
    • 참값 부여에 필요한 어노테이션 방식
    • 크라우드워커 등 라벨러들이 라벨링 작업을 수행
    • 구축 목적에 맞는 가이드라인 작성이 중요

 

텍스트 데이터 기반 구축 유형

  • 텍스트 분류(Text Classification)
  • 텍스트 요약(Text Summary)
  • 기계 번역(Machine Translation)
  • 순차적 레이블링(Sequence Labeling)
    : 입력 시퀀스에 대하여 레이블 시퀀스를 각각 부여하는 작업 (e.g. 태깅 작업)
  • 질의 응답(Question Answering)
  • 음성 인식 (Speech Recognition)

 

이미지 데이터 기반 구축 유형

  • 객체 인식(Object Detection)
  • 3D 객체 인식(3D Object Detection)
  • 키포인트 검출(Keypoint Detection)
  • 얼굴 인식(Face Recognition)
  • 이미지 분류(Image Classification)
  • 시멘틱 세그멘테이션 (Semantic Segmentation)
  • 3D 시멘틱 세그멘테이션(3D Semantic Segmentation)
  • 인스턴스 세그멘테이션(Instance Segmentation)

 

비디오 데이터 기반 구축 유형

  • 객체 인식 (Object Detection)
  • 이미지 분류 (Image Classification)
  • 행동 인식 (Action Recognition)
  • 비디오 분류 (Video Classification)
  • 자세 추정 (Pose Estimation)
  • 비디오 인식 (Video Recognition)
  • 키포인트 검출 (Keypoint Detection)

 

오디오 데이터 기반 구축 유형

  • 오디오 분류(Audio Classification)
  • 음성 인식(Speech Recognition)
  • 텍스트 분류(Text Classification)
  • 음성 합성(Speech Synthesis)

 

출처: 과학기술정보통신부, 한국지능정 보사회진흥원의 「인공지능 학습용 데이터 품질관리 가이드라인 v2.0 - 품질관리 안내서」 

 

반응형