데이터 제작
-
부스트캠프 ai tech 2기 15주차 학습 정리 노트Boostcamp AI Tech 2기 2021. 11. 13. 21:24
강의 복습 1강 데이터 제작의 A to Z 데이터 구축 과정 : 1. 원시 데이터 선정 및 확보 : 저작권, 태스크 적합성 2. 구축 및 가공 프로세스 확립 : 구축 및 검수 절차, 작업자 선정 3. 구축 및 가공 지침 작성 : 플랫폼 소통 및 작업자 교육 4. 데이터 구축 및 가공 : 파일럿, 작업자 관리 5. 데이터 검수 : 품질 평가 기준, 데이터 규격과 내용 데이터 설계 : - 규모 선정에 필요한 정보 : 확보 가능한 원시 데이터의 규모, 주석 작업 시간 - 구분(split) 방식 : 데이터별 비율과 기준 정하기 (랜덤 vs 특정 조건) 데이터 수집-가공 설계 : 1. 원시 데이터 수집 방식 : 전산화, 스크래핑, 작업자 작성, 모델 생성 2. 작업자 선정 : 주석 작업의 난이도와 구축 규모에 맞..