크라우드웍스 데이터라벨링 기초-작업자 양성 과정도 진행된지 1주일이 지났다.
심화과정과 차이점이 있다면 실습과정에서 작업해야 하는 개수는 많아졌고 반려의 기준은 낮아졌다.
많은 실습을 통해 숙련되게 하는게 이 교육의 목적이 아닐까 생각되었다.
그 외의 진행과정은 심화과정과 동일하다.
궁금하신 분들은 아래의 포스팅을 참고해주시길 바란다.
[크라우드웍스] 국민내일배움카드 데이터라벨링 심화 - 검수자 양성 | 4회차 교육 1주차 후기
이전의 포스팅과의 차이점이 없을 것 같아서
오늘은 크라우드웍스 데이터라벨링 기초과정을 들으면서 배울 수 있었던 데이터라벨링의 기본 용어를 정리해두려고 한다.
실제 데이터 라벨링 작업을 할 때 이 단어들을 숙지해야하는 것은 아니지만 한 번 눈에 익혀두면 작업을 시작할 때 굉장히 반가우실 거다.
데이터 라벨링 용어정리
크라우드소싱
: 대중(Crowd)과 아웃소싱(outsourcing)의 합성어
기업 활동의 일부 과정에서 일반 대중(크라우드워커)을 참여시키는 것을 의미
크라우드워커
: 일반인이 기업의 업무 용역을 대행 수행하고 일정 대가를 받는 경우를 의미
집이나 재택근무 등의 형태로도 업무 수행이 가능하고, 자유롭게 할당된 과제물을 수행하는 일자리
데이터 라벨러
: 데이터의 수집에서 가공에 이르기까지 인공지능 학습에 필요한 형태의
데이터를 만드는 사람
인공지능 학습용 데이터
: 인공지능이 학습을 통해 성능을 향상 시키는데 활용되는 데이터
인공지능 학습용 데이터 구축
: 임무정의, 데이터획득, 데이터 정제, 데이터 라벨링 등 인공지능 학습용 데이터를 구축하는 일련의 활동
데이터 수집(획득)
: 인공지능의 기계학습에 필요한 데이터를 현실 세계에서 직접 수집 또는 생성하는 등 다양한 종류의 데이터를 모으는 작업
데이터 정제
: 기계학습에 필요한 형식으로 맞추거나, 불필요한 중복을 제거하며, 개인정보를 비식별화하여 처리하는 등 인공지능 학습에 적합한 형태로 바꿔주는 작업
데이터 라벨링
: 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업
데이터 검수
: 데이터 라벨링이 올바르게 되었는지를 확인하는 작업
라벨(레이블)
: 인공지능 학습을 위해 데이터에 부착하는 것으로 해당 대상에 대한 명칭 뿐 아니라 데이터 인식에 필요한 설명이나 정답과 같은 의미
챗봇
: 문자 또는 음성으로 대화하는 기능이 있는 컴퓨터 프로그램 또는 인공지능
바운딩
: 이미지에서 추출하고자 하는 대상을 네모난 박스로 표시하는 라벨링 기법으로 데이터 라벨링 작업에서 가장 일반적으로 사용되는 유형
태깅
: 이미지나 파일 등에 이름을 붙이는 것으로 대표할 수 있는 키워드를 달아줌으로써 대상을 분류하는 작업
전사
: 이미지나 영상 속의 문자를 텍스트로 옮겨 적는 작업
감정 분석
: 이미지나 영상 속 사람의 표정을 보고 어떤 감정 상태인지를 추론하는 라벨링 기법
키포인트
: 작업 대상의 특정 지점에 마우스를 클릭하여 점을 찍어주는 라벨링 기법
얼굴 랜드마크
: 얼굴의 주요 부위에 마우스를 클릭하여 점을 찍어주는 라벨링 기법
폴리곤
: 객체의 불규칙한 경계를 따라 점을 찍는 라벨링 기법
폴리라인
: 여러 개의 점을 연속적으로 그리는 라벨링 기법
시멘틱 세그멘테이션
: 폴리곤, 폴리라인, 브러쉬 등을 사용하여 경계를 나누어 분할함으로써 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해내는 라벨링 기법
OCR(광학문자인식)
: 영상•이미지 상의 텍스트를 기계가 읽을 수 있는 문자로 변화하는 라벨링 기법
스켈레톤
: 대상의 특정 부위에 점을 찍는 라벨링 기법
특정 구간 추출
: 작업 대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택해 추출하는 라벨링 기법
3D 라벨링 기법
: 육면체의 입체적인 박스를 생성하여 바운딩 하는 것과 같이 2차원 라벨링의 한계를 넘어 3차원의 입체적 표현을 가능케 하는 라벨링 기법
복합 라벨링
: 여러 개의 라벨링 기법을 복합적으로 사용하는 라벨링 기법
문장 의미 비교
: 주어진 문장들의 의미가 같은 것인지 태깅하는 라벨링 기법
감정 태깅
: 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 라벨링 기법
키워드 찾기
: 대화 내용 속에서 핵심이 되는 키워드를 찾는 라벨링 기법
문장요약
: 글을 읽고 핵심이 되는 내용을 요약하는 라벨링 기법
화자 구분
: 제시된 음성을 모두 듣고 동일한 사람의 목소리인지를 판단해서 태깅하는 라벨링 기법
음성 받아쓰기
: 주어진 음성을 듣고 받아쓰는 라벨링 기법
일반 전사
: 사람이 말한 그대로 문자화하여 전사하는 방법
이중 전사
: 한글 맞춤법 표기에 따른 발음과 차이가 있는 경우, ‘발음 전사'와 '철자 전사'를 병행하여 작성하는 방법
기초과정은 교육기간이 2주일밖에되지 않아 이번주면 과정이 끝난다.
얼마 남지 않았지만 최선을 다해서 마무리 해서 최종평가 후기를 남기겠다.
[크라우드웍스]국민내일배움카드 데이터라벨링 교육과정 궁금하시면 보러오세요
'데이터라벨링' 카테고리의 다른 글
데이터라벨링으로 돈벌기 프로 N잡러로 거듭나는 캐시미션 (추천인코드 : FZY) (0) | 2023.03.08 |
---|---|
크라우드웍스 국민내일배움 교육 기초/심화 과정 수료 크라우드웍스 배지 (0) | 2023.03.07 |
[데이터라벨링] 2/28~3/14 크라우드웍스 2주 한정 교육 할인 이벤트 AIDE 자격증 이론 (0) | 2023.03.02 |
[크라우드웍스] 국민내일배움카드 데이터라벨링 심화 - 검수자 양성 | 4회차 교육 1주차 후기 (0) | 2023.02.22 |
[크라우드웍스] 데이터라벨링 크라우드웍스 국민내일배움카드 교육과정 (2) | 2023.02.14 |