본문 바로가기

AI가 학습할 수 있는 ‘데이터 라벨링’ 작업, 일반인 참여폭 커져야

의료, 교통, 패션, 법률, 헬스케어…활용범위 넓어져

AI가 학습할 수 있는 ‘데이터 라벨링’ 작업, 일반인 참여폭 커져야

[산업일보]
인공지능(AI)의 학습에 필요한 데이터에 입력값을 부여하는 작업인 데이터 라벨링(Data labeling) 작업을 내부 전문가가 아닌 외부 일반인에게 맡기는 방식을 통해 성공한 해외 사례들이 늘어나고 있다.

데이터 라벨링은 크게 기계가 자동으로 라벨링 작업을 진행하는 경우와 사람이 직접 참여하는 경우로 나눌 수 있는데, 사람이 참여하는 경우에도 내부 전문가가 하는 경우와 외부 사람에게 맡기는 크라우드소싱(Crowd sourcing) 방식으로 나눌 수 있다.

한국지능정보사회진흥원(NIA)의 ‘데이터 라벨링으로 만드는 혁신-해외사례를 중심으로’ 보고서는 데이터 라벨링 작업의 작업방식 중 크라우드소싱을 기반으로 데이터라벨링을 진행한 성공적인 해외 사례들을 소개했다.

이러한 사례들을 보면, 방대한 데이터에 라벨링을 부여하는 자칫 지루할 수 있는 작업을 재미와 흥미, 또는 동기부여를 할 수 있는 기획을 통해 일반인들이 적극 참여하도록 했다.

보고서는 의료, 법률, 패션, 교통 등 다양한 분야의 해외 사례를 보여준다.

스탠퍼드 바이오인포매틱스부 연구진이 자폐 아동들의 증상을 진단하고 치료를 돕는 ‘게스왓(Guess What)’을 2018년 개발했고 이 게임 앱을 통해 자폐증 아이들의 얼굴 데이터 수집했다.

스위스 연방 과학대학(EPFL) 디지털 전염병 연구실에서는 ‘크라우드 브레이크’를 기획해 18세 이상이라면 전 세계 누구나 무료로 참여할 수 있도록 했다. 이 방식은 트위터 API를 이용해 특정 단어를 포함한 트윗을 불러오고, 해당 트윗 내용의 라벨링을 진행한다.

워싱턴 대학은 교통 약자의 보행 불편을 해소하기 위한 ‘프로젝트 사이드워크’를 기획하고, 집단 지성을 통해 장애인에게 문제가 되는 도로 정보 데이터를 다수의 참여로 자료를 수집하고 라벨링했다.
김원정 기자 sanup20@kidd.co.kr

제조기업 강국이 되는 그날까지, 공장자동화 스마트팩토리에 대한 뉴스를 기획·심층 보도하겠습니다.

이 기자의 다른기사 보기 >
ad광고추천제품

0 / 1000

추천제품

1/9

가상화폐 시세

loader
Bitcoin logo icon

비트코인

%
Ethereum logo icon

이더리움

%
Ripple logo icon

리플

%
Provided by Bithumb logo icon