본문 바로가기
생활정보

4차 산업혁명 데이터 라벨러가 대세다

by 하늘빛물든 2022. 12. 15.
반응형

짜투리 시간만 활용해도 용돈벌이 가뿐!

-인공지능 시대 유망직업 `데이터 라벨러`~ 나도 한번 해볼까? -

 

데이터라벨러 새로운 직종

안녕하세요. '하늘빛물든'입니다.

윤석열 대통령은 지난 10월 28일 "글로벌 인공지능 경쟁력을 세계 3위 수준으로 끌어올리고, "데이터 시장 규모를 지금보다 2배인 50조원 이상으로 확대하겠다"고 밝혔습니다.

세계는 지금 4차 산업혁명의 큰 축으로 인공지능(AI), 빅데이터, 로봇, 사물 인터넷, 3D 프린팅, 바이오 등 핵심기술의 개발에 모든 국가 역량을 쏟아 붙고 있습니다. 다시 말해 언급한 분야가 향후 미래 먹거리 산업으로 그만큼 부가가치가 크기 때문이지요.

이에 우리 정부도 디지털 혁명의 시작이라 할 수 있는 인공지능 분야에 사활을 건다고 밝혔습니다. 윤 대통령의 워딩을 그대로 옮기자면 "반도체, 양자 컴퓨팅, 메타버스와 같은 다양한 전략 분야에 집중 투자해 초일류·초격차 기술을 확보해 나가겠다"고 밝혔습니다. 그러면서 "무엇보다 디지털 인재 양성을 위해 정부의 모든 역량을 집중시킬 것"이라고 강조했습니다.

간단히 설명하면, 향후 인공지능 시대의 경쟁력을 확보하기 위해 국가의 역량을 집중시키겠다는 것과 그중에서도 데이터 시장 규모를 지금의 두배 수준으로 높이겠다는 것이 주요 정책방향임을 알 수 있습니다.

이와 관련하여 컴퓨터만 다룰 줄 알면 누구나 쉽게 할 수 있고 얽메이지 않으면서 짜뚜리 시간만 활용해도 용돈벌이가 가능하고 전문 직업으로도 유망한 `데이터 라벨러`라는 직업이 있어서 오늘은 이에 대해 소개 드리고자 합니다.

 

■ 데이터 라벨러란?

 

아기가 처음 말을 배울 때 얼룩말 그림카드를 보여 주면서 반복해서 말해주면, 실제로 얼룩말을 보지 않고도 얼룩말임을 알아 보는 것처럼, AI는 갓 태어난 아이처럼 가만두면 스스로 아무것도 할 수 없는 기계이기 때문에 이런 기계가 사람처럼 일을 할 수 있도록 AI에게 이게 무엇인지 반복해 가르쳐주는 작업이 필요하게 됩니다. 이처럼 인공지능 기계에게 뭔가 알아들을 수 있는 데이터로 바꾸어 주는 작업을 데이터 라벨링이라 합니다.

 

이러한 데이터 라벨링 작업은 인공지능을 개발하는데 없어서는 안될 중요한 작업인데요. 인공지능은 결국은 로봇과 같은 기계가 스스로 판단하고 분석하여 행동하게끔 하는 기술이라서 수 많은 학습데이터가 필요하게 됩니다.

 

이는 마치 원유 그 자체로는 쓸모가 없지만 이를 정제하여 각종 부산물(휘발유,경유,등유,나플탈렌 등)을 생산해 내듯이 인간의 언어, 영상, 음성 등의 다양한 데이터를 각 용도에 따른 AI용 학습용 데이터로 수정, 가공하는 작업을 데이터 라벨링이라 통칭합니다.

 

요약해서 말하면, 일반 사진이나 동영상 데이터를 인공지능(AI)이 학습할 수 있도록 ‘가공’해주는 업무인데, 예를 들면 사진에서 사람, 동물, 자동차, 건물, 표지판 등을 따로 구분해 ‘라벨’을 달아 구분해주는 일을 데이터 라벨링, 이런 일을 하는 사람을 ‘데이터 라벨러’라고 합니다.

 

 

■ 데이터 라벨러의 향후 발전 가능성

 

· 선진국의 데이터 라벨링 시장

 

미국과 중국은 이미 선도적 데이터 시장을 일구어 나가고 있으며, 미국의 대표기업인 아마존 메커니컬 터크는 190개국에 50만 명의 크라우드 소싱 인력을 보유하고 있으며, 중국의 저렴한 노동력을 앞세운 MBH도 약 30만 명의 데이터 라벨러를 고용하고 있다고 합니다.

 

 

 

한국데이터산업 개요
 

· 한국의 데이터 라벨링 시장

 

대표적인 데이터 라벨러 소싱 기업은 2017년 창업한 크라우드웍스라는 회사이며 지금까지 데이터 라벨링 업무를 하기 위해 이 회사에 회원으로 가입한 사람만 16만 명이 넘는다고 합니다. 다른 업체 회원들까지 포함하면 한국에서만 약 20만 명이 데이터 라벨러로 활동하겠다고 등록한 것으로 추정된다는 보도가 있었습니다.

 

 

■ 데이터 라벨러의 수입은?

 

· 먼저 데이터 라벨러가 일하는 형태는 작업의 수준이나 사업형태에 따라 월급제, 성과제, 알바 형태 등 다양하며, 수입 수준도 제각각 다 다릅니다.

 

데이터라벨러의 수입예시
 


■ 데이터 라벨러의 가장 큰 장점은?


시간에 구애받지 않고 언제든지 자뚜리 시간만을 활용해 일할 수 있다는 점입니다. 물론 그렇게 할 수 있는 일이 늘상 존재하지는 않지만요.

일정시간의 교육을 받고 일을하게 되면 일의 종류에 따라 또 본인이 가능한 작업 여부에 따라서 선택적으로 일을 할 수 있다는 점이 특징적이라 할 수 있겠습니다.

사람들이 생각하기에 따라서는 인형에 눈알 붙이기와 같은 단순 알바직 아니야 하고 폄하하는 사람들도 있으나, 전문가가 아니면 할 수 없는 고난이도 작업 등 그 일거리는 부지기 수입니다.


▶정부, AI 학습용 데이터 가공에 막대한 예산 투입

정부가 지난해에만 3315억원의 예산을 AI 학습용 데이터 가공에 쏟아 부어 왔으며, 향후 일거리는 더 많이 쏟아질 것으로 업계는 보고 있습니다. 디지털 뉴딜에는 올해 총 23조4000억원(국비 18조6000억원), 2025년까지 58조2000억원(국비 44조8000억원)을 투자해 디지털 대전환을 이끈다는 계획이 담겨 있으며 이를 통해 2025년까지 90만3000개의 일자리를 창출하겠다고 정부는 이미 밝힌 바 있습니다.

데이터 가공시장 전망
 

 

■ 데이터 라벨러가 되려면?


▶회원가입 후 사전교육 받아야

데이터 라벨러로 일하려면 어떻게 해야 할까. 처음 회원가입을 하면 ‘작업자 양성 프로젝트’라는 일종의 교육과정을 거쳐야 합니다. 크라우드웍스 홈페이지에 가입하면 ‘텍스트 태깅’과 ‘바운딩’ 등 2가지 교육과정(튜토리얼)을 해볼 수 있는데, 텍스트 태깅은 검색엔진을 똑똑하게 만들기 위해 법령 등에서 질문에 맞는 정답을 마우스로 선택(드래그 앤 드롭)하는 작업입니다.

 
데이터라벨러 작업예시 -출처:크라우드웍스
 
 

▶ 국민내일배움카드로 신청하면 학습비 전액 환불

 

 

■ 글을 마치면서

 

· 이 글을 쓰고 있는 필자도 크라우드 워커로 상기 과정을 마치고 현재 데이터 학습전문가 2급 자격으로 틈틈이 용돈 벌이를 하고 있지만 아직까지는 만족할 수준은 못되지만 향후 데이터 시장의 확장과 더불어 일할 수 있는 일거리가 더 늘어날 것이라 생각됩니다. 특별한 기술이나 자격이 없어도 내가 틈틈이 할 수 있는 일이 그렇게 많지 않는 상황을 감안해 본다면 데이터 라벨러는 꽤 매력적인 부업이라고 생각됩니다.

 
728x90
반응형

댓글