[매일일보] 국내 데이터 라벨링에 대한 관심이 점차 고조되고 있다. 수개월 전만 하더라도 100명이면 100명 모두 데이터 라벨링에 무지했다면 지금은 아는 사람도 전보다 많아졌고 직접 체험해봤다는 이들도 있다.
데이터 라벨링은 말 그대로 무형의 데이터에 알맞은 정보를 부여‧표시하는 것이다. 덧붙여 설명하면 인공지능 기술 향상을 목적으로 원천 데이터에 알맞은 설명을 붙이고 가공해 정확도를 높이는 작업을 말한다.
텍스트와 이미지 바운딩, 음성녹음 등 다양한 방법을 통해 데이터에 살을 붙인다. 원천 데이터만으로는 컴퓨터 및 시스템이 인식하기 힘들기 때문에 명확한 의미를 갖춘 데이터로 정형화시키는 작업이 필요하다.
사람이 하는 일을 대신 해준다는 인공지능 기술을 구현하기 위해서 데이터에 의미를 부여하는 작업은 사람의 몫이다. 하지만 방대한 데이터 라벨링을 소수의 사람이 작업하기엔 물리적인 어려움이 따르기에 전문적인 인력을 고용해 데이터 작업을 요청한다. 이러한 데이터 전문 인력들을 ‘데이터 라벨러’라고 부른다.
국내 인공지능 산업의 관심과 발전이 동시에 이뤄지면서 기초 작업인 데이터 라벨링에 대해 관심이 커지고 있다. 정부에서도 관련 산업 발전을 위해 대대적인 투자 지원에 나섰다. 데이터 활용을 통해 비즈니스 혁신 및 신규 제품‧서비스 개발 등이 필요한 기업에 바우처 형식의 데이터 구매‧가공 서비스를 지원하는 데이터 바우처 지원사업을 운영하고 있다.
데이터 바우처 지원 사업이란 데이터 구매‧가공을 통해 데이터 활용이 필요한 중소기업, 1인창업자, 예비창업자 중심의 수요기업이 필요한 데이터, 가공서비스를 사전에 지정된 공급기업으로부터 제공받는 방식으로 진행된다. 이러한 데이터 바우처를 통해 지원받은 데이터를 활용해 수요기업은 비즈니스 혁신 및 신규 제품, 서비스개발 등에 활용할 수 있다.
현재 IT 소프트웨어 기술을 가진 전문기업과 더불어 데이터 인력을 구직‧구인 서비스를 운영하는 데이터 일자리 플랫폼에서도 해당 산업의 중요성을 파악, 시장에 진출해있고 후발주자 또한 대거 참여한 상황이다.
데이터 라벨링 산업이 발전하면 기업은 물론이고 개인에게도 이로운 부분이 많다. 기업의 경우, 신사업 추진과 현재 사업방향을 진단하는데 있어 관련 데이터가 필요한데 정제‧가공되지 않아 이를 해결하기에 큰 애로사항이 있다. 데이터 라벨링 산업이 발전하고 그 혜택을 받게 되면 사업 개발은 물론이고 기업의 시장경쟁력을 갖출 수 있는 점에서 의의가 있다.
개인의 경우, 데이터를 수집, 가공을 전문적으로 수행하는 ‘데이터 라벨러’로 활동을 할 수 있다. 다른 직종에 비해 큰 장점은 시공간의 제약이 없고 자투리 시간을 활용해 근무할 수 있다는 점이다. 최근 외부 활동을 자제해야 하는 코로나 상황 속에서 이러한 장점으로 많은 이들이 데이터 라벨링 작업에 참여하고 있다.
진입장벽이 낮아 일정 교육만 받으면 누구나 도전해볼 수 있다. 기업에 소속되지 않으면서 필요에 의해 임시적으로 일을 하는 긱 이코노미와 N잡러 등에게 파트타임, 부업 일자리를 제공할 수 있을 것으로 보인다.
이러한 미래 성장 가능성과 더불어 정부의 데이터 산업 지원 추진력이 더해진다면 데이터 라벨링을 포함한 국내 인공지능 산업 발전은 올해 더욱 가속화될 전망이다.
국민 모두가 이 데이터 라벨링 산업에 관심을 가져주시기를 바란다. 단순히 부업 형태로 데이터 라벨링 작업에 참여하는 것도 좋지만, 국내 인공지능 산업의 발전에 이바지한다는 생각으로 임한다면 더욱 보람되고 의미가 더해지지 않을까 생각한다.