반응형

직장에서 한창 데이터 라벨링 관련 문제를 처리하고 있는 도중, 크라우드웍스에서 진행하는 데이터 라벨링 교육에 대해 알게 되어서 이를 듣게 되었다. 내일배움카드를 이용해 무료로 작업자/검수자 과정 모두 이수하였으며, 이에 대한 후기를 작성한다. 지극히 엔지니어적인 관점으로 작성하였다는 것을 미리 이야기해둔다.

 

 

일단은, 딥러닝 관련 길을 가고자 하는 사람이라면 두 과정 모두 수강하는 것을 추천한다. 이유는 딥러닝의 가장 기초인 데이터 처리에 대해 1주만에 굉장히 쉽게 깊게 알 수 있기 때문이다.

  1. 시간적으로는 두 과정 모두 약 15시간이라고는 하나, 배속으로 들을 수 있고 실습 과정도 오래 걸리지 않는다. 자기 전 2시간 정도 투자하는 것을 기준으로 두 과정 합쳐서 이수까지 1주일이 채 안 걸린 것 같다.
  2. 난이도는 일반인들을 상대로 하기 때문에 매우 쉽다. 그렇다고 깊이가 없는 것이 아니다. 매우 잘 짜여진 교양 수업을 듣는 느낌을 받았다.
  3. 연속으로 듣는 것을 추천한다. 작업자 과정에서 작업한 프로젝트 중 일부가, 꽤 많이 검수자 과정에도 나온다.

 

여기까지는 보편적인 내용이고, 지극히 개인적으로 좋았던 점은 아래와 같다.

 

 다양한 업체들의 데이터 수집 기준을 알게 되었다. 데이터 명세에 꽤 많은 고민 중이었는데, 데이터 명세에 어려움을 겪는 이들이라면 많은 데이터 명세 케이스를 쉽게 알 수 있게 해주어서 좋았다. 모델들이 상향평준화되고 오픈소스로 사전학습된 모델이 나오는 지금, 자신들이 원하는 목적에 맞는 모델의 정확도를 높이려면 결국 학습에 쓰이는 데이터가 중요하다. 그런데 아무리 좋은 데이터를 수집하더라도, 마지막에는 어떻게 라벨링을 하느냐 싸움인데, 해당 과정에서는 각 기업들이 데이터 외주 업체에게 어떻게 데이터를 수집해달라고 하는지를 예시로 들어 라벨링하는 방법을 가르쳐준다. 사실 데이터 수집을 맡는 업체니까 당연한 말이다. 여기서 조금 더 나아가면 다른 업체가 어떤 식으로 모델을 학습시키고, 해당 모델을 어디에 쓰는지도 알 수 있어서 여러 아이디어를 얻을 수 있다. 너무 당연하게도 알고 있다고 생각하는 부분에서 생각보다 많이 놓치고 있던 부분이 있었다. 기본에 충실해지고 싶다면 추천한다.(내일배움카드가 있으면 정부 지원 100%라서 무료로 들을 수 있다.

반응형

+ Recent posts