YOLO 학습을 수행할 때 데이터를 얻기 위해 Roboflow나 Ai Hub에서 데이터셋을 얻어오곤 하는데 종종 데이터를 추가로 가공해야 할 일이 생긴다. 예를 들어 자동차 관련 데이터셋을 다운로드 받았는데 오토바이는 라벨링이 안되어있다던가.. 안전 관련된 데이터셋을 받았는데 사람이 라벨링이 안되어있다던가.. 그럴 때 마다 Roboflow를 이용해서 편하게 라벨링 작업을 하는데 문제는 공공 데이터셋이나 사내 비공개 데이터셋을 쓰면 보안 문제로 사용이 제한될 때가 있다. 물론, 자체 MLOps나 라벨링 프로세스가 갖춰진 회사라면 별 문제가 되지 않겠지만... 그래서 얼마전부터 라벨 스튜디오를 내부망에 구축해서 사용해보고 있는데 오토라벨링도 되고 기능도 생각보다 만족스러워서 사용했던 내용을 공유하고자 한다..
Label Studio란? Label Studio는 파이썬 기반 오픈소스 데이터 라벨링 툴로 오디오, 텍스트, 이미지, 비디오 등 다양한 유형의 데이터에 라벨링을 수행할 수 있는 프로그램이다. 또한, 웹기반으로 되어있어 사용하기가 편하고 다양한 포맷으로 내보내기가 가능하며, ML 모델과 통합하여 오토라벨링 작업을 수행하거나, 라벨링 된 데이터를 이용하여 학습할 수 있다.Label Studio 설치https://github.com/HumanSignal/label-studio GitHub - HumanSignal/label-studio: Label Studio is a multi-type data labeling and annotation tool with standardized output formaLab..
논문: https://arxiv.org/abs/2405.14458Github: https://github.com/THU-MIG/yolov10YOLOv10은 NMS 없는 훈련을 위해 일관된 이중 할당 방식을 제시한다.YOLO를 위한 효율성-정확도 중심의 모델 설계 전략을 도입했다.YOLOv10-S는 COCO에서 비슷한 AP를 가진 RT-DETR-R18보다 1.8배 빠르며, 동시에 2.8배 적은 파라미터와 FLOPs를 가진다.개요 실시간 객체감지는 짧은 지연 상태에서 이미지 내 객체의 카테고리와 위치를 정확하게 예측하는 것을 목표로 한다. 그 중에서도 CNN 기반의 객체감지 모델인 YOLO 시리즈는 성능과 효율성의 균형 덕분에 많은 인기를 얻고 있다. 그러나, 모델의 처리 과정과 NMS에 대한 의존때문에 최..