논문: https://arxiv.org/abs/2405.14458
Github: https://github.com/THU-MIG/yolov10
- YOLOv10은 NMS 없는 훈련을 위해 일관된 이중 할당 방식을 제시한다.
- YOLO를 위한 효율성-정확도 중심의 모델 설계 전략을 도입했다.
- YOLOv10-S는 COCO에서 비슷한 AP를 가진 RT-DETR-R18보다 1.8배 빠르며, 동시에 2.8배 적은 파라미터와 FLOPs를 가진다.
개요
실시간 객체감지는 짧은 지연 상태에서 이미지 내 객체의 카테고리와 위치를 정확하게 예측하는 것을 목표로 한다. 그 중에서도 CNN 기반의 객체감지 모델인 YOLO 시리즈는 성능과 효율성의 균형 덕분에 많은 인기를 얻고 있다.
그러나, 모델의 처리 과정과 NMS에 대한 의존때문에 최적의 성능을 달성하지 못하고 있다. YOLOv10은 NMS 없는 훈련을 도입하고, 모델 아키텍처의 개선을 위한 효율성-정확도 중심의 모델 설계 전략을 제안한다.
한계
NMS를 사용하지 않고 훈련하는 것과 NMS를 사용하는 기존의 일대다 훈련과 비교했을 때 성능 차이가 존재한다. 특히 모델이 작을 수록 더 두드러지는데 예를 들어, YOLOv10-N과 YOLOv10-S에서 NMS를 사용하지 않을 때보다 NMS를 사용했을 때 AP가 각각 1.0%, 0.5% 정도 더 높게 나타났다.
'dev' 카테고리의 다른 글
[Label Studio] Docker Compose로 사용하기 + 로컬 스토리지에서 YOLO 사전 주석 데이터 불러오기 (0) | 2024.07.03 |
---|---|
[Label Studio] 라벨 스튜디오 사용해보기 (0) | 2024.07.02 |
[Jetson] Jetson Orin Nano SSD에 Jetpack 설치 (SDK Manager 사용) (3) | 2024.04.18 |
YOLO-NAS 로그 확인하기(텐서보드) (0) | 2024.03.08 |
YOLO-NAS 커스텀 데이터 학습시키기 (0) | 2024.03.07 |