반응형

yolo 2

[YoLo v2] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. YoLo v1에 이은 두번째입니다. YoLo를 구현하면서 영상처리까지 진행해보고 싶어졌습니다.. Real Time으로 Object Detecting 하는 영상을 보니 구현이 가능하겠다는 생각이 들더군요 YoLo v2 영상 주로 작업을 구글 코랩에서 하다보니 이미지 불러오는게 bottleneck인 것 같아서 비교를 한번 해보려고 합니다. PIL과 cv2 각각 작업을 진행해서 어떤 게 Load가 빠른지 확인해보겠습니다. 그리고 모델을 학습하다보면, early stopping에 대한 필요성이 있었는데, 이것도 구현해보았습니다. # YOLO v2 이번 버전은 기존 YOLO에 좋은 부품들을 가져와서 열심히 조립한 모델입니다. 1. Batch Normaliztion 사용 - yolo v2..

[YoLo v1] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. YoLo는 정확도를 조금 포기하고, 속도를 Real-Time 수준으로 끌어올린 모델입니다. 모델링 자체도 2stage로 학습해야했던 R-CNN 시리즈에 비해선 훨씬 간단한편입니다. # YoLo v1 YoLo는 원본 이미지를 448x448의 크기로 변환합니다. convolutional network로 Feature map을 추출한 뒤, fc layer에서 각 좌표별 object의 위치와 object 여부, class를 예측합니다. 마지막으로 NMS를 통과시켜 ground truth와 IoU를 계산했을 때 가장 높은 점수를 가진 예측 박스만 남기고 제거합니다. 위의 글만 보면 조금 헷갈릴 수 있는데, Faster R-CNN에서 SxS의 Grid별로 Anchor를 설정해서 box를 ..

반응형