반응형

논문리뷰 4

[YoLo v1] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. YoLo는 정확도를 조금 포기하고, 속도를 Real-Time 수준으로 끌어올린 모델입니다. 모델링 자체도 2stage로 학습해야했던 R-CNN 시리즈에 비해선 훨씬 간단한편입니다. # YoLo v1 YoLo는 원본 이미지를 448x448의 크기로 변환합니다. convolutional network로 Feature map을 추출한 뒤, fc layer에서 각 좌표별 object의 위치와 object 여부, class를 예측합니다. 마지막으로 NMS를 통과시켜 ground truth와 IoU를 계산했을 때 가장 높은 점수를 가진 예측 박스만 남기고 제거합니다. 위의 글만 보면 조금 헷갈릴 수 있는데, Faster R-CNN에서 SxS의 Grid별로 Anchor를 설정해서 box를 ..

[R-CNN] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다 Image Classification은 SeNet을 마지막으로 우선 마무리를 하고, Object Detection 모델들의 논문 리뷰를 해보려고 합니다. 최종적으로 나만의 실시간 영상처리 모델을 구축하는 것이 목표 ! # 기존의 Object Detection 당시 Object Detection 모델의 성능은 정체되어있었는데요 기존에는 Sliding Window 방식으로, 물체가 있을만한 곳을 하나씩 탐색하여 물체를 탐색했습니다. 이는 일일히 분류를 진행해야하기 때문에 연산량이 많고 연산시간이 오래걸려 비효율적인 방식이죠. 왜? 라고 생각하실수 있는데 Sliding window 방식은 크기가 고정되지 않아 여러 크기로도 순차적으로 계산해야하기 때문에 경우의수가 기하급수적으로 늘어나..

[MobileNet] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. 성능을 최대한 보전하면서, 모델의 용량과 연산량을 가볍게 만드는 방법을 제시한 MobileNet입니다. 개인적으로 앞으로의 연구방향으로 제일 중요한 모델이라고 생각합니다. 성능을 보전하면서 가볍고, 빠르게 만드는것은 Real-Time world에서 굉장히 중요하기 때문이죠 # MobileNet, 미래 모바일과 임베디드 플랫폼에서 딥러닝 모델이 돌아갈 수 있다면 Real Time 처리가 필요한 시대에 정말 유용할 것입니다. 그런면에서 MobileNet은 이러한 현실에 집중한 모델이 아닐 수 없습니다. MobileNet은 기존의 Conv. Filter를 분리해 Depthwise, Pointwise로 네트워크를 구성했습니다. 이것은 큰 변화인데, 기존의 이미지, IN-OUT 채널, ..

[VGGNet] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. VGGNet 논문 리뷰와 Pytorch를 활용한 구현입니다. VGGNet은 작은 필터로 네트워크층을 깊게 쌓은 모델입니다. 2015년에 발표된 논문으로 당시 엄청 복잡한 구조인 GoogleNet에 비해 구조가 간단하면서 에러는 0.1%밖에 나지않아 큰 주목을 받은 모델입니다. 제가 생각하는 VGGNet의 키포인트들입니다. 모델링 자체는 간단하지만, 전처리, 후처리 등 여러가지 방법을 사용해서 성능을 끌어올리기 위해 노력했다는 느낌을 많이 받았습니다. 전처리에선 이미지를 다양한 크기로 변형하고 Crop(오려내기), Color Shift, Flip등 다양한 전처리를 진행했습니다. 모델링은 Convolutional Layer를 3x3 필터에 Padding=1로 원본 크기에는 변화를 ..

반응형