반응형

논문 리뷰 5

[YoLo v2] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. YoLo v1에 이은 두번째입니다. YoLo를 구현하면서 영상처리까지 진행해보고 싶어졌습니다.. Real Time으로 Object Detecting 하는 영상을 보니 구현이 가능하겠다는 생각이 들더군요 YoLo v2 영상 주로 작업을 구글 코랩에서 하다보니 이미지 불러오는게 bottleneck인 것 같아서 비교를 한번 해보려고 합니다. PIL과 cv2 각각 작업을 진행해서 어떤 게 Load가 빠른지 확인해보겠습니다. 그리고 모델을 학습하다보면, early stopping에 대한 필요성이 있었는데, 이것도 구현해보았습니다. # YOLO v2 이번 버전은 기존 YOLO에 좋은 부품들을 가져와서 열심히 조립한 모델입니다. 1. Batch Normaliztion 사용 - yolo v2..

[Faster R-CNN] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. R-CNN이랑 Fast R-CNN은 거의 논문리뷰만 하고 구현은 안했는데, Faster R-CNN은 구현까지 해보았습니다. (근데 오류가 있는것 같음..) # Faster R-CNN 구조 Faster R-CNN의 구조는 Fast R-CNN에 Region Proposal Network(RPN)를 추가한 모델입니다. Fast R-CNN의 단점 Selective Search의 CPU로 연산 (연산 시간의 Bottleneck) Faster R-CNN의 해결 방안 Region Proposal을 모델에서 처리 이로 인해 진정한 end-to-end 학습이 가능한 모델이 되는데요, 근데 학습과정이 생각보다 까다로웠습니다. # Faster R-CNN 학습 과정 흔히 Backbone이라고 부르는..

[ResNeXt] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 소신입니다. ResNeXt는 ResNet에 Inception개념과 AlexNet 개념을 응용한 모델입니다 ! 뭔가 더 복잡하게 해서 성능이 올라간것처럼 보이지만 같은 복잡도 대비 성능을 끌어올린 모델입니다. # ResNet → ResNeXt 최신 연구의 방향은 Data를 변형하는 Feature Engineering에서 Network 즉, 모델을 Engineering로 바뀌었습니다. Channel의 개수나 Filter의 크기, strides를 변형하며 같은 데이터를 넣어도 더 예측력있는 모델을 만드는 것이죠 그래서 ResNet은 Inception Model의 Split - Transform - Merge 전략을 ResNet에 접목하게 됩니다. x를 나눠 여러 weight와 곱한뒤 합치는 것이죠 ..

[ResNet] 논문 리뷰 & 구현 (Pytorch)

안녕하세요, 소신입니다. 이미지 인식에서 엄청난 반향을 일으켰던 ResNet 입니다. Residual (잔차)를 학습한다해서 ResNet이라는 이름이 붙었습니다. # 기존 접근 방식의 문제점을 해결하기 위해 등장한 ResNet 기존 모델들은 Layer를 Deep하게 쌓으면 성능이 좋아질것이라고 했지만, 실제로는 20층 이상부터 Deep할수록 오히려 performance가 낮아지는 현상인 Degradation문제가 발생했습니다. 그래서 ResNet 팀은 예측하려는 y(분류된 모습)가 실제로는 x(분류되기 전 모습)와 같다고 보고, y-H(x)를 학습하기보다 x-H(x)를 학습하기가 더 쉽고 빠르다는 것이죠 결론적으로 위가 더 좋다는 것은 저 메달이 증명해줬습니다. Object Detection 대회인 CO..

[AlexNet] 논문 리뷰 & 구현 (Pytorch)

안녕하세요 ! 소신입니다. AlexNet 논문 리뷰 및 Pytorch 구현입니다. AlexNet은 2012년 우승한 모델입니다. 이전 모델보다 분류 에러율을 약 10%감소시켰습니다. AlexNet은 Overfitting 해결에 집중한 모델입니다. Dropout과 Data Augmentation을 사용했고 Tanh, Sigmoid 대신 ReLU를 사용해서 학습속도를 높였습니다. 또한, Multi-GPU를 사용해 병렬연산하고 특정 구간마다 연결해 계산했습니다. AlexNet에선 LRN이라는 Neuron을 사용했습니다. 특정 Filter 한 픽셀의 가중치가 높으면 영향을 받은 Feature Map은 자연스럽게 그 주변의 수치가 높을 것입니다. 따라서 이를 해결하기위해 Filter를 정규화하는 방법을 사용했습니..

반응형