본문 바로가기

논문리뷰

(3)
Test-Time Augmentation 리뷰할 논문은 Learning Loss for Test-Time Augmentation 입니다. 딥러닝을 모델링을 해오면서 학습 시에만 Augmentation을 적용해 왔는데, 테스트 할 때 Augmentation을 적용할 수도 있다는 내용을 접하게 되어 관련 논문을 리딩해보았고, 본 논문의 방법론을 완벽하게 이해하기 보다는 TTA에 대한 전반적인 이해를 하고자 했습니다. Test-Time Augmentation 개념 Augmentation은 robust한 뉴럴 네트워크를 만들기 위해서 연구 되어옴 대부분의 Augmentation은 학습단계에 적용하는 것 그러나 TTA는 테스트 단계에서 Augmentation을 적용하는 것 TTA를 적용하면서 모델의 불확실성을 줄일 수 있음 https://towardsd..
Feature Pyramid Networks for Object Detection 리뷰 Mask R-CNN 뿐만 아니라 Object Detection 네트워크에서 대부분 사용중인 FPN에 대해서 리뷰하도록 하겠습니다. FPN 이전 시도 되었던 방식 (a) Featureized image pyramid 1개의 입력 이미지를 여러 개의 scale 이미지로 만들어 각각 네트워크에 입력 각 resized 이미지에 대한 피처는 독립적으로 계산됨. 속도가 느리고 메모리를 많이 차지함 (b) Single feature map 단일 scale 입력 이미지를 그대로 추론에 활용 속도는 빠름. 그러나 성능이 높지 않음 (c) Pyramidal feature hierarchy 특정 컨볼루션 layer에서 나온 feature map 추출하여 detect함 multi-scale feature map을 활용하여 성..
Mask R-CNN 논문 리뷰 (1) 이번 리뷰는 Mask R-CNN을 이해하기 위해서 배경과 소개 아키텍처 부분만 살펴보도록 하겠습니다. Abstract 1. Mask R-CNN은 Instance segmentation을 위한 프레임워크이다. 2. Mask R-CNN은 Faster R-CNN에서 segmentation mask branch 를 추가한 것이다. 학습은 쉽고 약간의 오버헤드만 추가 된다. 3. Mask R-CNN은 다른 Task에 대해서 일반화하기가 쉽다. 예를들면, Human Pose Estimation Task를 원할 때, 동일한 프레임워크를 사용할 수 있음 4. COCO 데이터 세트에 대해서 각각의 Task 별 최상의 결과를 얻었다. Introduction 1. 비전 기술이 빠르게 발달한 데에는 강력한 베이스라인 아키텍처..