설명

AI 논문 공부

SegFormer 논문 리뷰 (Simple and Efficient Design for Semantic Segmentation with Transformers)

Abstact - 간단한 구조의 Decoder - multi-scale feature - Positional Encoding X 1.Introduction - Transformer가 vision task에 쓰이며 발생하는 문제는? => output이 single scale의 낮은 resolution feature + large image에 대해 높은 계산량 - Encoder, Decoder 모두 redesign => hierachical Transformer Encoder (no positional encoding) + 간단한 Decoder (All MLP, 계산량 감소) + 효율적이고 정확 positional encoding이 사라짐에 따라 학습에 사용되지 않은 이미지 사이즈를 테스트 시 interpo..

AI 논문 공부

UNet 논문 리뷰 (U-Net : Convolutional Networks for Biomedical Image Segmentation)

Semantic Segmentation - 픽셀 기반으로 이미지를 분할하여 구분 0.Short Summary - 넓은 범위의 이미지 픽셀로부터 의미정보를 추출하고 의미정보를 기반으로 각 픽셀마다 객체를 분류하는 U 모양의 아키텍처 - 서로 근접한 객체 경계를 잘 구분하도록 학습하기 위한 Weighted Loss 1.Introduction - 생물학 분야의 영상 처리에선 Localization이 포함된 Classification이 필요 - FCN (fully-convolution layer) - Context(의미정보)를 얻기 위한 Contractinig Path - Localization(각 픽셀이 어떤 객체에 속하는지)을 위해 Resolution을 키우는 Expanding Path = 점진적으로 넓은 ..

AI 논문 공부

EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks 논문 리뷰

-1. Before start 모델의 크기를 크게 만드는 3가지 방법 1. depth 증가 2. width 증가 (= filter 개수 증가) 3. 고해상도 이미지 사용 기존에는 3가지 방법을 수동으로 조절하였기에, 최적을 찾지 못하였다. EfficientNet은 이 3가지의 최적의 조합을 AutoML을 통해 찾아내고, 수식으로 만든 논문이다. 조합을 효율적으로 만들 수 있도록 하는 compound scaling 방법을 제안하며, NAS 구조 수정을 통해 더 작은 크기의 모델로도 SOTA를 달성한 논문이다. 일반적으로 모델을 scaling하는 방법이란, b,c,d방법을 적절히 조절하는 것을 의미한다. 0.Abstract - 한정된 자원으로 최대의 효율 - compound coefficient 방법 - 더..

AI 논문 공부

Deformable DETR : Deformable Transformers for End-to-End Object Detection 논문 리뷰

Introduction - DETR의 후속작이다. - 느린 수렴(Convergence)과 작은 물체에 대한 낮은 성능에 대한 대안 - multi scale feature 사용 - deformable attention module 사용 Attention weight가 uniform하게 초기화되고 나서, 의미있는 위치에 focus 시키기 위해 학습하는 시간이 매우 길다. (uniform이란, 평균이 0이고 분산이 1인 분포) ex) key가 160개라면, 1/160으로 시작해서 gradient도 매우 작은 상태, query가 주어졌을 때 key는 이미지의 다른 모든 pixel이 되기 때문에 학습이 오래 걸림 + 작은 객체를 detection은 주로 high resolution feature map에서 이뤄지..

AI 논문 공부

You Only Look Once:Unified, Real-Time Object Detection (YOLO) 논문 리뷰

목차 0. Abstract 1. Introduction 2. Unified Detection 3. Network Design 4. Loss 5. Limitations of YOLO 6. Result Abstract - 2-stage Detector : localization과 classification 두 과정을 거쳐 객체를 Detection 함 장점 : 정확도 단점 : 느린 속도 - 1-stage Detecor : 논문에서는 두 과정을 한번에 처리하는 방법을 제시하여 fps(초당 처리하는 frame 수)를 더욱 빠르게 하였다고 함 Introduction - YOLO v1은 localization과 classification을 하나의 문제로 정의하여 network가 동시에 두 task를 수행하도록 설계함..

beomseok99
'설명' 태그의 글 목록