[05] - Receptive Field 를 확장시킨 모델 (DeepLab v1, DeepLab v2)
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
Receptive Field 란??Receptive field는 신경망에서 특정 뉴런이 입력 데이터(예: 이미지)에서 보는 영역을 의미한다. 예를 들어, 이미지의 한 픽셀을 처리하는 뉴런이 주변 3×3 영역을 참조한다면, 이 3×3 영역이 해당 뉴런의 receptive field이다. 이는 입력 데이터를 이해하고 정보를 추출하는 데 매우 중요한 개념이다.Receptive Field가 작은 경우이미지에서 빨간 점을 중심으로 segmentation을 수행할 때, 작은 receptive field는 새의 일부 정보만 포함한다.결과적으로, 모델이 전체 문맥이나 객체의 구조를 이해하지 못하고, 부분적인 정보에만 의존하여 정확도가 떨어질 수 있다. Receptive Field가 큰 경우반대로, 큰 receptive..
[04] - FC DenseNet 이란?
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
FC DenseNet이란? FC DenseNet은 Fully Convolutional DenseNet의 약자로, Fully Convolutional Network (FCN)과 DenseNet을 결합하여 이미지 분할 (segmentation) 작업에 최적화된 모델이다. DenseNet의 특징인 Dense Block과 feature reuse를 활용하면서도, FCN의 encoder-decoder 구조를 채택해 픽셀 단위 예측을 수행한다. 이러한 구조는 주로 의료 영상과 같은 이미지 분할 작업에서 효과적으로 사용된다.  FC DenseNet의 구성 요소 DenseNet은 Dense Block이라는 구조를 통해 각 layer가 이전 layer의 출력을 연결해나가며 점진적으로 feature map을 확장한다. 예..
[03] - 빠르면서도 정확한 SegNet
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
SegNet 이란??SegNet은 특히 도로 장면을 이해하기 위해 설계된 Semantic Segmentation 모델이다. SegNet의 주요 목표는 차량, 도로, 차선, 건물, 보도, 하늘, 사람과 같은 객체들을 빠르고 정확하게 구분하는 것이다. 이 글에서는 SegNet이 어떤 발전 동기와 구조를 가지고 있으며, 유사한 네트워크와 어떤 차이점이 있는지 알아보자.  SegNet의 발전 동기SegNet은 자율 주행과 같은 Road Scene Understanding Applications를 위한 모델로 개발되었다. 이 분야에서는 다양한 객체들을 명확하게 분류할 수 있는 세그멘테이션 모델이 필수적이다. SegNet은 기존 모델들이 기능적으로 뛰어난 성능을 제공하더라도 속도가 부족한 문제를 해결하고자 개발되었..
[02] - FCN 한계점을 극복한 DeconvNet 이란??
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
FCN 의 한계점   1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제FCN(Fully Convolutional Network)은 객체의 크기에 따라 예측 정확도가 달라지는 문제가 있다. 특히, 큰 객체의 경우 지역적인 정보만을 사용해 예측하기 때문에 오차가 발생하기 쉽다. 위의 이미지에 상당 부분을 보면, 버스의 앞 부분을 버스로 인식하지만 유리창에 비친 자전거를 보고 자전거로 예측하는 문제가 발생하기도 한다. 이는 동일한 객체여도 부분적으로 다른 레이블이 예측될 가능성을 높인다. 작은 객체의 경우 무시되는 문제도 존재한다. 작은 객체는 이미지 내에서 충분한 정보가 제공되지 않아 삭제되거나 아예 예측이 되지 않는 경우가 발생한다. 실제로 작은 객체의 일부가 있는 이미지에서도 FCN은 이..
[01] - FCN32s, FCN16s, FCN8s 이란?
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
FCN 이란?FCN은 2015년에 처음 소개된 신경망 모델로, 이미지의 픽셀 단위 예측을 수행하여 분할(Segmentation) 작업에서 중요한 역할을 하게 되었다. 이후 많은 연구에서 기본 모델로 사용되며 다양한 발전이 이루어졌다. FCN은 기존의 이미지 분류를 위해 설계된 네트워크와 달리, 이미지 내의 각 픽셀을 개별적으로 분류할 수 있도록 설계되었다는 점에서 차별성을 가진다. FCN의 주요 구성 요소와 특징   1. VGG 네트워크 백본 사용FCN은 VGG 네트워크를 백본(Backbone)으로 사용한다. VGG 네트워크는 이미지 특징을 추출하는 데 강력한 성능을 보여주며, 이는 FCN이 이미지 내 세밀한 특징을 분석하고 분류하는 데 적합한 구조이다. 여기서 백본은 Feature Extracting ..
U-Net 의 이해
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
U-Net은 이미지 분할(Image Segmentation) 문제를 해결하기 위해 개발된 합성곱 신경망(CNN) 기반의 모델이다. 이 모델은 2015년에 Olaf Ronneberger와 그의 동료들에 의해 의료 영상 분석을 위해 제안되었으며, 주로 생물학적 이미지 분할에 사용되었다. U-Net은 그 단순하지만 강력한 구조로 인해 다양한 컴퓨터 비전 문제에 널리 사용되고 있다. U-Net: Convolutional Networks for Biomedical Image SegmentationThere is large consent that successful training of deep networks requires many thousand annotated training samples. In this..
Faster R-CNN
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
Faster R-CNN 의 개념을 이해하기 전에 전에 블로그에서 설명했던 개념들을 먼저 간략하게 정리하고 설명하겠습니다. 1. Region Proposal (객체 후보 영역) Region Proposal은 이미지에서 객체가 있을 법한 위치를 미리 추출하는 단계입니다.초기 모델인 R-CNN은 이를 위해 Selective Search라는 기법을 사용했지만, Faster R-CNN에서는 이를 학습 가능한 네트워크인 Region Proposal Network (RPN)으로 대체합니다 2. RoI Pooling (Region of Interest Pooling)RoI Pooling은 Fast R-CNN에서 도입된 기법으로, 다양한 크기의 후보 영역(Region Proposals)을 고정된 크기의 벡터로 변환하는 ..
R-CNN, SPPNet, Fast R-CNN
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
1.  R-CNN R-CNN 의 경우는 아래의 논문리뷰에서 자세히 설명했습니다.아래 링크를 참고 부탁드립니다. https://ai-bt.tistory.com/entry/R-CNN-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0 R-CNN 논문 리뷰서론딥러닝의 발전과 함께 컴퓨터 비전 분야는 급격한 변화를 겪고 있습니다. 그중에서도 객체 탐지(Object Detection)는 이미지나 비디오에서 특정 객체를 찾아내고, 그 위치를 정확히 예측하는 중ai-bt.tistory.com 간략하게 R-CNN의 특징과 단점에 대해서 설명하겠습니다.1) 2000개의 Region을 각각 CNN 통과R-CNN은 객체 탐지에서 사용되는 기법으로, 이미지에서 Selective Search 알고리즘을 사용해 ..
ResNet 논문 리뷰
·
딥러닝 (Deep Learning)/[05] - 논문 리뷰
Abstract 깊은 신경망은 훈련하기 어렵다는 문제가 있습니다. Resnet 논문에서는 이전보다 훨씬 더 깊은 네트워크의 훈련을 용이하게 하기 위해 Residual learning(잔차 학습) 제안했습니다. 기존의 신경망은 각 층에서 출력할 값을 직접 학습 즉, 새로운 함수를 계속 학습하는 것인데, 이 방식은 층이 깊어질수록 학습하기 어려워지는 문제가 있었습니다. Residual Learning에서는 각 층이 출력할 값 자체를 학습하는 대신, 출력 값과 입력 값의 차이(residual(잔차))를 학습하게 됩니다. 이 Residual 는 "기존의 입력값에서 얼마나 더 변화를 줘야 하는지"만 신경 쓰는 것이죠. 이렇게 하면 신경망이 깊어져도 학습이 훨씬 더 쉬워집니다. 쉽게 말해서, 일반 신경망은 "처음부..