'딥러닝 (Deep Learning)' 카테고리의 글 목록 (4 Page)

Receptive Field 란??Receptive field는 신경망에서 특정 뉴런이 입력 데이터(예: 이미지)에서 보는 영역을 의미한다. 예를 들어, 이미지의 한 픽셀을 처리하는 뉴런이 주변 3×3 영역을 참조한다면, 이 3×3 영역이 해당 뉴런의 receptive field이다. 이는 입력 데이터를 이해하고 정보를 추출하는 데 매우 중요한 개념이다.Receptive Field가 작은 경우이미지에서 빨간 점을 중심으로 segmentation을 수행할 때, 작은 receptive field는 새의 일부 정보만 포함한다.결과적으로, 모델이 전체 문맥이나 객체의 구조를 이해하지 못하고, 부분적인 정보에만 의존하여 정확도가 떨어질 수 있다. Receptive Field가 큰 경우반대로, 큰 receptive..

SegNet은 이미지 분할 문제를 해결하기 위해 개발된 합성곱 신경망(CNN) 기반의 모델이다. SegNet은 주로 실시간 세그멘테이션에 초점을 맞추어 설계되었으며, U-Net과 같은 목적을 지니고 있지만 더 가볍고 효율적인 구조를 가지고 있다. 이 모델은 Enet 및 FCN과 같은 다른 세그멘테이션 모델들과 비교하여, 인코더-디코더 구조를 채택하고 있으며, 이를 통해 공간 정보를 유지하면서 효율적으로 이미지 분할을 수행할 수 있다.SegNet의 아키텍처SegNet은 크게 인코더(Encoder)와 디코더(Decoder)로 구성된 아키텍처이다. 이 아키텍처는 VGG16에서 영감을 받은 인코더 구조를 사용하지만, 주로 특징을 추출한 후 그 특징을 복원하는 방식으로 설계되었다. 인코더는 이미지를 점점 작게 만..

학습률(Learning Rate, LR)은 딥러닝 모델의 최적화를 위해 매우 중요한 하이퍼파라미터이다. 학습률은 모델이 각 반복(iteration)마다 가중치를 얼마나 크게 업데이트할지를 결정하며, 적절한 값을 선택하지 않으면 학습 속도와 성능에 큰 영향을 미친다. 이번 글에서는 학습률의 종류와 설정 방법에 대해 정리한다.고정 학습률(Fixed Learning Rate)고정 학습률은 학습 과정에서 변하지 않는 일정한 값을 사용하는 방법이다. 학습이 단순한 경우나 데이터가 안정적일 때 사용되며, 설정이 간단하다는 장점이 있다. 그러나 학습 초기에 과도하게 큰 값으로 설정되면 학습이 불안정해지고, 너무 작은 값으로 설정하면 학습 속도가 느려질 수 있다.장점: 설정이 간단하고 구현이 쉬움.단점: 학습 과정에 ..

Ensemble 이란?Ensemble이란 여러 개의 모델을 조합하여 단일 모델보다 더 나은 성능을 달성하려는 기법을 말한다. 머신러닝 및 딥러닝에서, 서로 다른 모델이나 같은 구조의 모델을 조합하면 단일 모델의 한계를 보완하고, 더 일반화된 예측 성능을 얻을 수 있다.Segmentation에서 ensemble을 활용하면 서로 다른 모델의 예측 결과를 조합하여 성능을 향상시킬 수 있다. 이번 글은 segmentation에 사용할 수 있는 ensemble 기법들을 소개하겠다.기본 Ensemble 1. Majority Voting (Pixel-wise Voting)Majority Voting (Pixel-wise Voting)는 Segmentation 작업에서 각 픽셀 단위로 여러 모델의 출력 결과를 조합하..

FC DenseNet이란? FC DenseNet은 Fully Convolutional DenseNet의 약자로, Fully Convolutional Network (FCN)과 DenseNet을 결합하여 이미지 분할 (segmentation) 작업에 최적화된 모델이다. DenseNet의 특징인 Dense Block과 feature reuse를 활용하면서도, FCN의 encoder-decoder 구조를 채택해 픽셀 단위 예측을 수행한다. 이러한 구조는 주로 의료 영상과 같은 이미지 분할 작업에서 효과적으로 사용된다. FC DenseNet의 구성 요소 DenseNet은 Dense Block이라는 구조를 통해 각 layer가 이전 layer의 출력을 연결해나가며 점진적으로 feature map을 확장한다. 예..

SegNet 이란??SegNet은 특히 도로 장면을 이해하기 위해 설계된 Semantic Segmentation 모델이다. SegNet의 주요 목표는 차량, 도로, 차선, 건물, 보도, 하늘, 사람과 같은 객체들을 빠르고 정확하게 구분하는 것이다. 이 글에서는 SegNet이 어떤 발전 동기와 구조를 가지고 있으며, 유사한 네트워크와 어떤 차이점이 있는지 알아보자. SegNet의 발전 동기SegNet은 자율 주행과 같은 Road Scene Understanding Applications를 위한 모델로 개발되었다. 이 분야에서는 다양한 객체들을 명확하게 분류할 수 있는 세그멘테이션 모델이 필수적이다. SegNet은 기존 모델들이 기능적으로 뛰어난 성능을 제공하더라도 속도가 부족한 문제를 해결하고자 개발되었..

FCN 의 한계점 1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못하는 문제FCN(Fully Convolutional Network)은 객체의 크기에 따라 예측 정확도가 달라지는 문제가 있다. 특히, 큰 객체의 경우 지역적인 정보만을 사용해 예측하기 때문에 오차가 발생하기 쉽다. 위의 이미지에 상당 부분을 보면, 버스의 앞 부분을 버스로 인식하지만 유리창에 비친 자전거를 보고 자전거로 예측하는 문제가 발생하기도 한다. 이는 동일한 객체여도 부분적으로 다른 레이블이 예측될 가능성을 높인다. 작은 객체의 경우 무시되는 문제도 존재한다. 작은 객체는 이미지 내에서 충분한 정보가 제공되지 않아 삭제되거나 아예 예측이 되지 않는 경우가 발생한다. 실제로 작은 객체의 일부가 있는 이미지에서도 FCN은 이..

FCN 이란?FCN은 2015년에 처음 소개된 신경망 모델로, 이미지의 픽셀 단위 예측을 수행하여 분할(Segmentation) 작업에서 중요한 역할을 하게 되었다. 이후 많은 연구에서 기본 모델로 사용되며 다양한 발전이 이루어졌다. FCN은 기존의 이미지 분류를 위해 설계된 네트워크와 달리, 이미지 내의 각 픽셀을 개별적으로 분류할 수 있도록 설계되었다는 점에서 차별성을 가진다. FCN의 주요 구성 요소와 특징 1. VGG 네트워크 백본 사용FCN은 VGG 네트워크를 백본(Backbone)으로 사용한다. VGG 네트워크는 이미지 특징을 추출하는 데 강력한 성능을 보여주며, 이는 FCN이 이미지 내 세밀한 특징을 분석하고 분류하는 데 적합한 구조이다. 여기서 백본은 Feature Extracting ..

U-Net은 이미지 분할(Image Segmentation) 문제를 해결하기 위해 개발된 합성곱 신경망(CNN) 기반의 모델이다. 이 모델은 2015년에 Olaf Ronneberger와 그의 동료들에 의해 의료 영상 분석을 위해 제안되었으며, 주로 생물학적 이미지 분할에 사용되었다. U-Net은 그 단순하지만 강력한 구조로 인해 다양한 컴퓨터 비전 문제에 널리 사용되고 있다. U-Net: Convolutional Networks for Biomedical Image SegmentationThere is large consent that successful training of deep networks requires many thousand annotated training samples. In this..

티스토리툴바