컴퓨터 비전에서 객체 검출(Object Detection)은 이미지에서 특정 객체의 위치를 찾아내고,
그 객체가 무엇인지를 식별하는 복잡한 작업입니다.
하지만 이미지 전체를 대상으로 모든 가능한 위치에서 객체를 찾으려면, 그 계산 비용은 엄청나게 커지게 됩니다.
바로 이 문제를 해결하기 위해 등장한 개념이 Region Proposals 입니다.
그 중에서도 오늘 이야기할 주제는 Bottom-up Region Proposals 입니다.
이 블로그는 R-CNN 논문에서 연결되는 개념입니다.
1. Region Proposals란 무엇인가요?
간단히 말해, Region Proposals(영역 제안)은 이미지에서 객체가 있을 가능성이 높은 후보 영역을 찾아내는 과정입니다. 이러한 영역 제안은 객체 검출 과정에서 중요한 첫 단계로,
전체 이미지에서 검사할 후보 영역의 수를 줄여주어,
모델이 더 효율적으로 객체를 찾을 수 있게 도와줍니다.
2. Bottom-up Region Proposals의 의미
Bottom-up(상향식) 은
픽셀 단위(Low level)의 특징들(색상, 텍스처, 엣지 등)을 기반에서 확장하는 방식을 의미합니다.
이 방식에서는 이미지의 작은 부분(픽셀단위)에서 시작하여 점점 더 큰 구조를 형성해 나가며
객체의 후보 영역을 생성하는 것을 말합니다.
어떻게 동작 할까?
Bottom-up Region Proposals은 주로 Selective Search와 같은 알고리즘을 통해 구현됩니다.
이 알고리즘은 이미지에서 다음과 같은 방식으로 영역을 제안합니다:
- Low level 특징 추출
이미지의 색상, 텍스처, 밝기 등의 Low-level 특징을 분석합니다.
이 특징들은 이미지 내에서 유사한 성질을 가진 픽셀들을 그룹화하는 데 사용됩니다. - 유사한 픽셀 그룹화
유사한 색상이나 텍스처를 가진 인접 픽셀들을 묶어 작은 영역을 만듭니다.
이 과정에서 여러 가지 크기와 형태의 작은 후보 영역들이 생성됩니다. - 영역 확장 및 병합
생성된 작은 영역들은 점차적으로 병합되거나 확장되어 더 큰 영역이 만들어집니다.
이렇게 점진적으로 더 큰 구조가 형성되면서, 최종적으로 객체가 있을 법한 후보 영역들이 도출됩니다. - 최종 후보 영역 선택
마지막으로, 이미지에서 약 2000개 정도의 후보 영역이 선택됩니다. 이 후보 영역들은 객체가 있을 가능성이 높은 위치로 간주되며, 이후에 딥러닝 모델(CNN)을 사용해 실제로 어떤 객체가 포함되어 있는지 분석됩니다.
왜 Bottom-up 접근법이 중요할까?
Bottom-up Region Proposals의 가장 큰 장점은 효율성입니다.
이미지 전체를 대상으로 객체를 찾는 것은 매우 비효율적이기 때문에, 이러한 후보 영역을 사전적으로 제안함으로써,
더 적은 영역만을 집중적으로 분석할 수 있게 됩니다. 또한, 이 방식은 특정한 객체나 클래스에 대한 사전 지식 없이도 작동할 수 있어, 일반적인 이미지 분석 작업에 매우 유용합니다.
Bottom-up vs Top-down
이와 대조되는 방식으로는 Top-down 접근법이 있습니다. Top-down 방식은 고수준의 정보나 사전 지식을 바탕으로 객체가 있을 법한 위치를 먼저 예측한 후, 이를 바탕으로 세부 분석을 하는 방식입니다. 반면, Bottom-up 방식은 이미지의 가장 기초적인 특징부터 출발하여 후보 영역을 구축하기 때문에, 사전 지식이 없어도 다양한 객체를 검출하는 데 적합합니다.
'AI > 딥러닝' 카테고리의 다른 글
Pytorch에서 Learning Rate(LR) 스케줄링 다양한 기법 (1) | 2024.09.30 |
---|---|
SVM(Support Vector Machine) 이란? [R-CNN] (0) | 2024.09.03 |
[Ch.02] 01 - CNN 모델 만들기 part 1 (0) | 2023.01.04 |
[Ch.01] 04 - 다중 분류 Mnist (0) | 2023.01.03 |
[Ch.01] 03 - Pytorch 를 활용한 간단한 회귀분석 (0) | 2023.01.02 |
댓글