본문 바로가기

분류 전체보기113

이미지 기반 손 뼈 EDA 데이터 EDA 이번 프로젝트의 목표는 X-ray 이미지를 받아 사람의 손 뼈를 분할(segmentation)하는 모델을 만드는 것이다. 향후 자동화된 진단 시스템에 사용될 가능성이 있으며, 의료 현장에서 정확한 손 뼈 분할을 통해 의사의 진단을 돕는 역할을 할 수 있을 것으로 기대된다. 1. 데이터 구성이미지는 2048 x 2048 해상도의 3채널 RGB 형태이다. 높은 해상도의 이미지를 사용함으로써 손 뼈의 세부적인 형태와 구조를 분할하는 데에 유리하다. 고해상도 이미지는 모델이 보다 세밀한 구조를 학습할 수 있는 장점이 있다.총 데이터 수: 550명으로부터 얻은 X-ray 이미지훈련 이미지: 800장 (400명의 이미지)테스트 이미지: 300장 (150명의 이미지)이렇게 제공된 데이터를 바탕으로 모델.. 2024. 11. 11.
U-Net 의 이해 U-Net은 이미지 분할(Image Segmentation) 문제를 해결하기 위해 개발된 합성곱 신경망(CNN) 기반의 모델이다. 이 모델은 2015년에 Olaf Ronneberger와 그의 동료들에 의해 의료 영상 분석을 위해 제안되었으며, 주로 생물학적 이미지 분할에 사용되었다. U-Net은 그 단순하지만 강력한 구조로 인해 다양한 컴퓨터 비전 문제에 널리 사용되고 있다. U-Net: Convolutional Networks for Biomedical Image SegmentationThere is large consent that successful training of deep networks requires many thousand annotated training samples. In this.. 2024. 11. 10.
[04 Segmentation] - MMsegmentation 사용법 1. MMSegmentation이란? MMDetection과 MMSegmentation은 모두 컴퓨터 비전 분야에서 널리 사용되는 오픈소스 라이브러리이다. 특히, MMSegmentation은 주로 이미지 세그멘테이션 작업에 특화된 프레임워크로, 다양한 세그멘테이션 모델과 학습 방식을 지원한다.MMSegmentation은 OpenMMLab이라는 오픈소스 프로젝트의 일환으로 개발된 이미지 세그멘테이션을 위한 라이브러리이다. 이 프레임워크는 다양한 종류의 세그멘테이션 모델을 쉽게 구축하고 학습할 수 있도록 설계되어 있다. 대표적인 세그멘테이션 모델인 U-Net, DeepLab 시리즈, FCN(Fully Convolutional Network) 등을 지원하며, 최신 연구 결과와 알고리즘도 빠르게 반영하고 있다... 2024. 11. 9.
[03 OCR] - 영수증 데이터 추가 방법 1. EAST 모델 기반 영수증 텍스트 영역 검출 프로젝트 프로젝트는 EAST 모델을 기반으로 영수증의 텍스트 영역을 더욱 정밀하게 검출하는 데 중점을 두고 있다. 목표는 텍스트 영역 검출의 precision과 recall을 최대한 높여, 영수증 내 텍스트 검출 성능을 크게 향상시키는 것이다. EAST 모델 자체의 설명은 후반부에서 다루기로 하고, 먼저 기존에 부족했던 데이터셋을 보완하기 위해 영수증 데이터를 추가하는 과정을 공유하겠다.영수증 데이터셋이 제한적이었기에, 텍스트 검출의 정확도와 성능 향상에 어려움이 있었다. 이를 해결하기 위해 추가 데이터를 활용하여 train/val 세트를 확장하였고, 그 결과 텍스트 검출의 precision 와 recall 모두 긍정적인 성능 향상을 확인할 수 있었다. .. 2024. 11. 8.