[05 RE-ID] - 기술 도입의 한계와 고려사항 그리고 해결책
·
딥러닝 (Deep Learning)/[08] - 프로젝트
이전에 Re-ID 기술에 대해 간략히 소개한 바 있다. 이번에는 Re-ID 기술을 실제 프로젝트에 적용하며 마주한 한계점과 이를 해결하기 위한 아이디어를 정리해 보았다.Re-ID 기술은 초기 단계인 1단계(사람 검출)과 2단계(피처 추출)까지는 비교적 쉽게 도입할 수 있었다. 하지만, 3단계(임베딩), 4단계(클러스터링), 5단계(트래킹), 6단계(검색)으로 넘어가려면 몇 가지 중요한 한계와 문제점이 존재했다.https://ai-bt.tistory.com/entry/05-RE-ID-Re-Identification-%EA%B8%B0%EC%88%A0-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0한계와 문제점1. 클러스터 라벨링 문제Re-ID 시스템에서 클러스터링을 수행하려면 각 클러스터(..
[05 RE-ID] - Re-Identification 기술 이해하기!
·
딥러닝 (Deep Learning)/[08] - 프로젝트
Re-ID 란?Re-ID (Re-Identification) 기술은 여러 장면에서 촬영된 이미지에서 같은 사람을 인식하고 식별하는 기술이다. 주어진 이미지(검색할 이미지)와 데이터베이스의 이미지를 비교하여 같은 사람을 찾는 것이 주요 목표이다. 아래에 Re-ID의 과정을 단계별로 정리하였다. 우선 RE-ID 의 과정은 아래와 같이 진행 된다. 하나씩 내용을 보면서 이해해보자. 사람 검출 (Detection)피처 추출 (Feature Extraction)임베딩 (Embedding)클러스터링 (Clustering)트래킹 (Tracking)검색 (Search) 1. 사람검출 (Detection)Re-ID의 첫 번째 단계는 입력 이미지에서 사람을 탐지하는 것이다. 이 과정에서는 Object Detection 모..
딥러닝 파일 확장자의 차이점 *.mar, *.pt, *.pth, *.onnx
·
딥러닝 (Deep Learning)/[07] - Serving
딥러닝 모델 파일은 다양한 확장자로 저장되며, 각각의 파일은 목적과 사용 환경에 따라 다르게 활용된다. 이번 글에서는 .pt, .pth, .mar,.onnx 확장자 파일의 차이점과 용도에 대해 자세히 알아보자.1. .pt 파일: PyTorch 모델의 범용적인 저장 형식 .pt는 PyTorch에서 학습된 모델의 범용적인 저장 형식으로 사용된다.주로 모델의 전체 구조와 가중치, 또는 가중치만을 저장할 때 쓰이며, 파일 이름에서 바로 모델과 관련된 파일임을 직관적으로 알 수 있다. 주요 특징직관적인 확장자.pt는 "PyTorch Model"을 의미하며, 직관적으로 PyTorch 모델 파일임을 나타낸다.전체 모델 저장 가능PyTorch 모델의 전체 구조(아키텍처)와 학습된 가중치를 함께 저장할 수 있다.범용성모..
TorchServe 모델 배포 방법!
·
딥러닝 (Deep Learning)/[07] - Serving
TorchServe는 PyTorch 모델을 프로덕션 환경에 배포하기 위한 툴이다. 이를 통해 모델을 REST API 형태로 제공할 수 있으며, 모델 추론을 위한 서버를 쉽게 구성할 수 있다. TorchServe는 확장성이 뛰어나고, 다양한 모델 서빙 기능을 지원하며, 실시간 추론과 배치 추론 모두를 처리할 수 있다. 우선 TorchSerrve 상세한 사용법은 아래 공식 git 링크에 잘 나와 있다. GitHub - pytorch/serve: Serve, optimize and scale PyTorch models in productionServe, optimize and scale PyTorch models in production - pytorch/servegithub.com 환경셋팅과 간단한 모델로 ..
VTK, ITK, WPF란 무엇인가?
·
딥러닝 (Deep Learning)/[02] - 데이터
VTK, ITK, WPF는 각각의 목적과 역할이 다른 소프트웨어 라이브러리 또는 프레임워크로, 주로 그래픽, 데이터 처리, 사용자 인터페이스와 관련된 작업에서 사용된다. 다음은 각 기술의 개요와 특징이다.VTK (Visualization Toolkit)  VTK는 Visualization Toolkit의 약자로, 3D 컴퓨터 그래픽과 데이터 시각화를 위한 오픈소스 라이브러리이다.1) 주요 특징3D 시각화:과학적 데이터(의료 영상, CT, MRI 등)를 3D로 렌더링하여 시각화할 수 있다.예: 3D 재구성, 볼륨 렌더링(Volume Rendering) 등.플랫폼 독립적:Windows, Linux, macOS 등 다양한 운영 체제에서 동작.풍부한 데이터 형식 지원:의료 데이터(DICOM), 공학적 시뮬레이션..
DICOM이란 무엇인가?
·
딥러닝 (Deep Learning)/[02] - 데이터
DICOM은 Digital Imaging and Communications in Medicine의 약자로, 의료 영상 데이터를 저장하고 교환하기 위한 국제 표준이다. 주로 CT, MRI, 초음파, 방사선 사진 등 다양한 의료 영상을 저장하는 데 사용되며, 의료 AI에서 필수적으로 사용되는 데이터 형식이다.DICOM은 단순한 이미지 파일이 아니라, 메타데이터와 결합되어 환자 정보, 촬영 정보, 장비 정보 등을 포함한다. 이러한 구조는 의료 데이터의 관리와 분석에 매우 유용하다.DICOM의 구조DICOM은 단순히 영상 파일만 담고 있는 것이 아니라, 메타데이터를 포함하여 환자 정보, 촬영 정보, 장비 정보 등 다양한 부가 정보를 포함하고 있다. 이러한 구조 덕분에 의료 데이터에서 필요한 모든 정보를 한 파일..
Model Serving 패턴 종류
·
딥러닝 (Deep Learning)/[07] - Serving
Serving 의 구성우선 Serving 은 크게 아래와 같은 구성으로 이루어진다. 1) 예측 서버머신러닝 모델이 실제로 배치되어 예측을 수행하는 역할을 담당한다. 2) 데이터베이스예측 서버에서 생성된 결과를 저장하고, 서비스 서버가 이를 활용할 수 있도록 제공한다. 3) 서비스 서버사용자와 직접 상호작용하는 부분으로, 사용자 요청에 따라 데이터를 가져와 결과를 반환한다. 이 구성은 머신러닝 시스템 설계에서 기본적인 패턴으로, 배치(Batch) 또는 실시간(Online) 서빙에서 모두 활용될 수 있다. 상황에 따라 각 컴포넌트를 조정하여 더 최적화된 구조를 설계할 수 있다. 이제 Serving 종류에 대해서 알아보자. Batch 패턴우선 상황을 예시로 하나씩 살펴보자.상황  영화 추천 모델을 개발 완료한..
Model Serving 이란??
·
딥러닝 (Deep Learning)/[07] - Serving
Serving 이란?Serving이란 머신러닝 모델을 실제 운영 환경(production)에서 사용할 수 있도록 배포하는 작업을 의미한다. 이는 모델이 연구 및 개발 환경에서 성공적으로 학습된 이후, 실제 서비스에서 활용되도록 하는 과정이다. Serving의 주요 목표는 모델을 서비스화하여 실시간으로 데이터를 처리하거나 예측 결과를 제공하는 것이다.즉, Input 값을 Model에게 주입하면 모델이 Output 변환하여 반환 하는 것을 말한다. Serving 종류1. Batch ServingBatch Serving은 데이터를*일정한 묶음 단위(batch)로 처리하여 결과를 제공하는 방식이다. 특정 시간 간격으로 데이터가 수집된 후, 한 번에 예측 작업을 수행한다. 일상적인 예시로는, 하루 동안의 주문 데..
Maskformer
·
딥러닝 (Deep Learning)/[03] - 모델
MaskFormer는 이미지를 분할하기 위해 classification + segmentation의 통합 접근 방식을 제안한 모델이다. 전통적인 방식이 픽셀 단위의 분류에 초점을 맞췄다면, MaskFormer는 각 마스크를 하나의 객체로 취급하여 보다 효율적인 분할을 수행한다. 특히, 트랜스포머(Transformer)를 활용하여 객체 간의 상호작용을 학습하며, 마스크 예측(mask prediction)과 클래스 예측(class prediction)을 함께 수행한다. MaskFormer의 주요 구조MaskFormer는 크게 Pixel-Level Module, Transformer Module, 그리고 Segmentation Module로 구성된다.1. Pixel-Level Module입력 이미지를 백본(R..