본문 바로가기

오블완21

[01 X-ray Hand] - Maskformer MaskFormer는 이미지를 분할하기 위해 classification + segmentation의 통합 접근 방식을 제안한 모델이다. 전통적인 방식이 픽셀 단위의 분류에 초점을 맞췄다면, MaskFormer는 각 마스크를 하나의 객체로 취급하여 보다 효율적인 분할을 수행한다. 특히, 트랜스포머(Transformer)를 활용하여 객체 간의 상호작용을 학습하며, 마스크 예측(mask prediction)과 클래스 예측(class prediction)을 함께 수행한다. MaskFormer의 주요 구조MaskFormer는 크게 Pixel-Level Module, Transformer Module, 그리고 Segmentation Module로 구성된다.1. Pixel-Level Module입력 이미지를 백본(R.. 2024. 11. 27.
의료 데이터를 다룰 때 주의해야 할 윤리적, 법적 문제 의료 데이터는 개인의 민감한 정보가 포함된 중요한 자산이다. 이러한 데이터는 환자의 건강, 치료 이력, 유전자 정보 등 민감한 내용을 포함하고 있어 데이터 관리와 활용에 있어 매우 신중해야 한다. 특히, 의료 데이터를 인공지능(AI)이나 딥러닝 모델 학습에 사용하는 경우, 윤리적 문제와 법적 규제를 반드시 고려해야 한다. 아래에서는 의료 데이터를 다룰 때 주의해야 할 주요 윤리적, 법적 문제를 살펴본다.1. 환자 개인정보 보호의료 데이터는 개인정보 보호법에 따라 엄격히 관리되어야 한다. 환자의 개인정보가 노출될 경우 심각한 사생활 침해로 이어질 수 있다. 의료 데이터를 다룰 때 반드시 고려해야 할 주요 사항은 다음과 같다.데이터 익명화데이터 익명화는 개인을 식별할 수 있는 정보를 제거하거나 변환하여 데이.. 2024. 11. 26.
Segmentation Models Pytorch 사용법 이번 포스팅에서는 Segmentation Models PyTorch(SMP) 라이브러리를 사용하여 UNet 기반의 모델을 학습하는 방법을 다룬다. SMP는 다양한 세그멘테이션 모델과 사전 학습된 백본(Backbone)을 제공하여 모델 개발을 간편하게 만든다. 이 글에서는 PyTorch와 SMP를 활용해 X-Ray 데이터를 학습하는 코드를 구성하고, 각 단계에서 사용한 기능과 로직을 설명하겠습니다.  SMP란 무엇인가?Segmentation Models PyTorch는 PyTorch를 기반으로 구축된 세그멘테이션 모델 라이브러리이다. UNet, UNet++, DeepLabV3+와 같은 다양한 모델을 지원하며, EfficientNet, ResNet, RegNet 등 여러 백본을 선택할 수 있다. 특히 사전 .. 2024. 11. 25.
Pseudo 라벨링(Pseudo Labeling)이란 무엇인가? Pseudo 라벨링은 반지도 학습(Semi-supervised Learning)의 한 기법이다. 이 방법은 모델이 예측한 결과를 기반으로*라벨이 없는 데이터(unlabeled data)에 임시 라벨을 할당하여 학습에 활용하는 방식이다. Pseudo 라벨링은 특히 라벨링 비용이 높은 상황에서 데이터 효율성을 극대화하는 데 유용하다.왜 Pseudo 라벨링을 사용하는가?라벨링 비용 절감데이터에 라벨을 직접 붙이는 작업은 많은 비용과 시간이 소요된다. Pseudo 라벨링은 모델의 예측 결과를 사용하여 라벨링 작업을 간소화한다.데이터 활용 극대화라벨이 없는 데이터도 학습에 포함할 수 있어, 전체 데이터셋의 크기를 증가시킨다. 이를 통해 모델의 일반화 성능을 높일 수 있다.모델 성능 개선모델이 학습 데이터를 더 많.. 2024. 11. 24.