본문 바로가기

AI28

의료 데이터를 다룰 때 주의해야 할 윤리적, 법적 문제 의료 데이터는 개인의 민감한 정보가 포함된 중요한 자산이다. 이러한 데이터는 환자의 건강, 치료 이력, 유전자 정보 등 민감한 내용을 포함하고 있어 데이터 관리와 활용에 있어 매우 신중해야 한다. 특히, 의료 데이터를 인공지능(AI)이나 딥러닝 모델 학습에 사용하는 경우, 윤리적 문제와 법적 규제를 반드시 고려해야 한다. 아래에서는 의료 데이터를 다룰 때 주의해야 할 주요 윤리적, 법적 문제를 살펴본다.1. 환자 개인정보 보호의료 데이터는 개인정보 보호법에 따라 엄격히 관리되어야 한다. 환자의 개인정보가 노출될 경우 심각한 사생활 침해로 이어질 수 있다. 의료 데이터를 다룰 때 반드시 고려해야 할 주요 사항은 다음과 같다.데이터 익명화데이터 익명화는 개인을 식별할 수 있는 정보를 제거하거나 변환하여 데이.. 2024. 11. 26.
[04 Segmentation] - MMsegmentation 사용법 1. MMSegmentation이란? MMDetection과 MMSegmentation은 모두 컴퓨터 비전 분야에서 널리 사용되는 오픈소스 라이브러리이다. 특히, MMSegmentation은 주로 이미지 세그멘테이션 작업에 특화된 프레임워크로, 다양한 세그멘테이션 모델과 학습 방식을 지원한다.MMSegmentation은 OpenMMLab이라는 오픈소스 프로젝트의 일환으로 개발된 이미지 세그멘테이션을 위한 라이브러리이다. 이 프레임워크는 다양한 종류의 세그멘테이션 모델을 쉽게 구축하고 학습할 수 있도록 설계되어 있다. 대표적인 세그멘테이션 모델인 U-Net, DeepLab 시리즈, FCN(Fully Convolutional Network) 등을 지원하며, 최신 연구 결과와 알고리즘도 빠르게 반영하고 있다... 2024. 11. 9.
[03 OCR] - 영수증 데이터 추가 방법 1. EAST 모델 기반 영수증 텍스트 영역 검출 프로젝트 프로젝트는 EAST 모델을 기반으로 영수증의 텍스트 영역을 더욱 정밀하게 검출하는 데 중점을 두고 있다. 목표는 텍스트 영역 검출의 precision과 recall을 최대한 높여, 영수증 내 텍스트 검출 성능을 크게 향상시키는 것이다. EAST 모델 자체의 설명은 후반부에서 다루기로 하고, 먼저 기존에 부족했던 데이터셋을 보완하기 위해 영수증 데이터를 추가하는 과정을 공유하겠다.영수증 데이터셋이 제한적이었기에, 텍스트 검출의 정확도와 성능 향상에 어려움이 있었다. 이를 해결하기 위해 추가 데이터를 활용하여 train/val 세트를 확장하였고, 그 결과 텍스트 검출의 precision 와 recall 모두 긍정적인 성능 향상을 확인할 수 있었다. .. 2024. 11. 8.
[02 Object Detection] - MMdetection train/val 학습 방법 지난 블로그에서는 MMDetection의 기본적인 설치와 사용 방법에 대해 다뤘습니다. 이번 포스트에서는 train/val 데이터를 나누고 학습을 진행하는 방법에 대해 알아보겠습니다. 특히, COCO 형식의 데이터셋을 사용해 객체 탐지 모델을 학습하는 방법을 중점적으로 설명하겠습니다. [02 Object Detection] - MMdetection 설치 및 기본사용법MMDetection이란?MMDetection은 OpenMMLab에서 개발한 오픈 소스 딥러닝 객체 탐지 라이브러리입니다. 다양한 최신 객체 탐지 알고리즘을 구현하고 있어, 연구 및 실험을 위한 최적의 환경을 제공합니다.ai-bt.tistory.com 1. 데이터셋 준비 및 Train/Val 분할  객체 탐지 모델을 학습할 때, 보통 학습 데.. 2024. 10. 27.