DICOM은 Digital Imaging and Communications in Medicine의 약자로, 의료 영상 데이터를 저장하고 교환하기 위한 국제 표준이다. 주로 CT, MRI, 초음파, 방사선 사진 등 다양한 의료 영상을 저장하는 데 사용되며, 의료 AI에서 필수적으로 사용되는 데이터 형식이다.
DICOM은 단순한 이미지 파일이 아니라, 메타데이터와 결합되어 환자 정보, 촬영 정보, 장비 정보 등을 포함한다. 이러한 구조는 의료 데이터의 관리와 분석에 매우 유용하다.
DICOM의 구조
DICOM은 단순히 영상 파일만 담고 있는 것이 아니라, 메타데이터를 포함하여 환자 정보, 촬영 정보, 장비 정보 등 다양한 부가 정보를 포함하고 있다. 이러한 구조 덕분에 의료 데이터에서 필요한 모든 정보를 한 파일 안에서 관리할 수 있다. DICOM 파일은 크게 2가지로 나뉜다.
- 메타데이터 (Header)
- 환자 정보: 이름, ID, 나이, 성별
- 촬영 정보: 촬영 날짜, 시간, 장비 정보(기종, 제조사 등)
- 해상도 및 영상 속성: 픽셀 크기, 비트 깊이 등
- 병리 정보: 의심되는 질병이나 진단 결과(선택적으로 포함 가능)
- 이미지 데이터
- 의료 영상의 픽셀 데이터(Pixel Array)가 저장된다.
- 픽셀 값은 영상 종류에 따라 의미가 다름
- CT: Hounsfield Unit (HU)
- MRI: 신호 강도
- X-ray: 흑백 명도 값
- 데이터 구조
Data Set
- Data Set은 여러 개의 Data Element로 구성된다.
- DICOM 파일의 데이터를 계층적이고 순차적인 방식으로 저장하거나 전송하기 위한 기본 단위이다.
- Order of transmission: Data Set의 각 Data Element는 특정 순서에 따라 전송된다.
Data Element
Data Element는 DICOM Data Set의 가장 기본적인 구성 요소로, 각 데이터 항목을 표현한다.
Data Element는 다음의 네 가지 주요 필드로 구성된다:
- Tag
- 데이터 항목을 식별하는 고유 값(4-byte).
- DICOM 표준에서 Tag는 그룹 번호와 요소 번호로 이루어진다.
예:- (0010,0010): Patient's Name(환자 이름)
- (0010,0020): Patient ID(환자 식별 번호)
- VR (Value Representation)
- 데이터 값(Value Field)의 데이터 타입을 나타낸다(2-byte).
- 예:
- PN(Person Name): 문자열로 된 이름.
- LO(Long String): 제한된 길이의 문자열.
- UI(Unique Identifier): 고유 식별자.
- Value Length
- Value Field의 길이를 나타내는 값(2 또는 4-byte).
- Value Field의 데이터 크기에 따라 값이 달라진다.
- Value Field
- 실제 데이터 값이 저장되는 필드.
- 예: "John Doe"라는 환자 이름이나 "12345678"과 같은 환자 ID가 여기에 포함된다.
DICOM이 필요한 이유 : 의료 영상의 표준화
1) 의료 영상 데이터 관리의 복잡성
오늘날 병원에서는 다양한 장비를 통해 의료 영상을 생성하고 있다.
- X-ray 촬영
- 초음파 검사
- CT(Computed Tomography) 촬영
- MRI(Magnetic Resonance Imaging) 촬영
이처럼 다양한 의료 영상 장비가 발전하면서, 각 장비에서 생성된 데이터를 효율적으로 통합 관리하고, 필요할 때 빠르게 조회할 수 있는 방법이 중요해졌다.하지만 한 가지 큰 문제가 있었다. 제조사별 호환성 문제였다.
2) 호환성 문제의 예
제조사마다 장비와 데이터 형식이 다르면, 각기 다른 소프트웨어나 시스템으로 데이터를 관리해야 한다.
이 문제는 우리가 사용하는 문서 작성 프로그램과 유사하다.
- Microsoft Word로 작성한 .doc 파일
- Mac Pages로 작성한 .pages 파일
- 한글(HWP)로 작성한 .hwp 파일
각 파일 형식은 해당 소프트웨어에서만 열리기 때문에 호환이 어려운 경우가 많다.
하지만 이러한 문서를 PDF 형식으로 변환하면, 하나의 표준 뷰어로 열람이 가능하다.
의료 영상 데이터도 마찬가지이다. 다양한 제조사 장비에서 생성된 데이터를 호환하기 위해 표준 형식이 필요했던 것이다.
3) 의료 영상의 독특한 요구사항
의료 영상은 단순한 일반 이미지와는 다르다.
환자의 진단, 치료 계획, 기록 보관 등에 사용되기 때문에 다음과 같은 독특한 요구사항을 충족해야 한다.
- 메타데이터 포함
의료 영상은 영상 자체뿐 아니라, 환자 정보, 검사 정보, 촬영 정보 등을 함께 저장해야 한다.
예: 환자의 이름, 나이, 성별, 검사 날짜, 촬영 기기 정보 등. - 보안
의료 영상에는 환자의 민감한 개인정보가 포함되어 있어, 이를 보호할 수 있는 보안 프로토콜이 필요하다.
예: 데이터 암호화, 익명화 처리(Anonymization). - 장비 간 통신
의료 영상은 단순히 저장하는 데 그치지 않고, 다양한 장비와 연동된다.- 촬영 장비(X-ray, MRI 등)
- OCS(Order Communication System, 처방 전달 시스템)
- PACS(Picture Archiving and Communication System, 의료영상저장전송시스템)
- 프린터, 아카이브 시스템
4) DICOM의 등장
위와 같은 필요성을 해결하기 위해 개발된 표준이 바로 DICOM(Digital Imaging and Communications in Medicine)이다.
DICOM은 다양한 제조사의 장비와 다양한 종류의 의료 영상 데이터를 통합 관리할 수 있는 표준을 제공한다.
이상입니다.
끝.
'딥러닝 (Deep Learning) > [02] - 데이터' 카테고리의 다른 글
VTK, ITK, WPF란 무엇인가? (3) | 2024.12.10 |
---|---|
의료 데이터를 다룰 때 주의해야 할 윤리적, 법적 문제 (3) | 2024.11.26 |
이미지 기반 손 뼈 EDA (6) | 2024.11.11 |
[05] - OCR 의 데이터 포맷 UFO (3) | 2024.10.30 |
[04] - OCR 기반 문서 이해 (2) | 2024.10.30 |