본문 바로가기
의료 인공지능 전망, 의료 영상 분석 방법, 의료 데이터 분석 기법

병리 영상의 특성에 따른 영상분석 모델 개발의 어려움과 극복방안

by 펜앱 2022. 8. 2.

병리 영상의 특성에 따른 영상분석 모델 개발의 어려움과 극복 방안

병리 영상의 특성에 따른 영상분석 모델 개발의 어려움과 극복 방안
병리 영상의 특성에 따른 영상분석 모델 개발의 어려움과 극복 방안

병리 영상분석의 모델을 실제로 개발해보면 많은 어려움에 부딪히게 됩니다. 이는 굉장히 다양한 이유들 때문인데, 하나씩 살펴보겠습니다. 먼저 영상의 전체 크기가 매우 큽니다. 병리 영상은 대게 기가 픽셀 크기의 초고해상도 이미지입니다. 병리 이미지에서 가장 작은 크기로 볼 수 있는 생검 조직 영상 한 장의 파일 크기는 수백 메가바이트 정도이며, 절제 조직 영상의 파일 크기는 더 커서 수기가 바이트 정도입니다. 영상의 크기가 매우 커서 단일 이미지로 기계학습 및 딥러닝을 수행하기 쉽지 않습니다. 이 때문에 하나의 파일을 수백 픽셀 정도의 잘게 쪼개어 학습에 사용하고 있습니다. 또한 이렇게 크고 잘게 쪼개진 이미지를 입력으로 하여 분석 모델을 개발하기 위해서는 고성능의 GPU를 장착한 워크스테이션이 필요하고 알고리즘의 학습을 위해서는 기존 이미지의 학습에 비해서 훨씬 많은 시간이 소요됩니다.

다양한 level의 영상이 사용

두 번째로 다양한 level의 영상이 사용됩니다. 병리 진단을 할 때, 다양한 배율의 영상이 필요합니다. 병리 영상은 10배, 100배, 200배, 400배의 다양한 배율로 관찰하고 병리 진단을 내리게 됩니다. 대개 저배율에서는 암 조직의 전체적인 모양과 주변 조직과의 관계를 파악하고 중간 배율에서는 암세포가 만드는 조직학적 구조들의 특성을 파악합니다. 고배율에서는 암세포의 핵, 세포질, 핵인 등의 형태적 특성을 자세히 관찰하고 유사분열 등 세포의 변화 상황에 대해서 분석합니다. 이처럼 각 배율의 영상이 제공하는 병리 영상의 정보의 내용이 상이합니다. 따라서 영상분석 모델을 만들 때, 분석모델의 주제에 맞게 다양한 배율의 영상을 활용할 필요가 있습니다. 학습을 위해 필요한 영상을 처리하고 분석모델의 영상을 배율 별로 다양한 알고리즘을 학습하는 것이 필요할 수 있으며, 영상의 중요 특성을 추출한 뒤, 이러한 다양한 알고리즘의 결과를 통합적으로 처리하는 과정이 동반되는 경우도 많습니다.

디지털 영상 데이터 부족

또한, 디지털 영상 데이터가 부족합니다. 여러 의학 영상 중 병리 영상의 수는 상대적으로 적습니다. X-ray 검사는 흔히들 받아보셨겠지만 조직검사를 받아본 경험이 있는 사람은 별로 없으실 겁니다. 병리 진단은 환자가 어떤 병을 앓고 있는지를 확실하게 밝혀주는 확진 검사이지만 조직을 얻기 위해서는 내시경, 수술 등의 위험성을 수반한 의료행위가 필요하므로 꼭 필요한 경우에만 시행하게 됩니다. 또한 병리 영상의 크기는 매우 크고 최근에서야 임상에서 디지털화가 시작되고 있으므로 개발하려는 분석 모델에 사용하기 적합한 질 좋은 병리 영상을 충분히 확보하기가 매우 어렵습니다. 그리고, 주석 데이터가 부족합니다. 병리 영상분석 알고리즘을 개발하기 위해서는 주제에 맞는 주석 데이터가 필요합니다. 병리 영상은 매우 특수하여 의대를 졸업한 이후에 수년간의 전문적인 분야의 훈련과정이 없으면 제대로 평가할 수 없습니다. 따라서 주석 데이터는 병리 전문의가 직접 생성해야 하는 경우가 대부분인데, 영상 하나당 주석 데이터를 생성하는데에는 병리 전문의 조차도 최대로 수시간까지 소요될 수 있습니다. 따라서 양질의 충분한 주석데이터를 확보하기는 쉽지 않습니다.

영상의 표준화 미비

영상의 표준화가 미비하고 정규화되어 있지 않은 점도 문제입니다. CT, MRI 등의 영상은 DICOM 표준이 마련되어 사용되고 있습니다. 그러나 병리 영상은 지금까지 표준화되어 있지 않고 스캐너 제조사 별로 다른 포맷의 이미지를 생성하고 있습니다. 또한 조직 슬라이드는 의료기관마다 같은 종류의 염색을 수행해도 색상 등이 매우 다양하고 슬라이드 스캐너 별로도 영상의 색이나 대조도 등이 상이합니다. 영상의 색 차이나 전처리 방법에 따라 알고리즘의 성능이 달라지므로 세심한 이미지 전처리 과정이 필요합니다. 또한 영상에 아티팩트가 많습니다. 병리 영상은 10여 단계의 복잡한 과정을 통해 생성되기 때문에 다양한 아티팩트를 수반할 수 있습니다. 조직 체취 시 압착, 절편 과정에서의 칼자국, 커버 슬라이드 접착제 및 슬라이드 스캐너의 기술적 한계 등으로 인한 탈조점 등이 흔히 발생하는 병리 영상의 아티팩트입니다. 아티팩트가 많은 이미지를 학습에 사용하게 되면 알고리즘 성능 정하 등의 원인이 될 수 있습니다.

과학자 부족

마지막으로 병리 영상을 잘 다룰 수 있는 데이터 과학자가 부족한 점도 병리 영상분석 모델 개발에 어려움을 초래하는 요인이 되고 있습니다. 병리 영상분석 모델 개발의 어려움을 극복하기 위한 방안에 대해서 살펴보겠습니다. 현재 병리 영상분석 과정에서 만나게 되는 어려움을 극복하기 위한 다양한 노력이 기울어지고 있습니다. 디지털화된 데이터 부족을 극복하기 위해서 현재 세계적으로 많은 기관, 관련 학회 혹은 국가 단위로 병리 영상 데이터를 확보하기 위해 큰 노력을 기울이고 있어 활용할 수 있는 영상데이터가 점차 늘어나고 있습니다. 희귀한 지로한의 영상데이터 마련을 위해서는 합성 데이터를 생성하여 학습에 활용하는 방법도 고려해볼 수 있습니다. 주석 데이터를 정확하고 효율적으로 생성해내기 위한 여러 인공지능 기법이 개발되고 있습니다. 영상에 자세한 병변 주석을 만드는 대신에 암의 존재 여부 등의 라벨만 붙여 약지 도학 습기 법을 적용하여 알고리즘을 개발하기도 하고 주석 데이터 생성 시 몇 개의 대표 케이스에 주석을 생성한 후 기계학습 알고리즘을 적용하여 주석을 컴퓨터가 미리 생성해주면, 이를 기반으로 병리 의사가 수정하는 AI-Human 협력 방식으로 주석 생성의 정확성과 효율성을 높이고 있습니다. 영상의 표준화와 정규화 문제를 해결하기 위해서 병리 영상도 영상의학, 영상과 같이 표준영상 기준을 위해 활발한 논의를 진행하고 있습니다. 향후 1,2년 내로 병리 영상의 표준이 제시될 것으로 예측됩니다. 현재에는 병리 영상의 정규화를 위해서 다양한 기법이 적용되고 있습니다. 색상 다양성을 정규화하기 위한 기존의 RGB 보정 기법 이외에 최근에는 인공지능 기법인 생성적 적대신경망 기법을 활용하여 색상 정규화를 하려는 시도들이 이어지고 있습니다. 학습에 사용될 병리 영상의 질을 자동으로 평가하여 데이터를 취사선택하는 다양한 알고리즘들이 개발되고 있습니다. 이를 이용하면 개발자들은 모든 영상을 일일이 열어보면서 학습에 사용할지를 결정할 필요가 없어 알고리즘 개발 시 큰 도움을 받을 수 있습니다.

댓글