본문 바로가기
의료 인공지능 전망, 의료 영상 분석 방법, 의료 데이터 분석 기법

인공지능을 활용한 EMR 정형 데이터 분석 사례

by 펜앱 2022. 8. 3.

인공지능을 활용한 EMR 정형 데이터 분석 사례

인공지능을 활용한 EMR 정형 데이터 분석 사례
인공지능을 활용한 EMR 정형 데이터 분석 사례

임상의사결정 지원시스템은 환자의 임상정보를 바탕으로 의료인이 진료 과정에서 적절한 임상적 판단과 의사결정을 하도록 돕는 시스템을 의미합니다. 임상의사결정 지원시스템은 규칙 기반으로 작동하거나 알맞게 디자인된 지식체계 베이스로 만들어지기도 했습니다만 최근 의료 현장에서 발생하는 다양한 데이터를 이용하여 환자의 예후를 예측하는 인공지능 모델을 만드는 방향으로 점점 발전하고 있습니다. 전자 의무기록은 환자에 대한 여러 의료행위 정보가 담겨 있으므로 임상현장에서 필요한 맞춤형 임상의사결정 지원시스템을 학습하는 용도로 활용 가능합니다. 연구 예시 중 하나로 무릎관절 전치환술 후 환자에게 수혈이 필요할지를 조기에 예측한 사례를 설명드리겠습니다. 해당 내용은 다음과 같은 논문에서 확인하실 수 있습니다. 이 연구는 정형외과에서 수행하는 무릎관절 전치환술은 관절염이 심한 무릎관절을 인공관절로 바꾸는 수술입니다. 수술 과정에서 많은 출혈이 발생할 수 있기 때문에 수혈이 필요할 가능성을 미리 예측한다면 환자의 안전과 예후에 많은 도움이 되겠지요. 본 연구의 목표는 기존 병원에서 수행된 무릎관절 전치환술 환자들의 EMR 데이터를 바탕으로 조기에 출혈 위험도를 미리 예측하는 머신러닝 모델을 개발하는 것이었습니다. 머신러닝 모델 개발과정 개요를 설명한 것입니다. 먼저 연구 대상에 대해 환자들을 선별하는 포함 및 제외 기준을 세우고 선별된 환자의 데이터를 EMR로부터 추출하였습니다. 주요 정보는 환자의 인구통계학 정보, 관측된 환자의 상태나 진단 정보, 수술 형태, 약재 처방 및 투약 이력, 그리고 진단 검사 정보입니다. 해당 정보들에서 정형외과 전문의의 전문지식에 의거하여 총 43개의 변수를 추출하였습니다. 이후, 수혈이 필요한 케이스를 분류하는 데에 적합한 변수들을 선택하여 모델의 예측성능을 높이고 경량화하는 과정이 진행되었습니다. 변수를 선택한 이유는 첫 번째로 머신러닝이 중요도가 떨어지는 변수를 학습하는 것을 방지하고자 하였고, 둘째로 만들어진 모델의 사용성을 높이기 위함이었습니다. 머신러닝 모델은 많은 변수를 고려하여 유의미한 관계를 찾아낼 수 있지만 향후 이 머신러닝 모델을 여러 의료 현장에서 사용하기 위해서는 입력되는 변수의 수를 적정 수준으로 줄여서 어떤 환경에서도 쉽게 이용 가능하게 만드는 것이 더 중요하다고 생각하였습니다. 이후 저희가 앞에서 다루었던 그래디언트 부스팅 모델을 학습하였습니다. 이후 저희가 앞에서 다루었던 그래디언트 부스팅 모델을 학습하였습니다 모델이 범용적인 예측 성능을 보이는지 확인하기 위해 학습에 사용되지 않은 다른 기관의 데이터를 이용하여 수혈 위험도를 예측하는 모델의 성능을 검증하였습니다. 그 결과, AUROC 0. 880 정도로 수혈이 필요로 하는 환자를 조기에 분류할 수 있음을 보였습니다. 이후 만들어진 모델은 웹 서비스를 통해 머신러닝 모델에 투입되어야 할 인자들을 직접 입력하면 해당 환자의 수혈 위험도를 계산하였습니다. 뿐만 아니라 입력한 입력 변수 각각이 수혈 위험도의 어느 정도의 영향력을 발휘하는지를 시각화된 형태로 표현하였습니다.

대규모 EMR 데이터를 활용하여 환자별 질환 가능성 예측

이번 연구사례는 DeepMind에서 수행한 연구입니다. DeepMind는 여러분들도 알파고 때문에 아주 많이 들어보셨을 것입니다. DeepMind는 이후 헬스케어 분야에도 적극적으로 연구를 진행하고 있습니다. 이번에 말씀드리고자 하는 연구는 대규모 EMR 데이터를 이용하여 급성 신장 손상이 발생할 위험도가 높은 환자를 예측하는 내용입니다. 해당 내용은 다음 논문에서 확인하실 수 있습니다. DeepMind에서 분석에 사용한 대규모 EMR 데이터는 미국 보훈처의 헬스케어 시스템 데이터입니다. 미국보훈처는 현역 및 퇴역 군인들과 가족이 이용할 수 있는 헬스케어 시스템을 운영하고 있고 매우 많은 병원이 소속되어 있습니다. 참고로 미국에 있는 여러 헬스케어 시스템 중에서 미국 보훈처의 헬스케어 시스템은 그 규모가 가장 큰 것으로 알려져 있습니다. 사용된 데이터에는 1,234개의 의료기관의 약 70만 명의 성인 환자들의 EMR 데이터로 구성되어 있습니다. 1,234개의 의료기관 중 1,062개는 외래를 보는 의료 기관이었으며, 172개의 의료기관은 입원 전문 병원이었습니다. 모델링 결과, 48시간 이전에 데이터를 활용하여 급성 신장 손상이 발생한 입원환자 55,8%를 조기에 분류해냈으며, 후속 신장 투석 투여가 필요한 급성 신장 손상 케이스를 90. 2%를 미리 예측을 하였다고 합니다. 사용한 모델은 순환 신경망이며, 논문에 나온 모델 개요는 해당 그림과 같습니다. 본문에 따르면 미국 보훈처의 EMR 빅데이터에서 사용 가능한 변수는 총 62만 개가 있었는데, 이 중 급성 신장 손상과 관련이 있는 315개의 변수를 미리 선정하였습니다. 투입되는 315개의 변수 데이터는 있는 그대로 사용된 것은 아니고 뉴럴 네트워크에 들어갈 수 있도록 정해진 차원에 벡터로 임베딩 하는 과정이 입력 층에 들어갔습니다. 그리고, RNN을 거쳐서 주 타깃 예측을 수행하는 층, 보조 타깃 예측을 수행하는 층을 출력층으로 설계하였습니다. 보조 타깃 예측 층은 딥러닝 모델의 학습을 가속화하기 위해 사용하는 기술적인 부분이고, 실제 급성 신장 손상을 예측하는 부분은 주 타깃 예측 층입니다. EMR 데이터는 해당 그림과 같이 표현되어 순환 신경망 모델에 투입되었습니다. 여기에서 동그라미는 6시간 단위의 블록에 해당되고, 6시간 동안 관측된 315개의 요인에 대한 임베딩 벡터가 투입되었습니다. 그리하여 48시간 동안에 데이터로 24시간 뒤에 급성 신장 손상, 48시간 뒤에 급성 신장 손상, 72시간 뒤에 급성 신장 손상을 예측하였습니다. 그 결과, 24시간 뒤의 Stag 3에 해당하는 급성 신장 손상을 예측하는 모델은 AUROC 0. 988에 높은 성능을 기록하였고, 모든 단계의 급성 신장 손상을 예측하는 모델은 AUROC 0. 934를 기록하였습니다. 48시간 뒤에 72시간 뒤 발생하는 급성 시잔 손상을 예측하는 모델은 이보다는 조금 낮은 AUROC를 기록하였지만 난이도가 있는 문제임에도 불구하고 72시간 뒤 발생하는 급성 신장 손상을 예측하는 모델은 AUROC 0. 914를 보였습니다. DeepMind는 이러한 급성 신장 손상 예측 모델이 케어 패스웨이를 바꿀 수 있을 것으로 보고 있습니다. 해당 그림에서 위에 하얀색 부분은 기존에 급성 신장 손상 환자를 치료하는 과정입니다. Technician이 환자의 상태를 파악하여 급성 신장 손상이 일어날 것을 찾게 되면 이를 여러 과정을 거쳐 입원한 환자 병상에서 환자를 케어하는 모습을 보여주고 있습니다. 이 과정에서 딜레이가 발생한다고 되어있지요. 아래쪽은 디지털 기술이 가미된 급성 신장 손상 환자를 치료하는 과정입니다. 먼저 환자 상태를 보고 인공지능 모델이 자동으로 급성 신장 손상을 예측을 하면 그 즉시, 관련 팀에 모바일로 알림을 줄 수 있을 것입니다. 그렇다면 급성 신장 손상이 발생할 것으로 예측되는 환자에게 더 빠른 처치를 할 수 있을 것이며 향후 이에 대한 follow up도 모바일을 통해 손쉽게 할 수 있을 것입니다. 이 치료 과정에서 나온 Streams는 딥마인드에서 급성 신장 손상을 관리하는 용도로 개발한 애플리케이션이며, 영국의 공공보건의료체계인 NHS와 협업하여 실제 케이스에 적용하고 있습니다. 딥마인드의 Streams 앱은 임상의에게 환자의 급성 신장 손상을 조기에 알림으로써, 환자 당 평균 2,000파운드, 우리나라 돈으로 230만 원의 치료비용을 세이브하는 효과를 거둘 수 있는 것으로 평가받고 있습니다.

약물 재창출을 위한 EMR 데이터 활용

이외에도 EMR의 정형 데이터를 활용한 인공지능 연구는 여러 가지 종류가 있습니다. 임상적으로는 다양한 환자의 예후를 예측하는 것을 목표로 EMR 데이터가 활용이 되고 있습니다. 산업적으로는 EMR 데이터로 만들어진 인공지능을 신약 개발, 개인 건강기록 앱 기능 등으로 구현하려는 움직임이 있습니다. 신약 개발 분야에서 EMR 데이터는 기존 약제에 새로운 적응증을 찾아내는 용도로 활용할 수 있습니다. 이는 신약을 개발하는 가속화하는 방법 중 하나인 약물 재창출에 해당됩니다. 2015년에는 대규모 EMR 데이터를 활용하여 메트포민이라는 약물이 암 진단 후 사망률 감소에 유의한 영향을 미친다는 연구가 발표되기도 하였습니다. 메트포민은 본래 제2형 당뇨병 환자에게 처방되는 약물인데, 미국에 주 의료기관, 밴더빌트 대학병원과 메이요 클리닉의 EMR 내에서 암 환자 레지스트리를 분석한 결과 당뇨병을 갖고 있는 암환자와 당뇨병을 갖고 있지 않은 암환자 모두에게 메트포민을 사용하는 경우, 메트포민을 사용하지 않는 경우보다 암 진단 후 사망률이 낮은 것을 발견하였습니다.

댓글