본문 바로가기
의료 인공지능 전망, 의료 영상 분석 방법, 의료 데이터 분석 기법

인공지능을 활용한 EMR 비정형데이터 분석 사례

by 펜앱 2022. 8. 3.

인공지능을 활용한 EMR 비정형 데이터 분석 사례

인공지능을 활용한 EMR 비정형 데이터 분석 사례
인공지능을 활용한 EMR 비정형 데이터 분석 사례

인공지능의 발전에 힘입어 실제 의료 현장에서도 AI가 적극적으로 활용되고 있습니다. 예를 들어 IBM의 왓슨은 의사의 진단을 보조하는 도구로 활용되고 있습니다. 병원 시스템 및 연구 개발에도 인공지능이 활발하게 사용되고 있습니다. AI 플랫폼을 통해 인공지능이 가정에서 복약지도를 하거나 인공지능 의료 녹취를 통해 영상 데이터 판독 소견 음성을 실시간으로 문서화해 저장하고 시스템에 등록하는 작업을 자동화하는 등에 사용처가 있습니다. 치료 전에 문진 챗봇을 사용하는 병원도 늘고 있습니다. 고혈압, 당뇨 등 만성질환자는 기간을 두고 내원하기에 질병 근원을 파악하기 쉽지 않은데요. 챗봇은 병원 밖 일상에서 환자에게 어떤 운동을 했는지, 무얼 먹었는지 등에 대해 묻습니다. 답변 데이터는 의사에게 전달돼 정확한 처방을 돕습니다. 또한, 문진표 작성에 대한 환자의 거부감과 원내 업무 부담을 줄이기도 합니다.

예측 기반 의료 인공지능

처음은 질병 진단입니다. Automatic Coding은 비정형 텍스트로부터 질병 코드를 예측하는 문제입니다. 2018년 Mullenbach와 동료들이 제안한 CAML 모델은 MIMIC-III의 퇴원 요약지로부터 ICD-9 코드를 예측하는 문제를 풀어냈습니다. 다음 그림이 CAML이 퇴원 요약지로부터 ICD-9 코드를 예측한 예시입니다. 위 예시는 CAML 모델이 ICD-9, 934.1 Foreign body in main bronchus를 퇴원 요약지 내에 large mucus plug on이라는 정보를 토대로 예측한 것을 보여줍니다. 의료 현장에서 별도로 질병 코드를 기입할 필요 없이 기록지만으로 질병 코드를 추출함으로써 같은 정보를 여러 가지 방법으로 수기로 작성해야 하는 번거로움을 줄일 수 있습니다. 다음은 개체명 인식입니다. 비정형 데이터인 문자열 내에서 개체명, 이를테면 사회적으로 정의된 사람, 장소, 시간, 단위 등에 해당하는 단어를 인식하여 추출 및 분류하는 기법입니다. 쉽게 말해 문서 내에 존재하는 단어를 보고 그 단어가 어떤 유형에 해당하는지를 인식하는 기술입니다. 개체명 인식은 정보 추출을 목적으로 발전하여, 현재는 자연어 처리, 정보 검색 등에 사용되고 있습니다. 예시로 철수는 2021년 7월 병원에서 근무하고 있다는 문장이 있을 때, 철수를 사람, 7월을 시간, 병원을 기관으로 인식하는 것이 그 예입니다. 논문 A Survey on Deep Learning for Named Entity Recognition에서는 개체명 인식을 문자열 안에서 개체 명의 위치를 알아내고, 사전 정의한 카테고리에 맞게 알맞게 분류하는 작업이라 정의하였습니다. 즉 문자열을 입력으로 받아 단어별로 해당되는 태그를 내뱉게 하는 multi-class 분류 작업으로 성격을 정의할 수 있습니다. 의료 분야에서는 생물의학용어에 해당하는 단어를 인식한 후 추출 및 분류하여, 다양한 태스크에 활용할 수 있게 해 줍니다. 예를 들어 추출된 생물의학용어들을 외부 데이터베이스에 연결하여 더 보강된 설명을 가져오는 데 사용할 수 있습니다. 위 예시의 실례 중 하나로 Zhu의 연구는 의학 용어의 표현형만으로는 의미를 판별하기 힘든 단어를 주변 맥락 클러스터를 통해 본래 의미와 가장 가까운 데이터베이스 요소로 연결하는 연구를 제안하였습니다. 또한, 문서 내의 오탈자 및 다양한 약어 표현을 하나의 정제된 표현으로 표현하는데도 개체명 인식이 사용될 수 있습니다.

생성 기반 의료 인공지능

질의응답은 정보검색 및 자연어 처리 분야의 주제 중 하나로 자연 언어로 인간이 제기하는 질문에 자동으로 응답하는 시스템을 구축하는 것을 목표로 합니다. 의료 인공지능 분야에서도 질의응답은 주목받는 토픽이며, 매년 개최되는 BioASQ 챌린지를 비롯하여 다양한 질의응답 데이터가 등장하고 있습니다. 다음 그림은 의학 질의응답 데이터셋의 예시입니다. 과거에는 규칙 기반의 질의응답 모델이 강세를 보였으나 최근 등장한 사전학습 기법에 힘입어 학습 기반의 BioBERT, ClinicalBERT 등의 모델들이 의료 질의응답 분야에서 강세를 보이고 있습니다. 실제 상용화된 예시로는 IBM 왓슨의 질의응답 시스템이 있으며, 의사의 진단을 보조하는 용도로 활용되고 있습니다. 다음은 챗봇입니다. 챗봇은 인공 지능과 자연어 처리를 사용하여 사용자가 텍스트나 그래픽, 음성을 통해 웹 서비스, 앱과 상호 작용할 수 있도록 돕습니다. 챗봇이 자연스러운 인간 언어를 이해하고 인간의 대화를 시뮬레이션하며, 간단한 자동화 작업을 실행합니다. 메시징 앱이나 모바일 앱, 웹 사이트, 전화선, 음성 지원 앱과 같은 다양한 채널에서 챗봇이 사용될 수 있습니다. 예를 들어 컴퓨터에서 제품을 조사하면 화면에 도움이 필요한지 묻는 창이 나타납니다. 아니면 콘서트에 가는 길게 스마트폰을 사용하여 채팅을 통해 차량을 요청합니다. 또는 음성 명령을 사용하여 이웃 카페에서 커피를 주문하고, 주문이 언제 준비되고 비용이 얼마인지 알려주는 응답을 받습니다. 앞서 언급한 상황들은 모두 챗봇과 마주칠 수 있는 시나리오의 예시입니다. 의료 현장에서도 챗봇은 다양하게 활용될 수 있습니다. 목표 지향적인 챗봇은 의료 입력 대신 병원에 방문한 환자들의 간단한 응대 및 안내를 대신할 수 있습니다. 오픈 도메인 챗봇은 조금 더 자유롭게 의료 인력과 소통하며 진단을 돕는 일을 포함하여 포괄적인 병원 업무를 자동화할 수 있도록 해줍니다. 빅스비, 시리 등 우리에게 익숙한 스마트폰 속 챗봇을 더해 병원 업무를 자동화해주는 많은 기계들이 챗봇의 범주에 속합니다. 또한 구글과 네이버에서 출범한 ARS 인공지능인 전환 챗봇 등이 병원 업무들에 투입될 수 있습니다. 다음은 기록지 생성입니다. 의료 인공지능의 또 다른 활용 분야는 방사선 이미지로부터 임상 기록지를 생성하는 것입니다. 2018년 Jing은 방사선 이미지를 입력으로 받아, 이 이미지를 가장 잘 설명하는 임상 기록지를 생성하는 연구를 발표하였습니다. 방사선 이미지와 실제 임상 기록지, 그리고 자동으로 생성된 임상 기록지입니다. 해당 기술의 목표는 단순히 방사선과 임상의의 진단 과정을 대체하는 것이 아니라 해석 가능한 과정을 통해 방사선 임상의의 진단을 보조하는 것에 있습니다.

댓글