“의료 AI 경쟁력은 데이터 라벨링이 결정…반자동으로 작업 효율 높여”

인쇄

[J인터뷰] 세브란스병원 영상의학과 김휘영 교수

4차 산업시대로 인공지능(Artificial Intelligence·AI)이 의료 현장에 빠르게 스며들고 있다. 가장 선두에 있는 분야는 각종 의료 영상을 시각화·수치화하는 영상의학이다. 미리 학습된 AI가 의료영상으로부터 병변을 구분짓는 특징을 추출·분석해 최적의 진단을 돕는다. 이때 중요한 것이 의료 라벨링이다. AI에게 명도·대조도·공간주파수·균질성·곡률·길이 등 정상 조직과 병변을 구분하는 노하우를 일일이 알려주는 작업이다. AI는 가르치는 사람의 수준만큼만 배운다. 의료 데이터 라벨링이 얼마나 섬세하게 이뤄지느냐에 따라 AI의 분석 정확도가 달라진다. 의료AI 경쟁력은 의료 데이터 라벨링에 달렸다고 강조하는 이유다. 국내 의료AI 연구개발에 매진하는 세브란스병원 영상의학과 김휘영(대한의료인공지능학회 총무이사) 교수에게 의료 라벨링의 의미와 가치에 대해 들었다. 권선미 기자 kwon.sunmi@joongang.co.kr

Q1. 국내 의료 AI 수준은 어느 정도인가.

“글로벌 탑 티어 수준이다. 국내 대표적인 AI 업체인 루닛·뷰노 등에서 개발한 프로그램은 글로벌에서도 실력을 인정받고 있다. 이들 업체에서 개발한 각종 진단 보조용 프로그램도 빠르게 상용화되고 있다. 매우 자랑스럽게 생각한다. 수준 높은 의료 인프라와 집약된 양질의 데이터, IT 기술력 등이 결합해 한국이 세계 표준을 만들고 AI 산업을 충분히 선도할 수 있다고 본다. 의료 AI의 잠재력은 매우 높다. 단순히 진단을 보조하는 것에 그치지 않는다. 더 많은 의료 빅데이터가 축적되면 최적의 치료 계획을 수립하고 예후를 예측해 대비하는 것에도 적용할 수 있다. 제한된 의료 자원을 환자에게 가장 효율적으로 적용하도록 AI가 지원하는 셈이다.” 

Q2. 의료 라벨링은 정확히 어떤 작업인가.
“방대한 의료 빅데이터에 생명을 불어넣는 일이다. 의료 AI 경쟁력을 높이는 핵심적인 작업이기도 하다. 영상의학과 의료진이 병변을 판독하는 과정을 하나하나 알려주면서 AI를 훈련시킨다. X레이·CT·MRI 등 각종 의료 영상의 명도·대조도·공간주파수·균질성·곡률·길이 등 정상 조직과 병변을 구분하는 노하우를 그리는 시각화 방식으로 입력한다. 얼마나 정교하고 정확하게 많이 의료 데이터를 라벨링 작업하느냐에 따라 AI의 수준이 달라진다.”

Q3. 의료 데이터 라벨링 작업은 왜 어려운가.

“아무래도 방대한 작업량 때문이다. 딥 러닝을 위해서는 최소한 1만 장 이상의 데이터가 필요하다. 의료 데이터 라벨링 자료는 많을 수록 좋다. 그런데 사람이 간단한 의료 이미지 영상 한 장을 스마트 펜 등으로 하나하나 그리면서 라벨링하는데 대략 8시간 정도 필요하다. 병변이 복잡하다면 더 오래 걸린다. 초반에는 관심을 가지고 AI 개발을 시도해도 결국엔 어마어마한 의료 라벨링 작업에 포기하는 경우가 많다. 

다행히 최근엔 의료 데이터를 빠르고 정확하게 라벨링하는 프로그램인 메디라벨이 국내 기업인 인그래디언트에서 개발됐다. AI가 학습하는데 필요한 의료 데이터를 반자동으로 인식해 빠르고 손쉽게 가공할 수 있다. 개인적으로 라벨링 속도는 확실히 빨라졌다고 본다. 세브란스병원도 메디라벨을 활용해 의료 영상에서의 폐암·요로결석 검출 등 관련 AI를 개발하는 프로젝트를 진행 중이다. 서울아산병원, 삼성서울병원, 서울대병원, 서울성모병원 등 AI를 연구하는 국내 주요 대학병원도 메디라벨을 활용한다.”

Q4. 어떻게 의료 데이터 라벨링 시간을 줄이나.
“메디라벨은 사용자의 작업 패턴을 분석해 그 다음 행동을 예측하는 방식으로 개발된 프로그램이다. 의료 데이터를 라벨링할 때 어느 위치에서 먼저 클릭하는지, 어떤 순서로 영역을 구분하는지, 어떤 도구를 무슨 색으로 구분하는지, 얼마나 오래 라벨링하는지 등을 분석하는 식이다. 개개인의 패턴이 축적될수록 알고리즘의 성능이 개선된다. 이를 통해 의료 데이터 가공에 투입하는 작업 시간을 줄여준다.” 

Q5. 의료 데이터를 빨리 라벨링하면 의료 AI 개발에도 긍정적일 것 같은데.
“그렇다. 의료 데이터를 전문으로 라벨링하는 프로그램인 메디라벨 덕분이다. 의료진이 데이터 가공에 투자하는 시간을 획기적으로 줄여준다. 메디라벨은 반자동 세그멘테이션 형식으로 그래픽에 서툰 의료진도 손쉽게 마킹할 수 있다. 처음엔 일일이 범위를 지정해야 하지만 어느 정도 지나면 자동으로 미세한 크기의 염증·결절도 인식한다. 또 스마트펜슬 기능을 통해 원하는 픽셀 영역을 자유롭게 선택할 수 있어 세밀한 라벨링 작업이 가능하다. 특히 3D Fill 기능으로 수 백장의 슬라이스가 있는 CT·MRI 등 영상에 이미 라벨링된 데이터 몇 장만으로 나머지 슬라이스의 데이터 라벨링을 예측해 작업시간을 줄일 수 있다. 이를 통해 의료 데이터 가공의 효율성을 극대화한다. 

의료 라벨링을 돕는 다양한 프로그램이 있지만 메디라벨만큼 편하지는 않다. 실제 얼마나 클릭하느냐를 토대로 메디라벨과 다른 라벨링 프로그램을 비교했더니 라벨링 속도가 10분의 1로 줄었다는 보고도 있다. 의료 데이터 가공이 빨라지면 국산 AI 개발도 빨라진다. 언젠가는 메디라벨이 의료 라벨링의 글로벌 표준이 될 것으로 기대한다.”

Q6. 의료 데이터 라벨링을 할 때 다른 사람과 협업하는 것도 중요할 것 같은데. 
“똑같은 엑스레이·CT·MRI 영상이라도 영상의학 전문의마다 미묘하게 소견이 다를 수 있다. 흉부·복부 등 세부 전문성, 경력 등에 따라 숙련도가 달라서다. 메디라벨은 전문의 간 긴밀한 협업을 제공해 이런 점까지 반영이 가능하다. 집단 지성을 모으는 것처럼 여러 명이 공동으로 작업이 가능하다. 이때 각종 영상 판독 숙련도가 높다면 가중치를 주거나 가공이 완료된 의료 데이터를 수정할 수 있는 권한을 주는 식으로 의료 라벨링 수준을 고도화할 수 있다.”

Q7. 메디라벨 개발에도 참여했다고 들었는데.

“반자동 시스템을 통한 의료 데이터 라벨링 표준화 작업이다. 누가 작업해도 일관성있게 라벨링할 수 있다. 메디라벨로 작업하면 데이터 라벨링 정확도가 2배 가량 높다. 안타깝게도 현재는 어느 나라도 의료 데이터 라벨링 작업에 대한 표준화가 정립되지 않은 상태다. 국내 대표 AI업체인 루닛·뷰노 등에서도 그때 상황에 맞춰 손으로 그리는 수작업으로 의료 데이터를 라벨링한다. 얼마나 라벨링이 잘 이뤄졌는지에 대한 객관적 평가가 적절히 이뤄지고 있지 않은 상태다. 각 업체에서 내부 평가로 AI의 성능만 알려준 정도다. 이런 이유로 임상에 활용하면 체감하는 정확도는 다소 떨어진다는 지적도 있다. 데이터 라벨링은 AI개발의 기초 작업이다. 라벨링 작업 표준화와 검증을 통해 의료 AI 신뢰도를 높일 수 있을 것으로 기대한다.”

Q8. 의료 AI 성장을 위한 해결 과제가 있다면.
“어떤 산업이든 성장하려면 결국엔 수익이 나야 한다. 현재 의료 시스템에서는 진단을 보조하는 의료 AI로 직접적으로 수익을 창출하기 어렵다. 의료 효율성을 높여 환자에게 도움을 주지만 이를 개발한 AI업체가 적절한 보상을 받지 못하는 점이 한계다. 수익 없이는 투자가 이뤄질 수 없고 산업이 성장하지 못한다. 사실 한국뿐만 아니라 전세계 AI업체도 비슷한 고민을 하고 있다. 디지털 트랜스포메이션(Transformation)은 거스를 수 없는 대세가 될 것이다. 의료 AI 주도권을 확보하기 위해서라도 정부의 선제적 지원이 필요하다고 본다.” 


 

< 저작권자 © 중앙일보에스 무단전재 및 재배포금지 >