대장 용종 암일까 아닐까? AI가 내시경 검사 중 바로 감별

인쇄

서울아산병원 연구팀 내시경 영상 분석 기술 개발

대장 용종이 양성인지, 악성(암)인지 판별하려면 내시경 전문의가 용종 표면과 혈관을 눈으로 관찰하는 게 우선이다. 판단이 어려우면 조직검사를 시행하는데, 100% 정확도로 용종을 구분하지 못해 불필요한 절개로 인한 출혈 등 환자 부담이 있을 수 밖에 없었다.

내시경 영상을 인공지능(AI)이 판독해 의사의 진단을 보조하면 이럴 위험이 줄어든다. 서울아산병원 연구진이 용종이 양성인지, 악성인지 등을 대장내시경 영상에서 바로 판별하는 인공지능을 개발했다고 26일 밝혔다. 서울아산병원 소화기내과 변정식·융합의학과 김남국 교수팀은 대장내시경 영상을 분석해 용종의 병리진단을 예측하는 인공지능을 개발한 뒤 실제 영상 판독을 맡긴 결과, 평균 진단정확도가 81.8%로 5년 차 내시경 전문의의 84.8%와 거의 비슷했다고 밝혔다.

연구팀은 대장용종 624개가 각각 촬영된 영상 1만2480개를 인공지능 모델에 학습시켰다. 이후 새로운 대장용종 545개가 촬영된 영상으로 두 차례의 판독 테스트(1차: 182개, 2차: 363개)를 진행해 인공지능의 유효성을 검증했다.

테스트 영상에 포함된 대장용종의 병리진단은 거치상 용종, 선종성 용종, 점막하층까지 깊게 침범한 암 등 다양했다. 첫 테스트 결과 인공지능은 전체 용종의 81.3%에서 병리진단을 정확히 분류했다. 거치상 용종은 82.1%, 선종성 용종은 84.1%의 확률로 판별했고 점막하층까지 깊게 침범한 암도 58.8%의 확률로 진단했다. 이어진 두 번째 테스트에서도 진단정확도는 82.4%로 첫 테스트와 비슷한 결과를 보였다. 두 차례의 테스트 결과를 종합할 때 인공지능의 평균 진단정확도는 81.8%로 내시경전문의(84.8%)와 큰 차이를 보이지 않았다.

내시경 시행 경험이 6개월 이하인 수련의가 인공지능을 영상판독에 활용한 경우 평균 진단정확도가 83.4%(1차 테스트 82.7%, 2차 테스트 84.2%)로 나타났다. 수련의가 단독으로 대장용종 병리진단을 추정할 때의 평균 진단정확도가 67.8%(1차 테스트 63.8%, 2차 테스트 71.8%)였던 것과 비교하면 눈에 띄게 향상됐다.

서울아산병원 소화기내과 변정식(왼쪽)·융합의학과 김남국 교수

변정식 교수는 “이번 연구는 인공지능을 대장내시경 결과분석에 활용할 수 있다는 가능성을 제시한 것”이라며 “인공지능을 대장내시경 판독에 적용해 진단정확성을 높이면, 불필요한 조직검사를 줄이고 환자에게 용종의 병리진단에 맞춘 최적치료를 제공할 수 있을 것으로 기대한다”고 말했다.

김남국 교수는 “소화기내시경분야에서 인공지능 알고리즘을 개발해 적용한 것을 시작으로, 앞으로 인공지능을 다양한 내시경분야에 확대적용하고 기술을 고도화해 임상의사를 실질적으로 도울 수 있도록 하겠다”고 밝혔다.

이번 연구 결과는 국제 학술지 ‘사이언티픽 리포트(Scientific Reports)’ 최근호에 게재됐다.
박정렬 기자 park.jungryul@joongang.co.kr

< 저작권자 © 중앙일보플러스 무단전재 및 재배포금지 >