0. 목차
- 'AI 의료 영상 진단'이란?
- 'AI 의료 영상 진단' 산업의 특징
- '의료 영상 데이터'에 대한 전처리 기술
- 'AI 의료 영상 진단'의 활용 가능성
- 'AI 의료 영상 진단'에 활용되는 신경망 모델
- 'AI 의료 영상 진단' 관련 정책
- 'AI 의료 영상 진단' 관련 기업
1. 'AI 의료 영상 진단'이란?
기술발전에 따라 '영상 진단(Imaging Diagnosis)'을 위한 기기들이 고도화되고 있다. 과거에는 'X선(X-ray)', '전산화 단층 촬영(CT: Computed Tomography)', '자기 공명 영상(MRI: Magnetic Resonance Imaging)'의 등장으로 영상 진단 서비스의 품질이 한차례 도약한 바 있다. 이러한 기기들의 등장으로 질병의 조기 발견 확률이 증가하였으며, 수술·치료 시기도 빨라진 바 있다. 최근에는 '인공지능(AI)' 기술을 기반으로 영상 진단 기기 시장이 다시 한번 패러다임의 변환을 맞이하고 있다.
최근 AI에 대한 연구 개발이 영상이나 이미지 분석에 집중되면서, 의료 분야에서도 의료 영상의 분석에 AI 기술을 빠르게 적용하고 있다. 기존의 의료 영상 분석은 의료진들의 임상적·경험적 지식이나 규칙에 따라 진단을 수행하는 방식이었다. 과거의 방식은 의료진들의 경험에 대한 의존도가 높고, 숙련되지 않은 의료진들의 경우 판독 오류가 발생할 수 있었다. 또한 영상 판독이 가능한 의료진들의 절대적인 숫자가 적다는 문제점도 존재했다. 하지만 최근 '기계학습(Machine Learning)' 기술이 AI의 주요한 방법론으로 자리 잡았다. 이에 의료 영상 데이터를 기반으로 하는 객관적이고 일관적인 '특징 학습' 및 '분석 방법'이 새로운 패러다임으로 자리 잡게 되었다.
첨단 의료기술을 활용한 의료 영상 분석은 'X선(X-ray)', '전산화 단층 촬영(CT: Computed Tomography)', '자기 공명 영상(MRI: Magnetic Resonance Imaging)', 병리 조직 영상(Pathological Tissue Imaging)' 등에서 빠르게 활용되고 있으며, 상당히 높은 성능을 보이고 있다. AI을 이용한 의료 영상 분석은 의료진의 판단을 보조하는 역할을 수행한다. 육안으로 검출이 어려운 '객체(Object)'를 다량의 데이터로 학습된 AI 모델을 이용하여 검출할 수 있다. 희귀 암 등 의료진의 임상 경험이 부족할 수밖에 없는 객체들에 대해서도 AI를 이용하는 경우, 검출 성능이 향상되어 의료 서비스 품질 향상에 기여할 수 있다.
뿐만 아니라, 객체에 대한 정량적인 수치 분석이 필요한 경우에도 AI가 크게 일조하고 있다. 의료 영상을 AI를 이용하여 분석하는 경우 '정량적인 분석'이 가능하므로, 의료 영상에 대한 정밀하고 고도화된 진단이 가능하다. 여기서 말하는 '정량적인 분석'이란 예를 들어 '종양의 정량적인 크기 진단', '뼈의 길이 측정' 등을 의미한다.
2. 'AI 의료 영상 진단' 산업의 특징
'인공지능(AI)' 기술을 활용한 영상 분석 시장은 빠르게 성장하고 있다. 게임, 인공위성, 스마트팩토리 등 다양한 산업 분야에서 획득된 영상들을 인공지능을 이용하여 분석하고 있으며, 영상 분석에 특화된 다양한 '네트워크 구조', '학습 방버', '전처리 방법'에 관한 논문들도 나오고 있다. 영상 분석을 수행함에 있어 일반적으로 알려진 '신경망(Neural Network)' 구조를 도메인에 맞게 변형하거나, 새로운 영상 전처리 방법을 적용하는 등 영상의 도메인 특성에 맞는 인공지능 기술 적용 방법의 변형이 있을 경우, 보다 높은 성능을 이끌어 낼 수 있다.
인공지능 기술이 빠르게 발전하면서, '의료 영상 진단 기기' 시장 또한 빠르게 성장하고 있다. 영상 분석에 특화된 AI 기술 개발이 가속화되면서, 그중에서도 의료 분야의 영상 분석에 특화된 인공지능 기술들도 활발히 개발되고 있다. 최근 논문 및 특허들에서도 의료 영상에 최적화된 '신경망 구조(Neural Network Structure)', '학습에 대한 방법론' 다수 등장하고 있다. 이러한 연구가 진행됨에 따라 의료 영상진단 산업의 특성들이 드러났고, 그에 대한 문제를 해결하는 것이 현시점에서의 과제로 볼 수 있다. 의료 영상진단 산업의 특성은 '비정형화된 데이터의 이용', '데이터의 크기로 인한 연산 효율화', '의료진들의 인건비', '데이터 부족'의 4가지로 요약할 수 있다.
2-1. 비정형화된 데이터의 이용
'AI 의료 영상 진단 산업'의 첫 번째 특징은 의료 데이터들이 비정형화 상태라는 점이다. 이것은 'AI 의료 영상 진단' 산업의 난제 중 하나이다. 'AI 의료 영상 진단'에 활용하기 위해서는 '신경망 모델'의 학습을 위해서는 상당히 많은 양의 데이터가 필요하다. 일반적인 산업의 경우, 대량의 데이터를 확보하는 것이 어려워 학습 데이터 구축에 많은 시간이 소요된다. 일반적으로 의료 산업은 병원 시스템에 '의료 영상 저장·전송 시스템(PACS: Picture Archiving and Communication System)'이 도입되면서, 병원 내에서 촬영한 모든 의료 영상들이 저장되어 있기 때문에, 데이터의 수 자체는 다른 산업 분야에 비해 매우 많은 편이다. 그러나 이러한 의료 데이터들 대부분은 비정형화된 상태로 저장·관리되고 있다. 비정형 데이터를 가공하는 방법의 개발이 의료 영상진단 서비스의 품질을 향상시킬 수 있는 '키 포인트(Key Point)' 중 하나로 꼽히고 있다. '신경망'의 학습에 활용될 수 있도록, 비정형 데이터를 효율적으로 가공하는 방법에 대한 연구가 필요한 실정이다.
개인 정보들이 의료 영상에 함께 저장되어 있기 때문에 개인정보를 비식별화하기 위한 작업도 필요하다. 의료 영상과 함께 저장되어 있는 병변 관련 정보들도 비정형화된 형태로 저장되어 있기 때문에, 이러한 정보들을 활용하여 의료 영상에 대한 라벨을 구축하는 데에도 많은 시간과 노력이 소요된다. '신경망(Neural Network)'의 학습에 활용될 수 있도록, 비정형 데이터를 효율적으로 가공하는 방법에 대한 연구가 가속화되고 있다.
2-2. 데이터의 크기로 인한 연산 효율화
'AI 의료 영상 진단 산업'의 두 번째 특징은 '의료 영상 데이터'의 크기이다. 흉부 X선 영상은 한 변의 크기가 2000픽셀 이상이며, 병리 조직 세포 영상은 한 변의 크기가 10만 픽셀 이상인 경우가 대부분이다. 인공지능 모델이 처리하는 일반적인 이미지들의 한 변의 크기가 1000픽셀 이하인 점을 고려하면, 의료 영상 데이터들의 크기는 상당히 큰 것으로 볼 수 있다. 영상의 크기가 커질 경우, 인공지능 모델의 연산 속도가 느려지고, 연산에 필요한 '컴퓨팅 파워(Computing Power)'가 상당히 커지게 된다. 따라서 데이터의 손실 없이 큰 크기의 데이터를 효율적으로 처리할 수 있는 인공지능 모델의 개발이 필요하다. 또한 의료 영상의 경우, 관심 객체 영역의 크기나 일반적인 개나 고양이 객체를 추출하는 경우보다 훨씬 작다. 장기에 포함된 악성 종양 등 비정형화된 관심 객체들의 크기는 매우 작으며, 작은 객체들을 정확하게 검출하는 것이 진단 성능을 향상시키는데 중요한 역할을 하고 있다. 따라서 크기가 큰 데이터를 빠르게 연산하여, 크기가 작은 관심 영역을 빠르고 정확하게 검출하기 위한 의료 영상에 특화된 알고리즘의 개발이 필요하다.
2-3. 의료진들의 인건비
'AI 의료 영상 진단 산업'의 세 번째 특징은 '라벨링'에 대한 비용이 상당하다는 점이다. 'AI 의료 영상 진단 기기'에 활용되는 의료 영상용 '신경망 모델(Neural Network Model)'의 학습을 위해서는 '라벨링(Labeling)'된 의료 영상이 필요하다. 높은 수준의 전문지식을 요구하는 의료 산업의 특성상, 데이터를 해석하고 데이터에 포함된 유의미한 객체 또는 정보에 라벨링을 할 수 있는 전문 인력의 수는 매우 한정적이다. 또한 의료 영상에 포함된 유의미한 객체들을 판단하고, 그러한 객체들의 종류·크기 등을 표시함으로써 '데이터 라벨링(Data Labeling)'을 수행할 수 있는 전문 의료진들에 대한 인건비가 상당히 크다. 따라서 '학습 데이터(Learning Data)'를 구축하는 데 상당히 많은 비용이 들어가게 된다. 이에 따라, 라벨링 된 학습 데이터를 쉽게 구축하기 위한 방안이 연구되고 있다.
2-4. 데이터 부족
'AI 의료 영상 진단 산업'의 네 번째 특징은 산업의 특성상 일부 종류의 데이터의 경우, 데이터가 극히 부족하다는 점이다. 일반적인 객체, 예컨대 간·폐·심장 등 장기를 검출하는 경우, '의료 영상 저장·전송 시스템(PACS: Picture Archiving and Communication System)'에 저장된 상당히 많은 양의 데이터를 활용할 수 있다. 그러나 희귀 암종의 경우, 발병 확률 자체가 극히 낮기 때문에 그러한 데이터들을 확보하기는 상당히 어렵다. 희귀 암종 등 데이터 확보가 어려운 객체들이 일반적으로 의료 영상에 포함되어 있는 객체들보다 건강에 치명적일 수 있으며, 이러한 객체들을 검출해 내는 것이 'AI 의료 영상 진단'의 품질 향상에 직접적으로 기여할 수 있다.
따라서 이러한 문제점을 해결하기 위해, 유사한 특징을 가지는 다른 객체들을 학습 데이터로 활용하거나, 유사한 특징을 가지는 다른 객체들을 학습 데이터로 함께 활용하거나, 유사한 특징을 가지는 다른 객체로 학습된 인공지능 모델을 이용하여 계속 학습을 수행하거나, 다양한 데이터 '어그먼테이션(Augmentation)' 방법을 이용하여 학습 데이터를 증가시키는 방법 등을 이용할 수 있다. 부족한 데이터를 보강하기 위한 연구가 이어질 것으로 전망된다.
3. 의료 영상 데이터에 대한 전처리 기술
'의료 영상 저장·전송 시스템(PACS: Picture Archiving and Communication System)' 등 다양한 의료 시스템의 도입으로 의료 데이터의 양이 폭발적으로 증가하고 있다. 의료 데이터를 활용하는 경우 의료 서비스의 '품질 개선', '비용 절감' 등 의료 시스템 전반에 걸쳐 혁신을 이끌어낼 수 있을 것으로 예측된다. 현재 의료 데이터들은 비정형화된 형태로 저장되어 있다. 인공지능을 이용한 의료 영상 분석에 활용 가능한 비정형 데이터를 변화하는 것이 의료 영상진단 산업에 적용하기 위한 핵심 요소 중 하나이다.
3-1. 의료 영상에 대한 데이터 라벨링
'AI 의료 영상 진단'을 위한 인공지능 모델의 학습을 위해서는 적어도 수만 개의 '학습 데이터(Learning Data)'에 포함된 의료 영상 각각에 대해 라벨링이 필요하다. 그러나 다른 일반적인 산업 분야와는 달리, 의료 영상에 대한 데이터 라벨링은 영상의학과 전문의 등 상당히 많은 전문 인력들의 투입을 필요로 한다. 전문 인력들을 투입하여 데이터 라벨링을 수행하는 경우, 학습 데이터 구축에 들어가는 비용이 급증할 수밖에 없다. 따라서 라벨링을 쉽고 빠르게 하도록 할 수 있는 '라벨링 툴(Labeling Tool)'에 대한 개발이 진행되고 있다.
'수도 라벨링(Pseudo-Labeling)'에 대한 연구 개발도 활성화되고 있다. '수도 라벨링'이란 학습 데이터들을 일일이 라벨링을 하지 않고, 이미 가지고 있는 라벨링 된 데이터에 기반하여 대략적인 라벨링을 생성하는 기법이다. 학습 데이터 세트에 포함된 학습 데이터들 가운데 일부 학습 데이터에 대해서만 전문 인력들이 라벨링을 수행한다. 그리고 라벨링 된 일부 학습 데이터를 이용하여 라벨링을 위한 인공지능 모델을 학습시킨 후, 해당 모델을 이용하여 나머지 학습 데이터를 라벨링 하는 방식으로 의료 영상에 대한 학습 데이터를 구축할 수 있다. 의료 영상에 대해 '비지도 학습(Unsupervised Learning)'을 이용하여 '병변(Lesion)'의 중요한 특징을 추출하도록 하고, 소수의 전문가 판독 결과를 '미세조정(Fine-Tuning)'하여 라벨링을 수행하는 방법도 있다.
3-2. 의료 영상 데이터 전처리
인공지능을 활용한 의료 영상 진단을 위한 '전처리(Preprocessing)'는 영상 데이터가 저장되어 있던 원래 형태에서 '신경망 모델(Neural Network Model)'이 효율적으로 영상을 처리할 수 있도록 변환하는 것을 의미한다. 의료 영상 데이터의 '전처리(Preprocessing)'를 위해 '해상도 조절(Resolution Adjustment)', '노이즈 제거(Noise Removal)', '복수의 영상들의 크기 정합(Size Matching of Multiple Images)' 등이 필요하다.
- 해상도 조절(Resolution Adjustment)': '의료 영상 데이터(Medical Imaging Data)'는 일반적인 풍경이나 사람 등의 이미지 데이터보다 훨씬 크기가 크다. 특히 병리 조직 세포 영상의 경우, 일반적인 풍경 이미지에 비해 10배 이상의 해상도를 가지고 있다. 따라서 모델의 연산 속도 향상을 위해서 '의료 영상 데이터'의 해상도를 낮춘 후 데이터를 처리할 필요가 있다.
- 노이즈 제거(Noise Removal): 다만 작은 객체를 포함하는 경우에는 낮은 해상도의 '의료 영상 데이터'에서는 검출 성능이 낮아질 수 있다. 그래서 '의료 영상 데이터'의 처리 목적에 따라 '노이즈 제거'만을 수행하는 경우도 있다.
- 복수의 영상들의 크기 정합(Size Matching of Multiple Images): '의료 영상 이미지(Medical Imaging Data)'를 '입력 데이터(Input Data)'로 연산하는 경우, 인공지능 모델의 속도가 느려질 수 있다. 따라서 큰 크기의 '의료 영상 이미지'를 복수개의 입력 이미지로 분할한 후 '다채널 이미지 데이터(Multi-Channel Image Data)'로서 의료 영상 이미지를 처리할 수도 있다. 각각 다른 데이터베이스에서 획득된 의료 영상의 경우, 크기가 상이할 수 있다. 이러한 경우에는 하나의 인공지능 모델에서 처리하기 위해서 크기를 정합할 필요가 있다. 복수의 의료 영상 크기 정합을 위해서, 인공지능 모델을 이용하여 관심 영역을 포함하도록 의료 영상을 '크롭핑(Cropping)'할 수도 있다. '크롭핑(Cropping)'이란 사진이나 그림을 편집할 때 원하는 크기에 맞도록 그 사이즈를 조절하는 것을 말한다.
3-3. 의료 영상 데이터 비식별처리
'의료 영상 데이터(Medical Imaging Data)'와 그에 대한 진단 결과들은 각 의료 기관의 전산 시스템 상에 저장되어 있다. 저장된 의료 영상 데이터는 인공지능 모델의 학습 시 '학습 데이터(Learning Data)'의 입력 데이터로 이용될 수 있다. 진단 결과에는 개인 정보들이 포함되어 있어, 개인정보 '비식별화(De-Identification)'가 필수적이다. 의료 영상 데이터의 제공자는 주로 '병원'이고, 그 데이터들을 제공받아 인공지능 모델을 학습시키는 주체는 '기업'이다. 따라서 병원에서 데이터를 기업에 제공하기 전해 데이터들에 대한 비식별화 처리를 할 필요가 있다. 의료 데이터의 비식별화 방법으로는 '가명 처리 기법', '총계 처리 기법', '데이터 삭제 기법', '데이터 범주화 기법', '마스킹 기법'이 사용되고 있다.
최근에는 데이터의 이동이나 공유 없이, 학습 모델만을 공유하여 인공지능 알고리즘을 개발하는 새로운 개념이 제안되고 있다. 최근 공개된 논문들은 데이터를 한곳에 모아 학습시킨 모델과 데이터를 각각의 소속기관에 보관한 상태에서 학습 모델만을 전달하면서 학습시킨 모델을 비교하였을 때, 유사한 성능을 보인다는 실험 결과를 제시하고 있다. 이런 형태의 학습 방법은 개인정보 유출·훼손이 없기 때문에 지속 가능한 데이터 기반 인공지능 개발 생태계를 확립할 수 있는 가능성을 제시한 것으로 보인다.
비식별화 방법 | 설명 |
가명 처리 기법 | 개인 식별이 가능한 데이터에 대해 직접적으로 식별할 수 없는 다른 값으로 대체하는 기법 |
총계 처리 기법 | 개인정보의 적어도 일부에 통계 값을 적용하여 특정 개인을 판단할 수 없도록 하는 기법 |
데이터 삭제 기법 | 개인정보 식별이 가능한 특정 데이터 값을 삭제하는 기법 |
데이터 범주화 기법 | 단일 식별 정보를 해당 그룹의 대푯값으로 변환·범주화 하거나 구간 값으로 변환하는 기법 |
마스킹 기법 | 개인 식별 정보의 적어도 일부를 '대체 값(공백, 노이즈 등)'으로 변환하는 기법 |
3-4. 의료 영상 데이터 확보
일반적인 의료 영상의 경우, 예를 들어 정상적인 장기를 촬영한 X-ray 영상 등은 학습 데이터로 활용할 수 있는 데이터가 충분히 확보되어 있을 수 있다. 그러나 희귀 질환 등의 경우에는 데이터가 부족하여, 인공지능 모델의 학습을 위한 학습 데이터 구축이 어려울 수 있다. 의료 데이터를 확보하는 방법에는 다음과 같은 두 가지 방법이 있다.
- '실제 이미지(Real Image)' 학습: 의료 영상 데이터는 유사한 특징을 포함하는 '실제(Real)' 이미지를 이용하여 학습 데이터로 사용할 수도 있다. 예를 들어 희귀 암종과 유사한 특징을 포함하는 일반적으로 잘 알려진 암종이 있는 경우, 일반적으로 잘 알려진 암종을 학습 데이터로 학습 데이터로 함께 활용할 수 있다.
- '비 실제 이미지(Non Real Image)' 학습: 이렇게 데이터가 부족한 경우에는 '데이터 어그먼테이션(Data Augmentation)'을 수행함으로써, '학습 데이터 세트'를 구축할 수 있다. 일반적인 이미지 '데이터 어그먼테이션(Data Augmentation)' 방법으로는 이미지의 '회전', '왜곡', '대조도 조정', '해상도 조정', '반전', '확대' 등이 있을 수 있다. 의료 영상 데이터의 경우, 전술한 바와 같은 방법으로 이미지를 처리하여 '비 실제 이미지(Non Real Image)'를 생성할 수 없다. 생성된 '비 실제 이미지(Non Real Image)'는 학습 데이터로 사용될 수 있다.
이러한 '학습 데이터(Learning Data)'로 '신경망 모델(Neural Network Model)' 학습을 시킬 경우, 상당한 성능 향상이 있을 수 있다. 예컨대 사전 학습된 데이터 확보가 쉬운 암종 검출 모델로 희귀암 객체가 포함된 이미지 데이터를 처리했을 때, 연산 결과가일정 수준 이상인 경우, 암종 검출 모델의 학습에 활용돼 암종의 희귀 암종이 유사한 특징을 공유하는 것으로 결정할 수 있다.
'생성적 적대 신경망(GAN: Generative Adversarial Network)'이란 가짜 이미지를 진짜 이미지와 최대한 비슷하게 만들어내는 신경망을 말한다. 최근 '생성적 적대 신경망(GAN: Generative Adversarial Network)'에 대한 활용 가능성에 대한 논의가 많아지면서, 의료 영상진단 산업에도 GAN을 이용하여 '데이터 어그먼테이션(Image Data Augmentation)'을 수행하는 방법에 관한 연구가 활발하게 진행되고 있다.
4. 'AI 의료 영상 진단'의 활용 가능성
의료 영상 분석을 통해 의료 영상에 대한 다양한 진단 결과를 도출해낼 수 있다. 일반적인 영상 분석과 마찬가지로, 의료 영상 분석에 있어서도 의료 영상의 '분류(Classification)', '검출(Detection)', '분할(Segmentation)' 등이 수행될 수 있다. '분할(Segmentation)'은 의료 영상을 특정한 기준에 따라, 이미지를 픽셀 단위로 구분하여 각 픽셀이 어떤 종류에 해당하는지 2개 이상의 부류로 구분하는 작업을 말한다.
의료 영상을 분석하여 '악성 종양이 포함된 의료 영상'과 '악성 종양이 포함되지 않은 의료 영상'을 분류할 수 있다. 또한 의료 영상에 포함된 '특정 객체', 예를 들어 장기·종양 등을 검출하거나, '분할(Segmentation)'을 수행할 수도 있다. 객체에 대한 '세그먼테이션'을 통해 '객체의 정량적인 크기를 연산', '크기에 따른 종양의 악성도 분류', '성장판의 발달 정도' 등을 진단 결과로 도출해낼 수 있다. 이러한 의료 영상 분석을 활용하여, 의료진들의 진단을 보조할 수 있다. 의료진 부족 문제를 해결하고, 미숙련된 의료진들의 판단을 보완할 수 있다. 따라서 의료 영상 분석에 대한 충분한 기술력이 확보되는 경우, 의료 진단 서비스 시장의 성장세를 가속화시킬 수 있을 것으로 전망된다.
4-1. 설명 가능한 인공지능(XAI)
AI 의료 영상 분석 산업에서 '설명 가능한 인공지능(XAI: eXplainable AI)'에 대한 연구 개발이 가속화되고 있다. '설명 가능한 인공지능(XAI: eXplainable AI)'란 인공지능 모델로부터 출력된 결과에 대한 판단 근거를 사람이 이해할 수 있는 방식으로 제시하는 기법이다. 최근 기술 발전에 따라, 인공지능을 이용한 의료 영상 분석의 성능이 좋아졌다. 하지만 어떤 근거로 의료 영상 분석 결과를 도출해 낸 것인지 그 이유를 논리적으로 설명할 수 없다는 점이 한계점으로 지적되어 왔다. 인공지능을 이용한 의료 영상 분석의 근거를 제시할 수 없었기 때문에, 의료용 소프트웨어에 대한 임상 검증 또한 간과되어 왔다. 충분히 검증되지 않은 인공지능 기반의 의료용 소프트웨어 프로그램이 내린 진단 오류는 환자 건강에 심각한 위험을 초래할 수 있다. 뿐만 아니라 불필요한 의료비 상승으로 이어질 수도 있다. 그래서 이러한 문제점들을 반영하여, 인공지능 기반의 의료용 소프트웨어에 대한 임상 검증을 위한 '설명 가능한 인공지능(XAI)'에 대한 연구가 활발하게 이루어지고 있다.
'설명 가능한 인공지능(XAI)'을 이용하여 의료 영상의 분석 결과가 어떤 근거로 도출된 것인지 제시할 수 있다. 의료 영상 분석 결과에 대한 해석력과 설명력을 부여함으로써, 인공지능 분석 결과에 대한 신뢰도를 향상시킬 수 있다. 또한 학습이 부족하거나, 오류가 생긴 부분을 보완할 수 있도록 모델을 재학습시킴으로써, 인공지능 모델의 정확도를 더욱 향상시킬 수 있다. '설명 가능한 인공지능(XAI)'을 통한 신뢰도와 정확도 향상을 발판으로, 향후 의료용 소프트웨어 인증과 산업에서의 사용성 확대를 이끌어낼 수 있을 것으로 전망된다.
5. 'AI 의료 영상 진단'에 활용되는 신경망 모델
'AI 의료 영상 진단 기기'에는 일반적인 이미지 객체 인식에서 뛰어난 성능을 보인 모델을 그대로 사용하거나, 이미지 분야에서 뛰어난 성능을 보이는 'CNN(Convolutional Neural Network)' 모델, 또는 이를 일부 변형한 모델을 사용하여, 의료 영상을 분석하는 방법이 가장 많이 활용되고 있다. 의료 영상을 분류하기 위해서는 ResNet, DensNet, Inception v3가, 그리고 의료 영상에 포함된 객체의 '세그먼테이션(Segmentation)'을 위해서는 U-Net이 가장 많이 활용되고 있다.
'AI 의료 영상 진단 기기'에 활용되는 '신경망 모델'에는 '교사 학습(Teacher Learning)'이 많이 활용되고 있다. '교사 학습(Teacher Learning)'은 '훈련 데이터(Training Data)'로 부터 하나의 함수를 유추해 내기 위한 '기계학습(Machine Learning)'의 한 방법이다. '교사 학습'을 위해서는 상당히 많은 양의 학습 데이터가 필요하다. 그러나 상술한 바와 같이 의료 분야의 경우, '데이터 라벨링(Data Labeling)'에 상당히 많은 비용이 들어가고, 일부 의료 데이터들의 경우에는 데이터 자체가 부족한 경우도 있다. 따라서 일반적인 '교사 학습' 방법만으로만 인공지능 모델을 학습시킬 경우, 학습 성능이 상대적으로 떨어질 수 있다. 그래서 의료 영상 분석을 위해서 '전이 학습(Transfer Learning)'의 활용이 대두되고 있다.
유사한 특징을 가지는 다른 객체에 대해 이미 학습된 인공지능 모델을 활용하여, 학습 데이터가 상대적으로 부족한 객체에 대한 학습을 수행할 수 있다. 유사한 특징들에 대한 인공지능 모델의 연산 방법이 일부 유사하다는 점을 이용하여, '학습된 모델의 가중치'를 학습 데이터가 부족한 객체에 대한 인공지능 모델의 초기 학습 가중치로 이용함으로써, 인공지능 모델의 '학습 속도' 및 '객체 검출' 성능을 향상시킬 수 있다.
6. 'AI 의료 영상 진단' 관련 정책
6-1. 미국
'미국 식품의약국(FDA: Food and Drug Administration)'은 2017년 7월에 발표한 'Digital Health Action Plan'에서 인공지능 의료기기의 소프트웨어적 특성을 반영한 '소프트웨어 사전인증 제도(Pre-Cert for Software)'라는 제도를 시범 도입한 바 있다. 사전인증 제도는 개별 제품을 평가하지 않고, 제조 업체의 '소프트웨어 설계', '실험', '실제 사용 데이터 수집(Real World Data Collection)' 능력을 평가해 적절한 자격을 갖춘 제조사를 산전 인증하는 제도다. 이 제조사들이 만든 인공지능 의료기기는 시판 절차를 간소화하는 대신 시판 후 모니터링 규제를 적용한다. 2021년 1월에는 인공지능 의료기기의 '소프트웨어 버전 업그레이드(Software Version Upgrade)'에 대해 제품 수명 주기에 기반한 규제 '프레임워크(Frame Work)'를 제시했다.
6-2. 한국
한국의 경우, 2017년 '식약처(식품의약품안전처)'가 '빅데이터 및 인공지능 기술이 적용된 의료기기 허가·심사 가이드라인', '인공지능 기반 의료기기의 임상 유효성 평가 가이드라인'을 발표했다. 이런 정책들은 미국의 사전인증 제도와 유사한 인공지능 의료기기의 선도입-후평가 제도 도입을 골자로 하고 있다.
2018년에는 인공지능 기반 의료기기 4개 품목이 국내 최초로 식약처 허가를 받았다. 2019년에 발표된 가이드라인에 따르면, 빅데이터 및 인공지능 기술이 적용된 의료기기의 성능 및 임상적 유효성 검증은 '민감도', '특이도', '양성 예측도' 등의 항목을 이용하여 확인되어야 한다고 기재하고 있다. 이에 인공지능 의료기기의 유효성 검증에 대한 중요성은 더욱 높아지고 있다.
국내 최초로 식약처 허가를 받은 인공지능 의료기기는 '뷰노(VUNO)'의 골연령 판독 소프트웨어인 '뷰노메드-본에이지(VUNO Med-BonAge)'이다. 연이어 '제이엘케이 인스펙션(JLK Inspection)'의 흉부 X-Ray 영상 판독 소프트웨어와 '루닛(Lunit)'의 뇌 MR 영상 판독 소프트웨어인 '루닛 인사이트(Lunit INSIGHT)'가 허가를 받아, 국내 인공지능 기반의 소프트웨어 기기 시장도 점차 확대될 전망이다.
7. 'AI 의료 영상 진단' 관련 기업
세계적으로 의료 분야에 대한 인공지능 기술 접목에 관한 관심이 증폭되면서 미국·유럽·한국·이스라엘 등 전 세계의 기업들이 경쟁적으로 '인공지능(AI)'을 의료 분야에 적용하기 위한 기술 개발이 활발하게 이루어지고 있다. '구글(Google)', 'IBM', '마이크로소프트(Microsoft)', '삼성전자' 뿐만 아니라, 의료 기술 기반의 기업인 'GE 헬스케어(GE Healthcare)', '필립스(Philips)', '지멘스(Siemens)', 그리고 국내외 스타트업들도 해당 시장에 활발하게 진출하고 있다. 의료 영상진단에 AI 기술을 접목하여 상용화한 사례들도 점차 증가하고 있으며, 국내외 법 제도들이 이러한 시판화를 뒷받침하고 있다. 이에 AI 기반의 의료 영상 진단의 활용은 더욱 확대될 것으로 예상된다. 'AI 의료 영상 진단' 기업 중에는 AI 기술을 기반으로 의료 영상 진단 산업에 진출한 기업들도 존재하고, 기존의 의료 사업을 바탕에서 'AI 의료 영상 진단 기기' 사업으로 확장한 업체들도 존재한다.
7-1. IBM
- 국적: 미국
IBM은 2012년부터 인공지능 기술을 의료 분야에 활용하기 위한 연구를 진행하고 있다. IBM은 '암과 관련된 60만 건의 의학적 근거', '42개의 의학 학술지와 임상시험 데이터'로부터 '200만 페이지 분량의 자료', '1500여 개의 실제 폐암 치료 사례', '2만 5000개의 치료 사례 시나리오', '의사들의 진료 기록', '검진 결과' 등 '자연어'로 되어 있는 데이터를 학습시켜, 2014년도에 암 진단 솔루션인 '왓슨 포 온콜로지(Watson for Oncology)'를 처음 공개하였다. 그 이후 IBM은 '유전체 분석', '신약 치료법 개발', '임상시험 매칭', '의료 영상 분석'까지 가능한 수준으로 발전시켰다.
그리고 2017년 2월에는 '왓슨(Watson)'을 이용한 인공지능 기반의 의료 영상 분석 도구인 '왓슨 클리니컬 이미징 리뷰(Watson for Clinical Trial Imagin Review)'를 개발하였다. '왓슨 클리니컬 이미징 리뷰(Watson for Clinical Trial Imagin Review)'는 CT·MRI 등 영상 이미지를 포함한 환자의 여러 데이터를 검토하고, 특정 질병의 정확한 진단과 치료법을 제안하는 프로그램으로, 국내외 다수의 병원에 적용된 바 있다. IBM 사의 기술력을 바탕으로 의료 분야에서도 점차 입지를 굳혀나갈 것으로 예상된다.
7-2. 엔리틱(Enlitic)
- 국적: 미국
'엔리틱(Enlitic)'은 2014년에 200만 달러 투자를 받으면서 설립된 인공지능 기업이다. '엔리틱(Enlitic)'은 'CNN(Convolutional Neural Network)'을 채택해 의료 영상 데이터에서 악성 종양의 유무와 위치 등을 체크한 대량의 의료 영상 데이터를 학습시켰다. 악성 종양의 형상 등을 나타내주는 '특징'이나 어떤 특징을 중시할 경우에 악성 종양인지 여부를 판단할 수 있는 '패턴(Pattern)'을 자동으로 찾아내는 방식이다.
2015년 10월, 호주의 의료 영상진단 서비스 기업인 '캐피탈 헬스(Capital Health)'가 '엔리틱'의 시스템을 채택하면서 엔리틱의 첫 매출이 발생하기 시작했다. 동시에 캐피탈 헬스는 엔리틱에 천만 달러 투자를 단행하며 약 5000만~1억 달러 사이의 가치를 평가받았다. 의료 영상진단 시장이 확대됨에 따라 그 가치는 더욱 증가할 것으로 전망된다.
7-3. 지브라 메디컬 비전
- 국적: 이스라엘
- 특징: FDA 허가에 따른 흉부 X선 영상 분석 상용화
'지브라 메디컬 비전(Zebra Medical Vision)'은 딥러닝을 이용한 의료 솔루션 제공을 위한 연구 개발을 진행 중인 회사이다. 2014년에 설립되었으며, '인터마운틴 인베스트먼트 펀드(Intermountain Investment Fund)', '아워크라우드(OurCrowd)', '돌비 벤처스(Dolby Ventures)' 등이 자금을 제공하였다.
'지브라 메디컬 비전(Zebra Medical Vision)'의 대표 솔루션 'AI1(All-In-1)'은 2017년 11월에 출시되었으며, '구글 클라우드(Google Cloud)'를 활용한 의료 영상 분석 서비스 사업이다. 또 2019년 5월에는 미국 FDA로부터 기흉 판별을 위한 흉부 X선 분석을 위한 시스템인 'HealthPNX'에 대한 사용 허가를 획득하여, 의료 영상분석 제품에 대한 상용화를 본격화하고 있다.
7-4. 루닛(Lunit)
- 국적: 한국
- 특징: 흉부 엑스레이 진단 기술의 글로벌 사업화
'루닛(Lunit)'은 2013년에 한국 최초로 설립된 인공지능 의료 영상 분석 솔루션 개발사이다. '루닛'은 2017년 CB인사이트가 선정한 'AI 100대 스타트업'에 한국 기업으로는 유일하게 이름을 올린 기업이다. 2020년 1월에는 국내외 7개 기관 투자자로부터 300억 원 규모의 시리즈 C 펀딩을 받은 바 있다. '루닛(Lunit)'은 '루닛 인사이트 CXR(Lunit INSIGHT CXR)', '루닛 인사이트 MMG(Lunit INSIGHT MMG)', '루닛 스코프(Lunit SCOPE)'를 개발하였다.
- 루닛 인사이트 CXR(Lunit INSIGHT CXR): '루닛 인사이트 CXR(Lunit INSIGHT CXR)'는 진단에 활용할 수 있는 '흉부 엑스레이 진단 보조 인공지능 소프트웨어이다. '루닛 인사이트'는 4대 흉부질환과 관련된 총 98621건의 흉부 X-선 영상 자료 결과를 인공지능 진단 학습에 활용되어 개발되었으며, 영상 이미지를 입력하면 정확도 98%로 질환 여부 선별 및 위치를 표시하는 것으로 발표되고 있다.
- 루닛 인사이트 MMG(Lunit INSIGHT MMG): '루닛 인사이트 MMG(Lunit INSIGHT MMG)'는 유방암 진단 보조 인공지능 소프트웨어이다. '루닛 인사이트 MMG'는 2019년 7월 29일 식품의약품안전처의 '의료기기 3등급' 허가를 받았다. '루닛 인사이트 CXR(Lunit INSIGHT CXR)'은 서울대학교 병원과 2차 종합병원, 건강검진센터 등에 도입되어 활용되고 있고, 멕시코·중국·UAE 등에서도 사업화를 진행하고 있다.
- 루닛 스코프(Lunit SCOPE): '루닛 스코프(Lunit SCOPE)'는 치료에 활용될 수 있는 항암 치료제에 대한 반응을 인공지능으로 정확하게 예측해 주는 플랫폼이다.
7-5. 삼성 메디슨
- 국적: 한국
- 특징: 초음파 영상 AI 분석 시장 개척
'삼성 메디슨(Samsung Medison)'은 1985년에 창립한 초음파 진단 기업으로, 2016년부터는 인공지능 기술을 접목시킨 초음파 진단 기기를 개발하기 시작하였다. '삼성 메디슨' 2018년 미국의 '북미영상 의학회(RSNA: Radiological Society of North America)'에서 유방 초음파 이미지에서 선택된 병변의 특성을 분석해 주는 '에스 디텍트 포 브레스트(S-Detect for Breast)' 기능, 흉부 엑스레이 영상에서 뼈에 가려진 폐 병변을 명확하게 보여주는 '본 서프레션(Bone Suppression)' 기능 등을 공개했다.
'삼성 메디슨'은 2020년 '인텔(Intel)'과 공동 개발한 헬스케어 인공지능 솔루션인 '바이오메트리 어시스트(Biometry Assist)' 및 '레이버 어시스트(Labor Assist)'를 공개했다. 이는 초음파 데이터를 기반으로 태아의 상태를 신속하게 파악할 수 있도록 하는 것으로 솔루션의 정확도가 97%에 달하며, 2021년에 미국 FDA로부터 의료기기 클래스 2등급을 받았다. 삼성메디슨은 초음파를 기반으로 유수의 글로벌 대기업들과 협력하여 연구 개발을 꾸준히 진행 중이다.
7-6. 뷰노(VUNO)
- 국적: 한국
'뷰노(VUNO)'는 삼성종합기술원 출신 연구원들이 2014년에 설립한 기업으로, 의료용 AI 기반 진단 및 예측 소프트웨어 개발 사업을 주 사업으로 영위하고 있다. 주요 제품은 의료 AI 솔루션 'VUNO Med Series'로, VUNO Med는 질병 프로세스 개선, 정량화, 진단 보조, 예후·예측 등에 활용되고 있으며, 분석 시간을 단축하고 오진율을 낮추는 데 효과적이다. 자체 딥러닝 엔진인 'VUNO Net'을 적용하였으며, 학습·추론 소요 시간을 최소화 및 경량 모델로 하드웨어 내장이 가능한 장점이 있다. 뷰노에서 개발한' 뷰노메드 본에이지(VUNO Med-BoneAge)'는 2018년 5월에 국내 최초로 식품의약품안전처로부터 국내 시판허가를 받았으며, '인공지능 헬스케어(AI Healthcare)' 분야에서 국내 기술 최초로 '유럽통합규격 인증(CE)'도 획득했다. 또한 '뷰노(VUNO)'는 AI 기반 디지털 병리 분석 솔루션인 'VUNO Med®-PathQuant™'에 대해 2021년 6월 식품의약품안전처 인증을 획득하고 사업영역을 확대 중이다.
또한 '국내외의 유통망 강화', '의료기기 기업과의 협력', '각국 현지 업체와의 총판 계약'을 통한 유통망 확대가 이루어지고 있다. 2021년 1월에는 대만 최대 의료 종합기업인 'CHC Healthcare Group'과 의료 AI 솔루션 4종 총판 계약을 체결하였고, 2021년 2월에는 '디지털 헬스케어 솔루션(Digital Healthcare Solution)' 업체인 '유비케어(UBcare)'와 'VUNO Med®-BoneAge 국내 독점 판매 공급 계약을 체결하였다. 또 2021년 6월에는 삼성전자와 이동형 디지털 엑스라이 촬영 장비 GM85에 탑재할 VUNO Med®-Chest X-ray™ 공급 계약을 체결하였다.
7-7. 제이엘케이
- 국적: 한국
'제이엘케이(JLK)'는 2014년에 산업용·의료용 AI 기반 판독·진단 시스템 개발을 목표로 설립되었다. 2016년, 한국인 뇌 MR 영상 데이터 센터의 데이터 전용 실시권 사용 계약을 통해, 'AI 기반의 데이터 플랫폼' 사업 등으로 사업영역을 확대하고 있다. 대한민국 식품의약품안전처가 주관한 '차세대 의료기기 100 프로젝트'는 2016년부터 2020년까지 5년간 대한민국의 전도유망한 차세대 의료기기 100개 제품을 선정하고, 그 제품의 개발 단계부터 수출까지를 꼼꼼하게 파악하여 맞춤형으로 지원해 주는 프로그램이다. '제이엘케이인스펙션'은 '차세대 의료기기 100 프로젝트 대상 기업 선정'을 시작으로 시장을 선도하는 솔루션을 잇따라 출시했다. 2019년 12월에는 4차 산업 특례 상장 1호로 코스닥 시장에 신규 상장되었다.
'제이엘케이(JLK)'에서 2019년에 출시한 AI 기반 의료 영상 진단 플랫폼 'MEDIHUB'는 '총 8가지 모달리티(MRI, CT, X-ray, 맘모그래피, 초음파, 내시경, 병리 영상, 안저 영상)' 의료 영상을 이용하여 14곳의 신체 부위에 적용할 수 있는 27가지 진단 솔루션이다. 이 중 전립선암 토탈솔루션 중 'JDP-01K'는 디지털 병리학에 해당하는 소프트웨어 프로그램으로, 전립선암의 분석·진단·예후까지 정보제공 가능한 토탈솔루션이다. 즉, JPD-01K는 H&E 염색 기법을 조직 검사를 시행한 병리 영상으로부터 전립선암을 더욱 정밀하게 진단하는 전립선함 AI 진단 플랫폼이다. 인공신경망 모델을 사용하여 암을 발견하고, 암의 심각도를 나타내는 Gleanson Score를 제시해 준다. Gleason Score 별로 각 병변을 분할해 주고, 색상을 입혀주는 '시맨틱 분할(Semantic Segmentation)'로 사람이 하기 어려운 각 영역의 비율 계산을 더 빠르고 정확하게 해준다.
7-8. 인피니트 헬스케어
- 국적: 한국
'인피니트헬스케어(INFINITT Healthcare)'는 1997년 의료기기 전문 기업 '메디슨(Medison)'의 자회사인 '메디페이스(Mediface)'로 설립되었다. 1998년 '의료 영상 저장·전송 시스템(PACS: Picture Archiving and Communication System)' 제품을 상용화하고, 2002년 '메디슨(Medison)'에서 독립하여 법인을 설립했다.
'인피니트헬스케어' 및 종속회사는 '의료 영상 저장·전송 시스템(PACS: Picture Archiving and Communication System)' 및 '3차원 의료 영상 소프트웨어'를 개발하여 병원에 판매 및 서비스 제공하는 것을 주요 사업으로 영위하고 있다. PACS를 통해서 기존의 필름을 대신하여 컴퓨터 파일로 저장하므로 보관·관리가 용이하고, 이전 환자의 영상을 자유롭게 조회하여 판독에 활용할 수 있다. 나아가 하나의 영상을 수십 명의 의사가 원격으로 공유하면서 회의를 할 수 있어, 의학 교육의 발전에도 기여했다. '서울대 병원', '삼성서울병원'을 비롯한 대형 의료기관에서 '인피니트 헬스케어'의 PACS로 환자 정보를 분석하고 있으며, PACS 및 3차원 의료 영상 소프트웨어 토탈솔루션 기반으로 한국 PACS 시장에서 2021년 기준, 75%의 독점적인 점유율을 확보하였다.