Перейти к:
Сегментация почечных структур по изображениям контрастной компьютерной томографии с помощью сверточной нейронной сети
https://doi.org/10.47093/2218-7332.2023.14.1.39-49
Аннотация
Цель. Разработать нейронную сеть для построения 3D-моделей образований почек и прилежащих структур.
Материалы и методы. Использованы DICOM данные 41 пациента с образованием почек. Данные включали все фазы мультиспиральной компьютерной томографии с контрастированием. Для обучения отобрано 32 наблюдения, для валидации – 9 наблюдений. На этапе разметки брались артериальная, венозная и экскреторная фазы, проводилась аффинная регистрация для совместного совпадения расположения почек и удаление шумов с помощью медианного фильтра и фильтра нелокальных средних. Затем были размечены маски артерий, вен, мочеточников, паренхимы почки и образований паренхимы. Моделью являлась архитектура SegResNet. Для оценки качества сегментации сравнивалась метрика Дайса с моделями AHNet, DynUNet и с тремя вариантами модели nnU-Net (lowres, fullres, cascade).
Результаты. На валидационной выборке значение метрики Дайса архитектуры SegResNet составило: для нормальной паренхимы почки – 0,89, образований почки – 0,58, артерий – 0,86, вен – 0,80, мочеточников – 0,80. Получены средние значения метрики Дайса для SegResNet, AHNet и DynUNet – 0,79; 0,67 и 0,75 соответственно. При сравнении с моделью nnU-Net метрика Дайса была больше для паренхимы почки у SegResNet – 0,89 по сравнению с тремя вариантами модели: lowres – 0,69, fullres – 0,70, cascade – 0,69. При этом для образований паренхимы почки метрика
Дайса была сопоставимой: для SegResNet – 0,58, для nnU-Net fullres – 0,59; lowres и cascade имели меньшие значения метрики Дайса – 0,37 и 0,45 соответственно.
Заключение. Полученная нейронная сеть SegResNet хорошо находит сосуды и паренхиму. Образования почек определяются труднее, возможно, из-за малых размеров и наличия ложных срабатываний сети. Планируется увеличение размера выборки до 300 наблюдений и использование операций постобработки для улучшения модели.
Ключевые слова
Список сокращений:
DICOM - Digital Imaging and Communications in Medicine, медицинский отраслевой стандарт создания, хранения, передачи и визуализации цифровых медицинских изображений и документов обследованных пациентов
МСКТ - мультиспиральная компьютерная томография
ИИ - искусственный интеллект
По данным статистики Всемирной организации здравоохранения рак почки по количеству заболевших в 2020 г. (431 288 случаев) занимает 14-е место среди всех злокачественных новообразований1. В России за период с 2012 по 2017 г. стандартизованные показатели заболеваемости увеличились на 13,8% у мужчин (с 12,3 до 14 на 100 тыс. населения, мировой стандарт) и на 16,4% у женщин (6,7 и 7,8 на 100 тыс. населения). В 2017 г. в России было зарегистрировано 24,8 тыс. новых случаев рака почки (3% среди всех злокачественных новообразований, 7-е ранговое место) [1].
Для обнаружения хирургических заболеваний почек предложено множество различных алгоритмов глубокого машинного обучения. Так, в работе J. Verma и соавт. с целью верификации конкрементов почки на основании ультразвуковой визуализации были применены алгоритмы ближайших соседей и машины опорных векторов [2]. В другом исследовании S. Sudharson и соавт. [3] применили предобученные модели архитектур ResNet-101, ShuffleNet и MobileNetv2 для извлечения первичных признаков и в качестве классификатора использовали машину опорных векторов для обнаружения кист, опухоли и конкрементов на основе анализа ультразвуковой картины, при этом точность в работе составила 96,54%. Большую популярность для оценки качества работы алгоритмов в определении опухоли по данным DICOM изображений (Digital Imaging and Communications in Medicine, медицинский отраслевой стандарт создания, хранения, передачи и визуализации цифровых медицинских изображений и документов обследованных пациентов) мультиспиральной компьютерной томографии (МСКТ) приобрело соревнование KiTS21, основанное на наборе из 300 нативных снимков МСКТ с разным шагом срезов1 2.
Для автоматической сегментации лучевых методов визуализации в мире наибольшее число исследований выполняется посредством архитектуры UNet [4]. Так, в работе A. Golts и соавт. [5] использован каскад 3D UNet архитектуры для уточнения маски. В исследовании Z. Zhao и соавт. [6] применялся двухэтапный протокол 3D UNet для верификации почек. Первично на изображении МСКТ выделялись почки, а вторым этапом выполнялась сегментация зоны интереса - опухоли почки. С целью уменьшения требований к вычислительным мощностям некоторые исследователи используют только двумерные срезы. Например, L. Batista da Cruz и соавт. [7] для обучения использовали один срез с двумя соседними (предыдущий, центральный и следующий срез) для расширения контекста изображения. На выходе получали маску для центрального среза. Также используют гибридные архитектуры, совмещая классические сверточные сети с рекуррентными сетями. Рекуррентные сети могут хранить признаки с предыдущего шага и таким образом запоминать контекст. Например, M.Z. Alom и соавт. [8] разработали гибридную архитектуру, состоящую из UNet и RNN сетей, которая аккумулировала признаки от среза к срезу и создавала маску для трехмерного изображения. A.A. Novikov и соавт. [9] модернизировали UNet с помощью двухсторонних сверточных LSTM слоев внутри UNet архитектуры.
Для ускорения обучения в несколько раз используют подход обучения с переносом (transfer learning). Данный подход при обучении берет за основу заранее предобученную архитектуру на похожей задаче. Например, могут взять предобученную архитектуру на сегментацию на обычных фотографиях или на сегментации для выделения другого органа [6].
С развитием искусственного интеллекта (ИИ) исследователи стали больше заботиться о защите данных с юридической точки зрения. Опубликованные наборы данных в интернете защищены от коммерческого применения и используются исключительно в исследовательских целях для сравнения алгоритмов. Сегментация изображений является отдельной рыночной нишей и оказываемой услугой. В медицине это накладывает дополнительные ограничения на экспертов для разметки данных. Специалист должен обладать знаниями в лучевой диагностике, медицинской квалификацией для аннотирования анатомических структур на изображениях МСКТ. Поэтому некоторые доступные датасеты могут носить исключительно исследовательский характер для сравнения качества работы алгоритмов. Так, BRaTS 21 датасет [10, препринт] имеет 2000 аннотированных наблюдений с опухолью мозга. В последнее время наблюдается тенденция к публикации данных с открытой лицензией, что позволяет использовать в клиниках вспомогательный инструмент в виде ИИ [11]. Однако доступные наборы данных могут быть недостаточны для удовлетворения запросов хирургов из-за отсутствия размеченных сосудов, лимфоузлов, что требует для каждой нозологии собирать и аннотировать данные.
В Институте урологии и репродуктивного здоровья человека Сеченовского Университета с 2010 г. на всех этапах планирования оперативного лечения пациентов с образованиями паренхимы почки, а также для интраоперационной навигации используется 3D-моделирование патологического процесса, основанного на постпроцессинговой обработке данных МСКТ почек с контрастированием. Знание персонифицированной анатомии помогает не только предвидеть технические сложности, которые могут возникнуть при выполнении операции, но и многократно и многовариантно выполнить ее виртуально, тем самым определяя наиболее оптимальный доступ к интересуемой области, оптимальный вид, а также перечень и последовательность хирургических манипуляций.
В создании SD-модели патологического процесса задействована команда из трех основных специалистов: врача-уролога, врача лучевой диагностики и специалиста по программному обеспечению. Работа IT (information technology) - специалиста (специалист в области информационных систем и технологий) в SD-построении основных элементов анатомии почки на сегодня выполняется в «ручном режиме» и требует временных затрат продолжительностью до 2 часов. В настоящее время в лучевой диагностике использование автоматического режима 3D-построений широко представлено в программном обеспечении рабочих станций современных аппаратов МСКТ. Однако базовые станции компьютерных томографов не позволяют совместить более двух фаз исследования почек, что не отвечает требованиям виртуального планирования предстоящего оперативного лечения на почке. Построение 3D-моделей почек для планирования оперативного лечения выполняется IT-специалистом вручную, является трудоемким и финансово затратным.
Цель исследования: разработка автоматической системы построения 3D-моделей образований почек и прилежащих структур посредством использования ИИ.
МАТЕРИАЛЫ И МЕТОДЫ
Исследование одобрено Локальным комитетом по этике Сеченовского Университета. В исследовании использованы данные 3D-моделирований образований паренхимы почки 41 пациента при планировании хирургического лечения. DICOM данные в каждом наблюдении включали в себя все 4 фазы МСКТ с контрастированием. На этапе разметки мы брали три фазы: артериальную, венозную и экскреторную, проводили аффинную регистрацию для совместного совпадения расположения почек и удаление шумов с помощью медианного фильтра (median) и фильтра нелокальных средних (non-local means). Затем были размечены маски артерий, вен, мочеточников, паренхимы почки и образований паренхимы. На этапе обучения мы использовали 32 наблюдения и для валидации модели - 9 наблюдений.
Для обучения модели использовался фреймворк PyTorch 1.10 и библиотека MONAI 0.8.1. Моделью являлась архитектура SegResNet [12]. На рисунке 1 схематически показан порядок предобработки снимков и архитектура сети SegResNet. Эксперименты проводились на машине с двумя графическими картами RTX2080Ti 12Гб (разработчик NVIDIA, США, производитель MSI, Китай).
РИС. 1. Архитектура нейронной сети
FIG. 1. Neural network architecture
Архитектуру можно разделить на две части: кодировщик и декодировщик. В кодировщике используется 4 блока со сверточными слоями и слоями групповой нормализации (GroupNorm). В конце каждого блока происходит увеличение числа каналов и сокращение пространственного размера изображения. Таким образом, на последнем блоке мы получаем маленькое изображение, но с большим количеством каналов. Последний блок называют бутылочным горлышком (bottleneck). Идея заключается в том, чтобы на этапе обучения в изображении после бутылочного горлышка оставалась максимально полезная информация для решения задачи, в нашей работе - получение масок анатомических структур. Далее в декодировщике происходит обратный процесс. После каждого блока количество каналов сокращается вдвое, но увеличиваются пространственные размеры. Так как SegResNet относится к классу UNet архитектур, то перед каждым блоком после увеличения размеров добавляется соответствующее изображение из блока кодировщика. На рисунке этот процесс отражен стрелками. После декодировщика самый последний блок создает 5+1 маску для необходимых нам структур: артерия, вена, паренхима, образование почки, мочеточник и фон.
Предобработка данных перед подачей в нейронную сеть заключается в трех шагах: каждая фаза переводится в разрешение (0,8; 0,8; 0,8), затем интервал значений Хаунсфилда масштабируется из интервала [-1000, 1000] в интервал значений [0, 1] и три фазы объединяются в один трехфазный тензор. На этапе обучения для улучшения генерализации модели также используются следующие методы аугментации.
- Приближение (Zoom): с вероятностью 0,3 изображение масштабируется на случайное число, полученное из равномерного распределения (0,9; 1,1) с использованием кубической интерполяции. Для обучающих масок используется интерполяция ближайших соседей.
- Поворот на 90 градусов (Rotate 90): с вероятностью 0,3 изображения поворачиваются на 90 градусов.
- Зеркалирование (Flip): с вероятностью 0,3 для каждой оси независимо зеркально отражает изображение.
- Изменение контраста (Adjust Contrast): с вероятностью 0,3 масштабирует интенсивность на случайное значение из равномерного интервала (0,5; 4,5).
- Изменение гистограммы интенсивности (Histogram Shift): с вероятностью 0,3 применяет нелинейное изменение гистограммы интенсивности изображения по 10 контрольным точкам.
В качестве функции потерь мы использовали коэффициент Соренсена - Дайса, который показывает, насколько хорошо наша сеть сегментирует необходимые объекты. Эта функция применяется для сравнения сходства двух образцов. В нашем случае мы использовали ее для сравнения двух областей интереса: площади контура, отмеченного экспертом, и площади нашего прогнозируемого контура. Формула для вычисления метрики:

где An - область, предсказанная нейронной сетью; A, - область, выделенная экспертом, и Anl - пересечение этих двух областей. Значение данной метрики, равное единице, является наилучшим результатом.
Для оптимизации модели был использован алгоритм Novograd [13, препринт], который сочетает в себе три идеи: (1) использование послойно вторых моментов градиентов; (2) вычисление первого момента градиента с учетом нормализованных слоев по второму моменту; (3) раздельное использование сокращения весов (weight decay). При обучении формировался размер батча, равный 4, с вырезанной областью размером [96, 96, 96] вокселей из случайного выбранного расположения на снимке.
Для оценки качества сегментации мы сравнивали метрики Дайса между нашей моделью и моделями DynUNet, nnU-Net [14] и AHNet [15]. В модели nnU-Net автоматически настраиваются методы предобработки, архитектуры, постобработки для задачи сегментации. Ключевые настройки задаются в виде диапазона параметров, взаимозависимых правил. На конец 2022 г. nnU-Net превзошла результаты в 33 из 53 задач по сегментации целевых анатомических структур, а в остальных 20 показывала результаты, сравнимые с наилучшими методами. Модель nnU-Net публично доступна, и авторы позиционируют ее как метод для проведения сравнительных тестов.
Для наглядности эффективности предлагаемого метода приведены метрики для нескольких наблюдений. В качестве метрик мы включили широко известные, такие как точность, специфичность и чувствительность, а также метрики для сравнения 3D-областей: коэффициент Дайса, расстояние Хаусдорфа (измеряет наибольшее расстояние между границами истинной что продемонстрировано в таблице 2. Код для воспро- и предсказанной масок) и среднее расстояние поверх- изведения результатов доступен в открытом доступе3. ности (измеряет среднее расстояние между границами На рисунке 2 показан пример разметки эксперта истинной и предсказанной масок). и нейросети на одном срезе и 3D-построения.
РИС. 2. Разметки и 3D-построения эксперта и нейросети SegResNet:
А - исходное изображение;
В - разметка, сделанная экспертом;
С - разметка, сделанная нейронной сетью;
D - 3D-модель, сделанная по разметке эксперта;
Е - 3D-модель, сделанная по разметке нейронной сети
FIG. 2. Masks and 3D reconstructions by expert and neural network:
А - base image;
В - expert mask;
С - neural network mask;
D - 3D reconstruction made from expert mask;
Е - 3D reconstruction made from neural network mask
Примечание: красный цвет - аорта и почечные артерии; темно-голубой - нижняя полая вена и почечные вены; светло-голубой - мочеточники, коричневый - паренхима почки; желтый - образования почки.
Note: red color - aorta and renal arteries; dark blue - inferior vena cava and renal veins; light blue - ureters; brown - kidney parenchyma; yellow - kidney neoplasms.
РЕЗУЛЬТАТЫ
Оценка качества полученной модели SegResNet с AHNet и DynUNet на собственной выборке
В таблице 1 показаны результаты по каждому классу (нормальная паренхима, артерии, вены, образование почки, мочеточник) на валидационной выборке. По ним можно сделать вывод, что сосуды и паренхима отличным образом находятся с помощью нейронной сети. Образования почек определяются труднее, возможно, из-за малых размеров и наличия ложных срабатываний сети.

Наилучшее достигнутое среднее значение метрики Дайса составило 0,79 (для 5 аугментаций). Нами предпринята попытка замены GroupNorm на BatchNorm и увеличения размера батча, но это не привело к улучшению результатов. С технической точки зрения мы были ограничены объемом видеопамяти карты RTX2080Ti и не имели возможности использования Vision Transformer (ViT). Была предпринята попытка использования архитектуры DynUNet и AHNet, но полученные результаты были хуже,что продемонстрировано в таблице 2. Код для воспроизведения результатов доступен в открытом доступе3 На рисунке 2 показан пример разметки эксперта и нейросети на одном срезе и 3D-построения.

Сравнение полученной модели SegResNet и nnU-Net, обученной на датасете KiTS 21
Одной из задач исследования была сегментация почки и образований почки. Модель nnU-Net была обучена на датасете KiTS21, и в публичном доступе существуют три варианта модели: с низким разрешением (lowres), с исходным разрешением (fullres) и каскадная (cascade). Lowres обрабатывает снимки на пониженном разрешении, fullres работает на том же разрешении, что и исходные данные, а cascade использует оба предыдущих варианта последовательно для уточнения результатов. Мы сравнили результаты нашей модели SegResNet и nnU-Net (табл. 3). По причине отсутствия в датасете KiTS21 артериальной, венозной и выделительной фаз сравнение проводилось для модели nnU-Net только на артериальной фазе собственного датасета. В нашу модель SegResNet подавались на вход три фазы одновременно. Как видно по результатам таблицы, определение образований работает сравнимо с существующим методом. Для улучшения результатов необходимо увеличить размер обучаемой выборки.

Наблюдение 1
На рисунке 3 представлен пациент с хромофобным почечноклеточным раком левой почки, кистами правой и левой почек. Слева представлена 3D-модель, сделанная по разметке эксперта, справа - результат работы нашей модели, которая хорошо обнаружила рак левой почки и кисту правой почки. Получены следующие значения усредненных метрик качества по всем классам (паренхима, сосуды, киста, образования почки, мочеточник): точность - 90,28%, специфичность - 99,88%, чувствительность - 88,01%, метрика Дайса - 0,91, расстояние Хаусдорфа 25,85 мм и среднее расстояние поверхности 1,12 мм. Значения для образований отображены на рисунке 3. Полученные метрики качества по всем классам (паренхима, сосуды, образование почки, мочеточник) являются высокими, что свидетельствует о хорошем распознавании образований в данном наблюдении. Модель не обнаружила мелкую кисту левой почки и добавила лишнюю разметку паренхимы почки на аорту.
РИС. 3. Рак левой почки, кисты правой и левой почек:
A - 3Э-модель, сделанная по разметке эксперта;
B - 3Э-модель, сделанная по разметке нейронной сети
FIG. 3. Cancer of the left kidney, cysts of the right and left kidneys:
A - 3D reconstruction made from expert mask;
B - 3D reconstruction made from neural network mask
Примечание: красный цвет - аорта и почечные артерии; темно-голубой - нижняя полая вена и почечные вены; светло-голубой - мочеточники;
коричневый - паренхима почки; желтый - образование почки.
1 - рак левой почки; 2 - киста левой почки; 3 - киста правой почки; 4 - ложная паренхима почки.
Note: red color - aorta and renal arteries; dark blue - inferior vena cava and renal veins; light blue - ureters; brown - kidney parenchyma; yellow - kidney neoplasms.
1 - cancer of the left kidney; 2 - cyst of the left kidney; 3 - cyst of the right kidney; 4 - false parenchyma of the kidney.
Наблюдение 2
На рисунке 4 представлен пациент с ангиомио- липомой правой почки и кистой левой почки. Киста находится внутри левой почки, и для удобства визуализации была вырезана часть паренхимы. Усредненные метрики качества по всем классам получились следующими: точность - 49,05%, специфичность - 99,32%, чувствительность - 82,57%, коэффициент Соренсена - Дайса - 0,5439, расстояние Хаусдорфа - 117,48 мм, среднее расстояние поверхности - 31,63 мм. Для образований почки значения метрик отображены на рисунке 4. В данном наблюдении видно, что нейросеть не смогла определить большое образование правой почки и определила кисту, расположенную внутри левой почки, вне ее.
РИС. 4. Ангиомиолипома правой почки и киста левой почки:
А - 3Б-модель, сделанная по разметке эксперта;
В - 3Б-модель, сделанная по разметке нейронной сети
FIG. 4. Angiomyolipoma of the right kidney and cyst of the left kidney:
А - 3D reconstruction made from expert mask;
В - 3D reconstruction made from neural network mask
Примечание: красный цвет - аорта и почечные артерии; темно-голубой - нижняя полая вена и почечные вены; светло-голубой - мочеточники; коричневый - паренхима почки; желтый - образование почки.
1 - ангиомиолипома правой почки; 2 - киста левой почки; 3 - ложная киста почки.
Note: red color - aorta and renal arteries; dark blue - inferior vena cava and renal veins; light blue - ureters; brown - kidney parenchyma; yellow - kidney neoplasms.
1 - angiomyolipoma of the right kidney; 2 - cyst of the left kidney; 3 - false cyst of the kidney.
ОБСУЖДЕНИЕ
Используемые для компьютерного зрения в медицине данные имеют общие особенности:
- редкость больших наборов данных - в свободном доступе сложно найти размеченные наборы данных МСКТ, подходящие для обучения нейронных сетей для интересующей нозологии. Это связано с тем, что разметка требует квалификации специалиста в соответствующей области и много времени для ее выполнения; • низкое качество данных - доступные в интернете наборы данных могут страдать из-за наличия шума на снимках и разного шага между срезами;
- дисбаланс классов - при обработке медицинских изображений размеры органов, опухолей, их положение могут сильно различаться от пациента к пациенту. Данная проблема становится наиболее значимой при верификации редких и/или небольших по размеру структур;
- сложности при обучении моделей - данные МСКТ являются трехмерными, что влечет за собой необходимость использования большого объема видеопамяти и времени на проведение обучения, а также значительных вычислительных мощностей. Обычно такие мощности доступны в облачных сервисах или университетах.
Отличительной чертой нашего датасета являются DICOM-изображения МСКТ с контрастированием. Нам не удалось найти аналогичных наборов данных в открытом доступе, и представленные результаты публикуются впервые. Учет всех фаз МСКТ позволяет значительно облегчить определение венозных и артериальных сосудов, и мы наблюдаем такое же высокое значение метрики, как и в других моделях, выполненных для нативной фазы [16].
При сравнении нашей модели с nnU-Net определение образований было лучше в нашем методе. Отсюда можно сделать вывод, что публично доступные обученные модели необходимо проверять на клинических данных центра, в котором будет оказываться медицинская помощь, и обучение модели должно проводиться постоянно.
Поиск оптимальной стратегии постобработки является дальнейшей целью нашего исследования. Одна из проблем, с которой мы столкнулись, заключается в том, что модель может определять образования, расположенные вне органа. Одним из способов фильтрации ложных предсказаний является постобработка для улучшения результатов. Например, Z. Zhao и соавт. [6] в качестве постобработки удаляли изолированные области размером меньше 20 000 вокселей для почки, 200 вокселей для опухоли почки и 50 вокселей для кист. В работе использована малая часть доступных данных, всего 41 наблюдение. В дальнейшем мы планируем увеличить размер выборки до 300 наблюдений, что достаточно для тестирования автоматизированных систем диагностики на основе ИИ [17], и это позволит упростить технологию получения трехмерного продукта, сделать его финансово более доступным и, таким образом, приступить к масштабированию проекта.
ВЫВОДЫ
Собрана первая версия набора данных для определения образований паренхимы почки, на которой удалось провести обучение глубокой модели нейронной сети. В результате удалось достичь значения 0,79 метрики Дайса. В последующем планируется проводить дальнейший подбор архитектуры модели и операций постобработки для улучшения качества работы.
1 GLOBOSCAN 2020. URL: https://gco.iarc.fr/today/data/factsheets/cancers/29-Kidney-fact-sheet.pdf (дата обращения: 02.10.2022).
2 The 2021 Kidney and Kidney Tumor Segmentation Challenge. URL: https://kits21.kits-challenge.org/ (дата обращения: 05.09.2022).
3 Репозиторий Github - https://github.com/blacky-i/nephro-segmentation
Список литературы
1. Аксель Е. М. Статистика злокачественных новообразований мочевых и мужских половых органов в России и странах бывшего СССР / Е. М. Аксель, В. Б. Матвеев // Онкоурология. – 2019. – 15 (2): 15–24. doi: 10.17650/1726-9776-2019-15-2-15-24
2. Verma J., Nath M., Tripathi P., et al. Analysis and identification of kidney stone using Kth nearest neighbour (KNN) and support vector machine (SVM) classification techniques. Pattern Recognit. Image Anal. 2017; 27, 574–580. doi: 10.1134/S1054661817030294
3. Sudharson S., Kokil P. An ensemble of deep neural networks for kidney ultrasound image classification. Comput Methods Programs Biomed. 2020 Dec; 197: 105709. doi: 10.1016/j.cmpb.2020.105709. Epub 2020 Aug 23. PMID: 32889406
4. Ronneberger O., Fischer P., Brox T. U-Net: convolutional networks for biomedical image segmentation. In: Navab N., Hornegger J., Wells W., Frangi A. (eds) Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015. MICCAI 2015. Lecture Notes in Computer Science. Vol 9351. Springer, Cham. doi: 10.1007/978-3-319-24574-4_28
5. Golts A., Khapun D., Shats D., et al. An ensemble of 3D U-Net based models for segmentation of kidney and masses in CT scans. In: Heller N., Isensee F., Trofimova D., Tejpaul R., Papanikolopoulos N., Weight C. (eds) Kidney and Kidney Tumor Segmentation. KiTS 2021. Lecture Notes in Computer Science. Vol. 13168. Springer, Cham. doi: 10.1007/978-3-030-98385-7_14
6. Zhao Z., Chen H., Wang L. A Coarse-to-Fine framework for the 2021 kidney and kidney tumor segmentation challenge. In: Heller N., Isensee F., Trofimova D., Tejpaul R., Papanikolopoulos N., Weight C. (eds) Kidney and Kidney Tumor Segmentation. KiTS 2021. Lecture Notes in Computer Science, vol 13168. Springer, Cham. doi: 10.1007/978-3-030-98385-7_8
7. da Cruz L.B., Araújo J. D. L., Ferreira J. L., et al. Kidney segmentation from computed tomography images using deep neural network. Comput Biol Med. 2020 Aug; 123: 103906. doi: 10.1016/j.compbiomed.2020.103906. Epub 2020 Jul 11. PMID: 32768047
8. Alom M. Z., Yakopcic C., Hasan M., et al. Recurrent residual U-Net for medical image segmentation. J Med Imaging (Bellingham). 2019 Jan; 6 (1): 014006. doi: 10.1117/1.JMI.6.1.014006. Epub 2019 Mar 27. PMID: 30944843; PMCID: PMC6435980
9. Novikov A. A., Major D., Wimmer M., et al. Deep sequential segmentation of organs in volumetric medical scans. IEEE Trans Med Imaging. 2019 May; 38 (5): 1207–1215. doi: 10.1109/TMI.2018.2881678. Epub 2018 Nov 16. PMID: 30452352
10. Baid U., Ghodasara S., Mohan S., et al. The RSNA-ASNR-MICCAI BRATS 2021 benchmark on brain tumor segmentation and radiogenomic classification // arXiv preprint arXiv:2107.02314. 2021. doi: 10.48550/arXiv.2107.02314
11. Antonelli M., Reinke A., Bakas S., et al. The medical segmentation decathlon. Nat Commun. 2022 Jul 15; 13(1): 4128. doi: 10.1038/s41467-022-30695-9. PMID: 35840566
12. Myronenko A. 3D MRI brain tumor segmentation using autoencoder regularization. In: Crimi A., Bakas S., Kuijf H., Keyvan F., Reyes M., van Walsum T. (eds) Brainlesion: Glioma, Multiple Sclerosis, Stroke and Traumatic Brain Injuries. BrainLes 2018. Lecture Notes in Computer Science. Vol. 11384. Springer, Cham. doi: 10.1007/978-3-030-11726-9_28
13. Hatamizadeh A., Tang Yu., Nathet V., et al. UNETR: Transformers for 3D medical image segmentation. Proceedings of the IEEE / CVF Winter Conference on Applications of Computer Vision. 2022. P. 574–584.
14. Isensee F., Jaeger P. F., Kohl S. A. A., et al. nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation. Nat Methods. 2021 Feb; 18 (2): 203–211. doi: 10.1038/s41592-020-01008-z. Epub 2020 Dec 7. PMID: 33288961
15. Liu S., Xu D., Zhou K., et al. 3D anisotropic hybrid network: transferring convolutional features from 2D images to 3D anisotropic volumes. In: Frangi A., Schnabel J., Davatzikos C., Alberola-López C., Fichtinger G. (eds) Medical Image Computing and Computer Assisted Intervention – MICCAI 2018. MICCAI 2018. Lecture Notes in Computer Science. Vol 11071. Springer, Cham. doi: 10.1007/978-3-030-00934-2_94
16. Cao H., Wang Yu., Chen J., et al. Swin-Unet: Unet-like pure transformer for medical image segmentation. In: Karlinsky L., Michaeli T., Nishino K. (eds) Computer Vision – ECCV 2022 Workshops. ECCV 2022. Lecture Notes in Computer Science. Vol. 13803. Springer, Cham. doi: 10.1007/978-3-031-25066-8_9
17. Павлов Н. А. Эталонные медицинские датасеты (MosMedData) для независимой внешней оценки алгоритмов на основе искусственного интеллекта в диагностике / Н. А. Павлов [и др.] // Digital Diagnostics. – 2021. – 2 (1): 49–66. doi: 10.17816/DD60635
Об авторах
И. М. ЧерненькийРоссия
Иван Михайлович Черненький, инженер-программист
Институт урологии и репродуктивных систем человека
центр нейросетевых технологий
119991
ул. Трубецкая, д. 8, стр. 2
Москва
М. М. Черненький
Россия
Михаил Михайлович Черненький, инженер-физик
Институт урологии и репродуктивного здоровья человека
центр нейросетевых технологий
119991
ул. Трубецкая, д. 8, стр. 2
Москва
Д. Н. Фиев
Россия
Дмитрий Николаевич Фиев, д-р мед. наук, врач-уролог
Институт урологии и репродуктивного здоровья человека
119991
ул. Трубецкая, д. 8, стр. 2
Москва
Е. С. Сирота
Россия
Евгений Сергеевич Сирота, д-р мед. наук, старший научный сотрудник
Институт урологии и репродуктивного здоровья человека
119991
ул. Трубецкая, д. 8, стр. 2
Москва