С.А. Голованов д.м.н., заведующий лабораторией биохимических исследований НИИ урологии и интервенционной радиологии им. Н.А. Лопаткина – филиал ФГБУ «НМИЦ радиологии» Минздрава России, г. Москва |
В ходе VI научно-практической конференции «Мочекаменная болезнь – 2019: гордиться прошлым, стремиться в будущее» Сергей Алексеевич Голованов, д.м.н., заведующий лабораторией биохимических исследований НИИ урологии и интервенционной радиологии им. Н.А. Лопаткина – филиал ФГБУ «НМИЦ радиологии» Минздрава России, рассказал о применении новейших технологий анализа данных в диагностике и метафилактике мочекаменной болезни.
Роль состава камня
Для мочекаменной болезни характерен высокий риск рецидивирования – в течение пяти лет после избавления от камней рецидивы наблюдаются у 40% мужчин и 25% женщин [1]. Анализ состава мочевых камней in vivo дает возможность раннего начала проведения противорецидивного лечения (метафилактики) МКБ после удаления конкремента, а также коррекции тактики консервативного лечения при мониторинге пациентов с МКБ. Помимо этого, анализ обеспечивает возможность выбора режима выполнения дистанционной ударно-волновой литотрипсии (ДУВЛТ). В частности, фрагментация уратных (мочекислых) камней происходит при малой мощности ударной волны, а оксалатных, фосфатных и особенно брушитных – при более высокой.
Факторы образования камней
Факторы риска развития МКБ можно разделить на несколько категорий:
- анатомические (губчатая почка, подковообразная почка);
- алиментарные (низкое потребление жидкости, кальция, калия и фитатов, высокое потребление оксалатов, натрия, сахаров и витамина С);
- мочевые (гиперкальциурия, гипероксалатурия, гипоцитратурия, гиперурикурия, рН > 7,0 или < 6,0;
- патологические состояния (гиперпаратиреоз, подагра, хроническая диарея, ожирение, диабет, метаболический синдром, дистония правой коронарной артерии, колиты, энтериты, синдром короткой кишки и т. д.).
В целом же, литогенный потенциал мочи – результат сложного взаимодействия влияния друг на друга как метаболических, так и физико-химических факторов, таких как, кислотность мочи.
Химический состав мочи и состав камня
Если возникают количественные и качественные сдвиги в химическом составе мочи, это может привести к типовым изменениям, задающим литогенез в определенном направлении. Таким образом, по биохимическому анализу мочи можно судить о направленности литогенеза, активности камнеобразования и степени риска образования камня конкретного химического (минерального) состава. Возможно также получить сведения о составе камня, формирующегося in vivo и пока находящегося в мочевых путях пациента.
С 1990-х гг. практикуется определение типов мочевых камней по метаболическим параметрам мочи. Таким способом состав оксалатных камней точно определялся в 61% случаев, мочекислых – в 69%, фосфатных – в 56% и смешанных – в 71% [2,3].
В последнее время также проводится определение типа по параметрам физической плотности мочевого камня (шкале Хаунсфилда) методом двухэнергетической компьютерной томографии (ДЭКТ) с высокой чувствительностью и специфичностью дифференциации мочекислых / немочекислых, оксалатных / неоксалатных и оксалатных / мочекислых камней [4,5,6]. Повышение точности распознавания других химических типов камней по-прежнему требует дальнейшего совершенствования существующих или разработки новых методов и подходов.
Data mining в урологии
С недавнего времени также активно применяются технологии Data mining – междисциплинарного раздела информатики, использующего различные методы анализа данных. Это средство извлечения из заданного набора данных «скрытых знаний» – новых и ранее неизвестных (то есть таких, которые не подтверждают какие-либо ранее полученные сведения), нетривиальных (таких, которые нельзя выявить при вычислении простых статистических характеристик), практически полезных (представляющих ценность для исследования и принятия решений в различных сферах человеческой деятельности, в том числе и в медицине) и доступных для интерпретации (таких, которые легко представить с наглядной для пользователя форме и объяснить в терминах предметной области определенной деятельности, например медицинской науки).
Data mining представляет собой слияние нескольких дисциплин, среди которых математическая статистика, распознавание образов, искусственный интеллект, математическое моделирование, машинное обучение, базы данных, наука управления и информационные системы.
Интеллектуальный анализ данных включает в себя методы классификации, моделирования и прогнозирования. При этом задачи классификации – наиболее распространенные в медицинской практике. Например, распознавание образов находит применение в диагностике, а прогностическая аналитика – в прогнозировании состояния пациента и результата лечения.
Применяемые методы классификации предсказывают или классифицируют будущие наблюдения на основе набора решающих правил. Некоторые алгоритмы классификации позволяют распределять наблюдения набора данных на большое число классов. Они могут оказаться полезны, когда имеется множество объектов, заранее разделенных некоторым образом на классы (исходный набор данных), или же нужно выбрать алгоритм, способный точно классифицировать новый произвольный объект.
Прогностическое моделирование имеет своей целью не только описать объект, но и спрогнозировать его состояние. Основой прогностической аналитики является математическое моделирование: создание модели как набора правил, формул или уравнений, извлеченных из исходных данных и позволяющих генерировать предсказания на этой основе. Наиболее распространенный метод прогностического моделирования – метод классификации. Он реализован во многих компьютерных системах клинического прогнозирования для оценки вероятности и риска возникновения каких-либо событий. Модели классификации используют значения одного или нескольких входных полей (независимых переменных или предикторов), чтобы предсказать значения одного или нескольких выходных целевых полей или полей назначения – зависимых переменных, спрогнозированных моделью на основе анализа входных предикторов).
Собственный опыт применения Data mining – 708 пациентов
В НИИ урологии было проведено исследование прогностических возможностей применения Data mining для наиболее полной оценки состояния метаболизма у пациентов с МКБ, выявления значимых в литогенезе факторов и скрытых их взаимосвязей, а в итоге – разработки метода прогнозирования формирования мочевых того или иного метаболического типа.
Анализировались данные 708 больных МКБ – 305 мужчин и 403 женщины. Предикторами прогноза выступали кальций, мочевая кислота, фосфаты и магний крови и суточной мочи, а также их величины экскреции и значения концентрации, ммоль/сут., удельный вес, pH и суточный объем мочи, индекс массы тела и пол пациентов. В выводных, целевых данных прогноза указывались типы мочевых камней: оксалатные, уратные, фосфатные из карбонатапатита, камни из струвита, камни из урата аммония, а такое смешанные двухи трехкомпонентные камни, где доля любого компонента составляла менее 50% состава. Классификация их типов была выполнена моделью после обучения ее распознаванию типов камней на основном наборе данных.
Всего было изучено 11 алгоритмов:
- C&RT (Classification and Regression Tree);
- С 5 (Rule Quest);
- CHAID (Chi-squared Automatic Interaction Detection);
- kNN (k Nearest Neighbours);
- байесовская сеть;
- QUEST (Quick, Unbiased, Efficient Statistical Tree);
- SVM (Support Vector Machine);
- логистическая регрессия;
- дискриминантный анализ;
- нейронные сети;
- случайные деревья.
Точность прогноза и процент ошибок
Самой большой точностью прогноза по сравнению с остальными алгоритмами обладал C 5.0. Он используется для решения задач классификации данных, генерирует дерево решений или набор решающих правил. Из анализируемого набора данных модель формирует две рандомизированные выборки. Обучающая выборка используется для построения и обучения модели классификации анализируемых данных. Проверочная выборка применяется для оценки прогностической точности построенной модели. Высокая точность модели достигается с использованием режима бустинга, при котором последовательно строится несколько моделей (до десяти). Каждая последующая из них выстраивается с учетом ошибок классификации данных предыдущей моделью.
Матрица совпадения предсказаний, сделанных моделью С 5.0, с фактическим распределением типов камней показала точность прогноза в 99,72%. Из 708 случаев модель ошиблась только дважды.
В дальнейшем было проведено дополнительное тестирование модели С 5.0. Оно основывалось на формировании пользовательской рандомизированной тестирующей выборки (n = 53), включающей по десять случаев с основными типами мочевых камней (оксалатного, мочекислого, фосфатного, струвитного и смешанного состава), а также три случая камней из аммония урата. Также была создана обучающая выборка для модели С 5 – оставшиеся 655 из 708 случаев. По результатам точность прогноза при выявлении и классификации типов камеры составляла не менее 80%. При этом отмечалась низкая диагностическая чувствительность для струвитных камней и камней смешанного типа, что объяснялось весьма малой весовой долей этих типов в обучающей выборке – 2,14 и 7,02% соответственно. Кроме того, среднее содержание оксалатов и карбонатапатита в смешанных по составу камнях приближалось к 50% – 43,3 и 41,7% соответственно, что затрудняло классификацию камней этого типа для модели С 5.0.
Модель прогнозирования состава камня
Таким образом, модель машинного обучения, построенная на алгоритме С 5.0, обладает высокой точностью прогнозирования химического типа мочевого камня: точность предикции достигает 98,72%. Предлагаемая модель может использоваться в клинике для надежного диагностического прогнозирования минерального состава мочевых камней наиболее распространенных метаболических типов. Пополнение основного набора данных и введение дополнительных критериев позволят повысить прогностические качество этой модели: устойчивость, эффективность и надежность.
Предложенная прогностическая модель может быть использована для оценки химического состава мочевого камня перед выполнением ДУВЛТ, а также для раннего назначения целенаправленной противорецидивной терапии пациентам с учетом выявленных у них направлений литогенеза.
Источники:
- Uribarri J. et al., 1986
- Поповкин Н. Н. и соавт., 1994
- Moreira D. M. et al., 2013
- Руденко В. И. и соавт., 2017
- Ilyas M. et al., 2018
- Zheng X. et al., 2016
Материал подготовила Ю.Г. Болдырева
Доклад можно посмотреть на Uro.TV