Комментарии участников:
Еще в начале 1990-х годов десятилетняя выживаемость при этом диагнозе в России не превышала 5-10%. Сегодня выживаемость достигает 80-85%, но вот продвинуться дальше в борьбе с недугом врачам не удается. Возможное решение этой проблемы медики видят в персонализированном подходе к лечению, а именно в выделении подгрупп пациентов, для которых применение конкретного препарата или вида терапии, будет статистически обосновано. «Они ждали от нас ответа на вопрос, почему отдельные препараты или отдельные типы терапий действуют лучше, чем другие, — говорит Сергей Кузнецов. – Возник вопрос, как результат терапии зависит от физиологических свойств пациента – состоянии его органов, крови, некоторой генетической информации».
Ученым НИУ ВШЭ предстояло разработать методику поиска пациентов (вернее их подгрупп), для которых есть значимые различия в эффективности стратегий лечения. Выбор делался между двумя видами химиотерапии – DEXA и MEDROL. Сравнивались схожие пациенты (физиологические параметры совпадают), получающие разные типы лечения. В качестве базы использовались данные 1773 пациентов в возрасте до 18 лет, больных острым лимфобластным лейкозом. В расчетах учитывался пол, возраст на момент постановки диагноза, состояние органов (печень, селезенка, центральная нервная система), иммунофенотип – характеристика клеток при помощи моноканальных антител, и т.д.
Сначала для анализа данных использовались методы машинного обучения, а именно, метод индуктивных порождений деревьев решений. Он позволяет создать визуальную модель, которая подсказывает значение искомой переменной (лист дерева), на основе нескольких переменных на входе (корни дерева). С помощью деревьев решений можно сравнительно быстро обрабатывать очень большие массивы данных. Однако у этого метода, по словам Кузнецова, есть недостаток – момент случайности в выборе разделяющихся направлений (ветвей). «Если вначале мы выбрали неправильную ветвь, то уже не можем вернуться на другую, которая правильна, — поясняет эксперт. – Но когда цена решения высока, и у нас есть возможность подождать, чтобы обработать наши данные, то мы прибегаем к глобальной оптимизации, которая может занимать время, но зато даст нам исчерпывающую картину». Поэтому на следующем этапе использовался метод анализа формальных понятий, «который позволяет эффективно перебрать все возможные варианты». Анализ формальных понятий позволяет визуализировать объектно-признаковые зависимости с помощью решеток формальных понятий – их еще называют решетками Галуа. Построить решетку можно по любому бинарному отношению или математическому описанию понятия в виде пары – объект-признак.
В результате анализа, ученым действительно удалось выявить группы пациентов, на которых лечение оказывает разный результат. Пример подтвержденной гипотезы выглядит так: MEDROL эффективнее DEXA для пациентов 6,6 лет с размером селезенки не меньше 3,5 и pre-pre или pre-B иммуно-фенотипом. Всего таких пациентов 47. Достоверность – 95%, чувствительность – 84%. При лечении всех пациентов MEDROL удалось бы спасти восемь человек.
Таким образом, была разработана процедура поиска подгрупп, в которых два вида лечения дают разный эффект. «Лучше всего удается выделять небольшие группы с большими различиями, – комментирует результат Кузнецов. – Однако в полной мере оценить качество гипотез можно будет только после проведения клинических исследований». Что касается уже разработанной процедуры, то, как замечает Сергей Кузнецов, она применима не только в гематологии и медицине, но может быть легко адаптирована для любого анализа в подгруппах.
Я вообще удивляюсь — почему истории болезней не обрабатывают компьютеризированными методами мат. статистики?! Ведь обнаружилась бы масса затейливых связей. Ну, к прммеру, вдруг всем больным рассеянным склерозом в детстве удалили аппендикс? А гипертоники пили по утрам много чая? Государство должно этим заняться.