Архив за год 2018

Большие данные и доказательная медицина

В подавляющем большинстве клинических исследований, публикуемых в высокоцитируемых реферируемых журналах, отмечается крайний примитивизм. И это несмотря на чрезвычайную сложность данных реальных биомедицинских исследований – от тысяч до миллионов разнородных признаковых описаний, десятки-сотни тысяч пациентов.

Тем не менее, вместо комплексного, in-depth, интеллектуального анализа данных, публикуемые результаты исследований чрезвычайно загрублены: из всего массива закономерностей (сотни тысяч) выделяются, как правило,  1-2  (т. н. «первичная точка исследования», англ. primary outcome), которые почему-то «особо интересны» для исследователя (как правило, вследствие интересов коммерческого плана), и анализируется их статистическая значимость обычными методами математической статистики. Остальные корреляции просто игнорируются как «не имеющие интереса».

Важными научно-техническими причинами столь безответственного отношения к анализу интересных и сложных биомедицинских данных является (1) нежелание использовать методы комплексного анализа сложных разнородных данных, (2) густопсовое невежество относительно таких методов и (3) обсессивно-компульсивное использование уже имеющихся статистических эвристик, выбранных произвольно просто из соображений «удобства». В случае анализа сверхбольших данных, такого рода “подход” абсолютно неприемлем, особенно если идёт речь о т.н. «доказательной медицине».

Алгоритмы анализа «сверхбольших данных»

Математической основой для разработки новейших подходов к анализу сверхбольших данных являются:

  • топологический подход к анализу плохо-формализованных задач распознавания и классификации,
  • метрический подход к анализу разнородных признаковых описаний,
  • теория анализа размеченных графов,
  • алгебраический подход к синтезу корректных алгоритмов,
  • комбинаторная теория разрешимости,
  • теория классификации значений признаков,
  • метрическая теория корректности и полноты алгоритмов.

Фармакоинформатика

Фармакоинформационный подход к разработке перспективных препаратов, к оценке эффектов имеющихся лекарственных препаратов подразумевает использование методов интеллектуального анализа разнородных биомедицинских данных, методов молекулярной фармакологии и биоинформатики, хемоинформатики, анализ сверхбольших массивов биомедицинских публикаций, разработку эффективных методов обработки сверхбольших массивов данных, получаемых в результате исследования живых систем современными высокопроизводительными (high-throughput) методами и др. В Институте фармакоинформатики при ФИЦ ИУ РАН разрабатываются, апробируются и практически применяются методы и алгоритмы анализа «сверхбольших данных» из области биомедицины и фармакологии.