“Если человеческое равенство надо навсегда сделать невозможным, если высшие, как мы их называем, хотят сохранить своё место навеки, тогда господствующим душевным состоянием должно стать управляемое безумие”. Дж. Оруэлл, 1984.
Эта фраза известного британского писателя вызывает различные ассоциации. В России почему-то “креаклы” думают, что Дж. Оруэлл таким образом критиковал советский коммунизм и.т.п. Никому из этих “креативных” и в голову, почему-то не приходит, что Оруэлл, вообще говоря, британский писатель и, как всякий психически адекватный писатель, в отличие от британских учёных, он пишет о своей стране.
О каком “безумии” мог говорить Оруэлл? Безумная реклама из телевизора, имеющая многие признаки т.н. “нейролингвистического программирования”? Безумие телепередач где гигантскими буквами пропагандируется “АЛЧНОСТЬ”? Бытовое безумие обыкновенного фашизма, охарактеризованного гениальным М. Роммом? Скрытый экстремизм т.н. борцов с тоталитаризмом, которые явно нуждаются в помощи профессионального психиатра? Да, это вещи опасные, такие же смертельно опасные, как пляски с динозаврами в фантастических фильмах серии “Парк юрского периода”.
Нас, однако, интересуют здесь чисто психиатрические аспекты проекции смысла цитируемой выше фразы английского писателя, причем в применении к анализу больших текстовых данных. В самом деле, если некие облеченные властью персонажи хотят сеять то, что реально сертифицируется безумием врачами психиатрами, им нужно решить несколько задач, в т.ч.:
В последнем случае, т.е. в разрушении психиатрии как науки, активно принимают участие т.н. ученые-психиатры. Вместо того, что с помощью современных средств анализа сложных данных изучать психиатрические заболевания, эти “эксперты в своей области” занимаются дискредитацией всего направления психиатрии как полноценной науки.
С точки зрения исследователя, в психиатрии, зачастую, диагностика тех или иных патологий может быть неоднозначна: определения классов пациентов гораздо менее жесткие, чем, допустим, в кардиологии, где инфаркт миокарда определяется очень жестким набором критериев. Инфаркт либо был, либо нет. Соответственно, когда нечётко определены классы, любые алгоритмы машинного обучения и статистика сразу начинают давать сбои.
Поэтому, в психиатрии как проблемной области совершенно очевидно есть ряд проблем, которые должны быть решены перед тем, как использовать современные биологические данные для изучения психиатрических заболеваний. Всё это, однако, мало интересует платных пропагандистов с пониженной социальной ответственностью, которые имеют информационные ресурсы в виде возможности публикаций в журналах по психиатрии с высоким индексом цитирования. Методы топологического анализа больших данных, в применении к задаче регулярного сканирования профессиональной медицинской литературы, позволяют реально выявлять случаи таких публикаций, не имеющих ничего общего с психиатрией, а отрабатывающих деньги соответствующих грантодателей.
Например, в течение последнего года нами был “поставлен на вооружение” алгоритм, выявляющий публикации в профессиональных журналах по психиатрии, которые отличаются (1) высоким уровнем манипулятивных сентиментов (англ. spin words, weasel words), (2) сентиментов, отличающих лженаучные тексты, (3) сентиментов, характерных для пропагандистских публикаций (примеры таковых приведены здесь).
В результате, алгоритм выявил поднимающуюся волну статей, в которых, и в самом деле, психиатрия развенчивается как наука по принципу “генетика – лженаука“, “кибернетика – буржуазная наука” и проч. См., например, яркий пример в виде публикации [1] и соответствующего медийного материала. Британские ученые (буквально – университет Ливерпуля) доказали, что, оказывается:
При этом, уровни манипулятивных и пропагандистских сентиментов, с которыми описанная выше пурга излагается, в данной публикации [1] просто зашкаливают: в 10 раз выше, чем в среднестатистической публикации по психиатрии. Вот пример сразу нескольких манипулятивных конструкций всего лишь в одном предложении: общепринятое руководство “Diagnostic and Statistical Manual (DSM)”, оказывается, представляет собой “диагностическое наклеивание ярлыков” (diagnostic labelling) и является “неумной категорной системой” (disingenuous categorical system). Вообщем, ситуация в полном соответствии с известным рассказом Э.А. По и с известным голливудским фильмом 2014 года, очевидно снятым по мотивам этого рассказа….
Действительно, в психиатрии, зачастую, диагностика тех или иных патологий может быть неоднозначна: определения классов пациентов гораздо менее жесткие, чем, скажем, в кардиологии. Соответственно, когда нечётко определены классы, любые алгоритмы и статистические подходы начинают давать сбои. Однако, если (1) тщательно собирать биомедицинские данные, (2) создавать большие таблицы признаков (порядка тысяч самых разных описаний состояния пациентов, причем для многих тысяч пациентов), (3) использовать адекватные методы анализа таких сложных данных, то это будет стимулировать развитие психиатрии как науки. Топологический подход к анализу данных как раз и направлен на быстрый и продуктивный анализ таких “больших данных” [2].
Литература
1. K. Allsopp et al, Heterogeneity in psychiatric diagnostic classification, Psychiatry Research (2019). DOI: 10.1016/j.psychres.2019.07.005
2. Torshin I.Yu., Rudakov K.V. On the theoretical basis of the metric analysis of poorly formalized problems of recognition and classification. Pattern Recognition and Image Analysis (Advances in Mathematical Theory and Applications). 2015; 25 (4): 577–587. DOI: 10.1134/S1054661815040252
Политология и психиатрия, будучи тесно взаимосвязанными областями, являются наиболее яркими примерами из области прикладной лингвистики, где применение адекватных методов анализа больших данных насущно необходимо. Ни современные политологи, ни т.н. журналисты-исследователи не имеют ни малейшего понятия о важности (уже не говоря о конкретных технических возможностях) применения топологических и метрических методов анализа больших данных к своим областям. В результате, при чтении и научной прессы, и якобы “исследовательских” журнальных статей неизбежно возникает deja vu, характеризуемое известным “гора родила мышь” и “тупая заказуха”.
Приведем очень конкретный пример. Например, в 2006-2007 годах, когда стали появляться в публичном доступе сверхбольшие данные ресурса Викиликс (суммарно, более 10 терабайт только текстовых данных), было ожидание прямо-таки глубочайших открытий в области политики, как она “реально делается”. Газета британских учёных спецслужб под названием Гардиан держала читателей в напряжении более 2 недель, выдавая какие-то ошмётки наподобие мелкого скандала в Кении, или что думает какой-то испанский судья о т.н. русской мафии (как будто у абсолютно невинных испанцев нет своих собственных сетевых мафиозных структур) и.т.п. А потом…. Потом настала тишина, опять скандалы про английскую королевскую семью и прочая активность, направленная на маскировку полнейшего провала (comlplete failure) британскими учеными попытки строить политическую аналитику на реальных больших данных, а не на том, что “прикажут сверху”.
Таким образом, в 10 терабайтах больших данных “самым главным” оказались какие-то домыслы каких-то мутных персонажей о чём-то там, которые и были растиражированы мировыми СМИ. Помимо очевидной ангажированности этих самых СМИ, причиной феномена горы, порождающей мелкое вредное млекопитающее, является вопиющее неумение аналитически работать с большими данными. Таким образом, применение больших данных в политологии – дело завтрашнего дня…
Тем не менее, адекватное применение методов топологического и метрического анализа больших текстовых данных к большим данным из того же ресурса Викиликс позволяет делать весьма интересные выводы о политической активности стран, возомнивших себя “мировыми гегемонами” (совсем как “наполеоны” в больнице П.П. Кащенко, см. раздел Психиатрия). Например, крайне интересно отметить пиковую динамику временных рядов определенных сентиментов, которая, по сути, является комплексным предиктором событий 08.08.2008 года на южных окраинах России, событий 2011 в Ливии, событий 2014 года на юго-западной окраине России и многих, многих других. В самом деле, когда, например, пики сентиментов “манипулятивные словечки” (англ. spin words) наблюдаются в августе 2006 года, а в августе 2008-го года, как по часам, происходят всем известные военно-политические события, то такого рода “предиктивная политология” должна была бы очень интересовать настоящих политологов-исследователей и борцов с тоталитаризмом…
Оказывается, на индекс цитируемости сильно влияет…. наличие в названии статьи знака “дефис”?! Авторы исследования не формулируют в явном виде причину столь странного поведения систем цитирования, но их результаты позволяют предположить наличие ряда дефектов в соответствующих алгоритмах поиска текстовых строк. См. полный текст статьи.
Анализ контр-примеров (в т.ч. посредством метода т.н. adversarial attacks) указывает на дефекты часто используемых алгоритмов для обработки медицинских изображений, которые позволяют осуществлять подлог данных (англ. “fraudulent practices”), направленный на увеличение доходов соответствующих лиц.
Методы интеллектуального анализа больших данных могут быть использованы для установления новых геологических закономерностей. Применение методов машинного обучения важно для извлечения информации из больших данных, собираемых в рамках наук о Земле (геологическое картирование с использованием данных дистанционного зондирования, моделирование подземного переноса и классификация частиц вулканического пепла для определения механизма вулканического извержения, классификация сейсмических событий, обнаружение эффективных ранних предикторов землетрясений и др.).
Открыт доступ к данным эксперимента ATLAS в ЦЕРН! Данные эксперимента ATLAS (100 трлн. столкновений протонов) теперь общедоступны. Это первый в мире открытый выпуск данных с энергией 8 ТэВ, собранных с Большого адронного коллайдера.
Наконец-то! Западные учёные (800 подписей) призывают прекратить диктат произвольно определяемой “статистической значимости”.
Как методы анализа больших данных позволяют выявлять лиц, занимающихся недобросовестной конкуренцией
Человек нуждается в ежедневном потреблении тридцати трёх витаминов и микроэлементов. К сожалению, технология выращивания растений и животных в промышленных масштабах направлена на достижение максимальных объемов продукции в кратчайшие сроки. В результате, витамины в современных продуктах питаниях не успевают накопиться. Разговоры о том, что «раньше жили лучше без всяких витаминов» основаны на полном незнании статистики длительности жизни, материнской и младенческой смертности в прошлом, особенно в средневековье.
Дефициты витаминов и микроэлементов существуют в самых разных странах: и в «бедных», и в «богатых», где выбор продуктов весьма широк. Потребление необходимого числа калорий не означает потребления необходимого количества микронутриентов. В результате развиваются полигиповитаминозы (т.е. дефициты сразу нескольких микронутриентов). Это серьёзно влияет на здоровье человека, провоцируя развитие т.н. «болезней цивилизации»: инфаркта, инсульта, опухолей, ожирения, диабета.
Например, крупномасштабное исследование женщин репродуктивного возраста показало, что суточное потребление витаминов часто не достигает нормы. Ситуация и в России, и в западной Европе приблизительно одинакова: одновременно всеми жизненно необходимыми микронутриентами обеспечено менее 10% населения! Во многом, столь печальная ситуация поддерживается пропагандистами, чревовещающими, что, мол “витаминов достаточно в пище”.
Метрический анализ данных исследования показал, что если эти сочетанные дефициты витаминов и микроэлементов продолжаются годами, то многократно возрастает риск коморбидных патологий: атеросклероза, тромбоза, артериальной гипертонии, инфаркта, инсульта, накопления токсических металлов, опухолей, ожирения и диабета. Всё это приводит к ускоренному старению и к сокращению длительности жизни.
Результаты приведенного выше исследования, равно как и результаты десятков тысяч других исследований, указывают на существование дефицитов витаминов и связанные с этим риски для здоровья. Тысячи исследований показывают, что компенсация дефицитов витаминов эффективна для профилактики практически каждой из т.н. “болезней цивилизации”. Поэтому, возникает вопрос: а почему столь важная информация (доступная, кстати, в огромном количестве в специализированной научной литературе) всячески вытесняется из медийного пространства? Тому есть несколько причин:
1. В западных странах существует скоординированная медийная атака на витамины и микронутриенты, проводимая особым «анти-витаминным» лобби. Больше больных – больше рынок для сверх-дорогих лекарств. При этом, это именно скоординированная атака, т.к. включает далеко не только истерические публикации в жёлтой прессе, но и якобы “научные” публикации в престижных англоязычных журналах. Например, анализ базы данных PUBMED показал, за последние 5 лет резко увеличилось число англоязычных «безрезультатных» исследований по витамину D, в которых приём витамина D, по заявлениям авторов, «ни к чему не приводит». Если посмотреть, кто же публикует эти, так сказать, “исследования”, то почти в каждом случае авторы имеют ярко выраженный конфликт интересов…
Есть весьма курьёзные примеры конфликта интересов, которые выглядят просто как моральный урок. Например, в Австралии и в Новой Зеландии результативность исследований эффектов витамина D близка к нулю: только одно из сорока исследований в Новой Зеландии, показало, что витамин D полезен (в Австралии – четыре из пятидесяти шести). Поскольку эти две страны – абсолютные лидеры по безрезультатности исследований витамина D, то, наверное, на австралийском континенте действуют какие-то другие законы физики, химии и биологии. Уже не говоря о сильнейшем лобби молокозаводчиков…
2. А есть ещё есть явление, которое можно назвать тоталитарной сектой адептов доказательной медицины. Для этой группы индивидуумов закон вообще не писан и, к сожалению, они прям-таки размножаются почкованием в среде российских деятелей от медицины. Есть, например, блоггеры с миллионными подписками, пропагандирующие «недоказанность витаминов» (и, одновременно, рекламирующие всё то, за что было уплачено). В западных странах, такие адепты доказательности открыто подделывают медицинские данные и публикуют эту «дезу» в ведущих англоязычных журналах. Например, свалив в кучу данные о пациентах со всеми заболеваниями подряд, они заявляют, что омега-3 ПНЖК якобы не эффективны. Самое неприятное, что на основе таких фальшивых публикаций в стиле Novichok™ формируется политика Всемирной Организации Здравоохранения! Попытки отдельных разумных людей среди западных учёных указать на несостоятельность текстовых продуктов, производимых “адептами доказательности”, жёстко пресекаются.
3. Дефициты витаминов сохраняются и усугубляются ещё и вследствие густопсового невежества, а также нежелания разбираться в чём-либо вообще. А зачем заниматься анализом больших данных? Зачем разбираться в результатах клинических исследований? Проще рядовым актерам, ряженным выдающимися докторами, заявлять на TV с умным видом, что «витамины – не нужны», “доказательная медицина доказала, что ничего не доказано” и т.п.