Архив категорий Новое

Хроники ковидных городов…

Вопиющая некомпетентность и преступная халатность медиа-бонз и медийных управленцев, связанная с COVID-19, побудила разработчиков системы ANTIFAKE публиковать еженедельные отчёты о новых научных публикациях по коронавирусной инфекции. Большой объем публикаций (на ноябрь 2021 года – 190 тыс. публикаций в рецензируемых научных журналах) обусловила применение методов анализа больших данных. Смотрите тексты ХРОНИКИ КОВИДЛЫ!

Псевдонаука h-индекса: кто в 2 раза умнее… А.Эйнштейна

PHYS.ORG – один из немногих новостных ресурсов для учёных, еще не подмятый лженаучной либерастической пропагандой. Он продолжает радовать нас, простых исследователей, простым здравым смыслом.

Например, вспомним прямо-таки впечатляющий провал (spectacular failure) применения антималярийных препаратов против COVID-19. Вся медийная шумиха вокруг этой очевидно непродуманной идеи (ну какая взаимосвязь между малярией и вирусами?) привела к тому, что эта неудача стала еще более выпуклой – клинические исследования хлорохиновых препаратов у пациентов с COVID-19 остановлены в Германии, Бразилии, Италии и ряде других стран вследствие отсутствия какой-либо клинической эффективности и смертельно опасных побочных эффектов.

Наиболее интересно, что персоныш, положивший начало навязчивой пропаганде по использованию гидроксихлорохина для лечения COVID-19, долгое время указывал на свой собственный список публикаций и на большое количество цитирований в качестве указания на его вклад в науку, все из которых обобщены в значении его индекса Хирша (h-index). “Научный вклад” этого французского автора, Д. Рауля, стал особенно очевидным после полного провала хлорохиновых экспериментов на пациентах с COVID-19.

Изобретенный в 2005 году американским физиком Дж. Хиршем, h-индекс стал псевдонаучным “показателем качества” научной работы исследователей. В реальности, это показатель принадлежности к определенного рода тусовке, причем далеко не самого интеллектуального свойства.

В самом деле, как указано в обсуждаемой публикации на ресурсе phys.org , адепты и пропагандисты h-индекса неспособны были избежать даже элементарных логических ошибок. Например, они утверждают, что, поскольку лауреаты Нобелевской премии, как правило, имеют высокий h-индекс, то этот показатель является достоверным показателем индивидуального качества исследователей. Однако, это никоим образом не доказывает, что низкий h-индекс обязательно соответствует “низкому качеству исследований”.

В самом деле, h-индекс малоизвестного британского французского “учёного” Д. Рауля равен 120, при исключении самоцитирований – 104 (по данным 2053 публикаций). Индекс Альберта Эйнштейна, опубликовавшего каких-то 147 публикаций, составляет всего-то 56.

При этом, очевидный любому не-имбецилу вклад А. Эйнштейна в формирование всего современного мира (уже не говоря о науке) просто несопоставим с “вкладом” упоминаемого ранее персоныша. Работы А. Эйнштейна по общей и специальной теории относительности, фотоэффекту, теории броуновского движения, статистике бозонов, теории гравитации, единой теории поля и космогонии не просто сформировали базис современной физики, но и изменили коренным образом мировоззрение десятков миллионов людей.

Поэтому, очевидное безумие использования х-индексов и прочей лженаучной цифири для “оценки научного вклада” должно быть прекращено в рамках борьбы с пропагандой либерастии среди несовершеннолетних…

Статья на phys.org также подчеркивает тот факт, что использование х-индекса сродни тотемизму и поведению адептов тоталитарных сект, наподобие секты доказательщиков в медицине. Многие научные сообщества в полному смысле слова “поклоняются” h-тотему, и этот фетишизм может иметь весьма вредные последствия для научных исследований. Здравый смысл должен научить нас опасаться упрощенных и одномерных показателей “эффективности научных исследований”.

Психиатрия

“Если человеческое равенство надо навсегда сделать невозможным, если высшие, как мы их называем, хотят сохранить своё место навеки, тогда господствующим душевным состоянием должно стать управляемое безумие”. Дж. Оруэлл, 1984.

Эта фраза известного британского писателя вызывает различные ассоциации. В России почему-то “креаклы” думают, что Дж. Оруэлл таким образом критиковал советский коммунизм и.т.п. Никому из этих “креативных” и в голову, почему-то не приходит, что Оруэлл, вообще говоря, британский писатель и, как всякий психически адекватный писатель, в отличие от британских учёных, он пишет о своей стране.

О каком “безумии” мог говорить Оруэлл? Безумная реклама из телевизора, имеющая многие признаки т.н. “нейролингвистического программирования”? Безумие телепередач где гигантскими буквами пропагандируется “АЛЧНОСТЬ”? Бытовое безумие обыкновенного фашизма, охарактеризованного гениальным М. Роммом? Скрытый экстремизм т.н. борцов с тоталитаризмом, которые явно нуждаются в помощи профессионального психиатра? Да, это вещи опасные, такие же смертельно опасные, как пляски с динозаврами в фантастических фильмах серии “Парк юрского периода”.

Нас, однако, интересуют здесь чисто психиатрические аспекты проекции смысла цитируемой выше фразы английского писателя, причем в применении к анализу больших текстовых данных. В самом деле, если некие облеченные властью персонажи хотят сеять то, что реально сертифицируется безумием врачами психиатрами, им нужно решить несколько задач, в т.ч.:

  • Легализация всех возможных извращений, которые считались таковыми даже в племенах дикарей-людоедов. Сделано, т.к. легализация таковых – официальная политика всех западных стран и наказывают уже не за извращения, а за противостояние им. Чтобы это понять, достаточно открыть любой британский или американский таблоид, больших данных не надо.
  • Легализация химической зависимости (сначала т.н. “лёгких наркотиков”). Близко к завершению, см. ситуацию в западной европе, на британских островах и в отдельных штатах США. Методы метрического анализа больших данных позволяют выделять блоггеров, занимающихся активной пропагандой данного явления.
  • Широчайшее распространение и пропаганда поведения высокого риска для жизни (в т.ч. суицида). В активной фазе – см. медийные материалы о том, как ради “эпатажного селфи”, “медальки за соревнования” и т.п. сотни молодых людей расстаются с жизнью. Здесь методы анализа больших данных могут помочь в организации медийного контроля и выявлять деструктивных блоггеров.
  • Устранение авторитета медицины вообще, полная дискредитация т.н. “доказательной медицины”. Вполне успешно продвигается, см. раздел “доказательная медицина”.
  • Размытие установленных критериев психиатрических патологий, продвижение деструктивной идеологии “все психически здоровы, но с некоторыми отклонениями”.

В последнем случае, т.е. в разрушении психиатрии как науки, активно принимают участие т.н. ученые-психиатры. Вместо того, что с помощью современных средств анализа сложных данных изучать психиатрические заболевания, эти “эксперты в своей области” занимаются дискредитацией всего направления психиатрии как полноценной науки.

С точки зрения исследователя, в психиатрии, зачастую, диагностика тех или иных патологий может быть неоднозначна: определения классов пациентов гораздо менее жесткие, чем, допустим, в кардиологии, где инфаркт миокарда определяется очень жестким набором критериев. Инфаркт либо был, либо нет. Соответственно, когда нечётко определены классы, любые алгоритмы машинного обучения и статистика сразу начинают давать сбои.

Поэтому, в психиатрии как проблемной области совершенно очевидно есть ряд проблем, которые должны быть решены перед тем, как использовать современные биологические данные для изучения  психиатрических заболеваний. Всё это, однако, мало интересует платных пропагандистов с пониженной социальной ответственностью, которые имеют информационные ресурсы в виде возможности публикаций в журналах по психиатрии с высоким индексом цитирования. Методы топологического анализа больших данных, в применении к задаче регулярного сканирования профессиональной медицинской литературы, позволяют реально выявлять случаи таких публикаций, не имеющих ничего общего с психиатрией, а отрабатывающих деньги соответствующих грантодателей.

Например, в течение последнего года нами был “поставлен на вооружение” алгоритм, выявляющий публикации в профессиональных журналах по психиатрии, которые отличаются (1) высоким уровнем манипулятивных сентиментов (англ. spin words, weasel words), (2) сентиментов, отличающих лженаучные тексты, (3) сентиментов, характерных для пропагандистских публикаций (примеры таковых приведены здесь).

В результате, алгоритм выявил поднимающуюся волну статей, в которых, и в самом деле, психиатрия развенчивается как наука по принципу “генетика – лженаука“, “кибернетика – буржуазная наука” и проч. См., например, яркий пример в виде публикации [1] и соответствующего медийного материала. Британские ученые (буквально – университет Ливерпуля) доказали, что, оказывается:

  • Все психиатрические диагнозы, что называется, “на одно лицо” и существенно не отличаются друг от друга. Заметим, что квантор “все” – от авторов текста [1].
  • Все психиатрические диагнозы маскируют, оказывается, какие-то неспецифические “травмы” и “враждебные события” (adverse events)
  • Ни один диагноз, на самом деле, ничего не говорит о какой-то абстрактной “индивидуальности” пациента и как лечить его/её.
  • Рабочие критерии психиатров, повсеместно используемые в практике, научно бессмысленны (scientifically meaningless)

При этом, уровни манипулятивных и пропагандистских сентиментов, с которыми описанная выше пурга излагается, в данной публикации [1] просто зашкаливают: в 10 раз выше, чем в среднестатистической публикации по психиатрии. Вот пример сразу нескольких манипулятивных конструкций всего лишь в одном предложении: общепринятое руководство “Diagnostic and Statistical Manual (DSM)”, оказывается, представляет собой “диагностическое наклеивание ярлыков” (diagnostic labelling) и является “неумной категорной системой” (disingenuous categorical system). Вообщем, ситуация в полном соответствии с известным рассказом Э.А. По и с известным голливудским фильмом 2014 года, очевидно снятым по мотивам этого рассказа….

Действительно, в психиатрии, зачастую, диагностика тех или иных патологий может быть неоднозначна: определения классов пациентов гораздо менее жесткие, чем, скажем, в кардиологии. Соответственно, когда нечётко определены классы, любые алгоритмы и статистические подходы начинают давать сбои. Однако, если (1) тщательно собирать биомедицинские данные, (2) создавать большие таблицы признаков (порядка тысяч самых разных описаний состояния пациентов, причем для многих тысяч пациентов), (3) использовать адекватные методы анализа таких сложных данных, то это будет стимулировать развитие психиатрии как науки. Топологический подход к анализу данных как раз и направлен на быстрый и продуктивный анализ таких “больших данных” [2].

Литература

1. K. Allsopp et al, Heterogeneity in psychiatric diagnostic classification, Psychiatry Research (2019). DOI: 10.1016/j.psychres.2019.07.005

2. Torshin I.Yu., Rudakov K.V. On the theoretical basis of the metric analysis of poorly formalized problems of recognition and classification. Pattern Recognition and Image Analysis (Advances in Mathematical Theory and Applications). 2015; 25 (4): 577–587. DOI: 10.1134/S1054661815040252

Политология

Политология и психиатрия, будучи тесно взаимосвязанными областями, являются наиболее яркими примерами из области прикладной лингвистики, где применение адекватных методов анализа больших данных насущно необходимо. Ни современные политологи, ни т.н. журналисты-исследователи не имеют ни малейшего понятия о важности (уже не говоря о конкретных технических возможностях) применения топологических и метрических методов анализа больших данных к своим областям. В результате, при чтении и научной прессы, и якобы “исследовательских” журнальных статей неизбежно возникает deja vu, характеризуемое известным “гора родила мышь” и “тупая заказуха”.

Приведем очень конкретный пример. Например, в 2006-2007 годах, когда стали появляться в публичном доступе сверхбольшие данные ресурса Викиликс (суммарно, более 10 терабайт только текстовых данных), было ожидание прямо-таки глубочайших открытий в области политики, как она “реально делается”. Газета британских учёных спецслужб под названием Гардиан держала читателей в напряжении более 2 недель, выдавая какие-то ошмётки наподобие мелкого скандала в Кении, или что думает какой-то испанский судья о т.н. русской мафии (как будто у абсолютно невинных испанцев нет своих собственных сетевых мафиозных структур) и.т.п. А потом…. Потом настала тишина, опять скандалы про английскую королевскую семью и прочая активность, направленная на маскировку полнейшего провала (comlplete failure) британскими учеными попытки строить политическую аналитику на реальных больших данных, а не на том, что “прикажут сверху”.

Таким образом, в 10 терабайтах больших данных “самым главным” оказались какие-то домыслы каких-то мутных персонажей о чём-то там, которые и были растиражированы мировыми СМИ. Помимо очевидной ангажированности этих самых СМИ, причиной феномена горы, порождающей мелкое вредное млекопитающее, является вопиющее неумение аналитически работать с большими данными. Таким образом, применение больших данных в политологии – дело завтрашнего дня…

Тем не менее, адекватное применение методов топологического и метрического анализа больших текстовых данных к большим данным из того же ресурса Викиликс позволяет делать весьма интересные выводы о политической активности стран, возомнивших себя “мировыми гегемонами” (совсем как “наполеоны” в больнице П.П. Кащенко, см. раздел Психиатрия). Например, крайне интересно отметить пиковую динамику временных рядов определенных сентиментов, которая, по сути, является комплексным предиктором событий 08.08.2008 года на южных окраинах России, событий 2011 в Ливии, событий 2014 года на юго-западной окраине России и многих, многих других. В самом деле, когда, например, пики сентиментов “манипулятивные словечки” (англ. spin words) наблюдаются в августе 2006 года, а в августе 2008-го года, как по часам, происходят всем известные военно-политические события, то такого рода “предиктивная политология” должна была бы очень интересовать настоящих политологов-исследователей и борцов с тоталитаризмом

О псевдонауке анализа цитируемости

Оказывается, на индекс цитируемости сильно влияет…. наличие в названии статьи знака “дефис”?! Авторы исследования не формулируют в явном виде причину столь странного поведения систем цитирования, но их результаты позволяют предположить наличие ряда дефектов в соответствующих алгоритмах поиска текстовых строк. См. полный текст статьи.

Дефекты алгоритмов классификации изображений

Анализ контр-примеров (в т.ч. посредством метода т.н. adversarial attacks) указывает на дефекты часто используемых алгоритмов для обработки медицинских изображений, которые позволяют осуществлять подлог данных (англ. “fraudulent practices”), направленный на увеличение доходов соответствующих лиц.

ИАД для геологии

Методы интеллектуального анализа больших данных могут быть использованы для установления новых геологических закономерностей. Применение методов машинного обучения важно для извлечения информации из больших данных, собираемых в рамках наук о Земле (геологическое картирование с использованием данных дистанционного зондирования, моделирование подземного переноса и классификация частиц вулканического пепла для определения механизма вулканического извержения,  классификация сейсмических событий, обнаружение эффективных ранних предикторов землетрясений и др.).

Открыт доступ к данным ATLAS в ЦЕРН

Открыт доступ к данным эксперимента ATLAS в ЦЕРН! Данные эксперимента ATLAS (100 трлн. столкновений протонов) теперь общедоступны. Это первый в мире открытый выпуск данных с энергией 8 ТэВ, собранных с Большого адронного коллайдера.

Западные учёные призывают прекратить диктат т.н. “статистической значимости”

Наконец-то! Западные учёные (800 подписей) призывают прекратить диктат произвольно определяемой “статистической значимости”.

  • Во-первых, те, кто считает т.н. “статистическую значимость” универсальным инструментом, весьма плохо разбираются в математической аксиоматике, лежащей за тем или иным статистическим критерием.
  • Во-вторых, статистических критериев – десятки, а “незначимость” той или иной закономерности, зачастую, находится только по одному критерию и, затем, абсолютизируется.
  • В-третьих, “статистически незначимые” закономерности всё же могут использоваться как эффективные предикторы в системах машинного обучения.
  • Несколько замечательных цитат из статьи:
    • The false belief: crossing the threshold of statistical significance is enough to show that a result is ‘real’
    • Rigid focus on statistical significance encourages researchers to choose data and methods that yield statistical significance for some desired (or simply publishable) result
    • Inferences should be scientific, and that goes far beyond the merely statistical.

Идентификация медийных атак

Как методы анализа больших данных позволяют выявлять лиц, занимающихся недобросовестной конкуренцией

Человек нуждается в ежедневном потреблении тридцати трёх витаминов и микроэлементов. К сожалению, технология выращивания растений и животных в промышленных масштабах направлена на достижение максимальных объемов продукции в кратчайшие сроки. В результате, витамины в современных продуктах питаниях не успевают накопиться. Разговоры о том, что «раньше жили лучше без всяких витаминов» основаны на полном незнании статистики длительности жизни, материнской и младенческой смертности в прошлом, особенно в средневековье.

Дефициты витаминов и микроэлементов существуют в самых разных странах: и в «бедных», и в «богатых», где выбор продуктов весьма широк. Потребление необходимого числа калорий не означает потребления необходимого количества микронутриентов. В результате развиваются полигиповитаминозы (т.е. дефициты сразу нескольких микронутриентов). Это серьёзно влияет на здоровье человека, провоцируя развитие т.н. «болезней цивилизации»: инфаркта, инсульта, опухолей, ожирения, диабета.

Например, крупномасштабное исследование женщин репродуктивного возраста показало, что суточное потребление витаминов часто не достигает нормы. Ситуация и в России, и в западной Европе приблизительно одинакова: одновременно всеми жизненно необходимыми микронутриентами обеспечено менее 10% населения!  Во многом, столь печальная ситуация поддерживается пропагандистами, чревовещающими, что, мол “витаминов достаточно в пище”.

Метрический анализ данных исследования показал, что если эти сочетанные дефициты витаминов и микроэлементов продолжаются годами, то многократно возрастает риск коморбидных патологий: атеросклероза, тромбоза, артериальной гипертонии, инфаркта, инсульта, накопления токсических металлов, опухолей, ожирения и диабета. Всё это приводит к ускоренному старению и к сокращению длительности жизни.

Результаты приведенного выше исследования, равно как и результаты десятков тысяч других исследований, указывают на существование дефицитов витаминов и связанные с этим риски для здоровья. Тысячи исследований показывают, что компенсация дефицитов витаминов эффективна для профилактики практически каждой из т.н. “болезней цивилизации”. Поэтому, возникает вопрос: а почему столь важная информация (доступная, кстати, в огромном количестве в специализированной научной литературе) всячески вытесняется из медийного пространства? Тому есть несколько причин:

1. В западных странах существует скоординированная медийная атака на витамины и микронутриенты, проводимая особым «анти-витаминным» лобби. Больше больных – больше рынок для сверх-дорогих лекарств. При этом, это именно скоординированная атака, т.к. включает далеко не только истерические публикации в жёлтой прессе, но и якобы “научные” публикации в престижных англоязычных журналах. Например, анализ базы данных PUBMED показал, за последние 5 лет  резко увеличилось число  англоязычных «безрезультатных» исследований по витамину D, в которых приём витамина D, по заявлениям авторов, «ни к чему не приводит». Если посмотреть, кто же публикует эти, так сказать, “исследования”, то почти в каждом случае авторы имеют ярко выраженный конфликт интересов…

Есть весьма курьёзные примеры конфликта интересов, которые выглядят просто как моральный урок. Например, в Австралии и в Новой Зеландии результативность исследований эффектов витамина D близка к нулю: только одно  из сорока исследований в Новой Зеландии, показало, что витамин D полезен (в Австралии – четыре из пятидесяти шести). Поскольку эти две страны – абсолютные лидеры по безрезультатности исследований витамина D, то, наверное, на австралийском континенте действуют какие-то другие законы физики, химии и биологии. Уже не говоря о сильнейшем лобби молокозаводчиков…

 

2. А есть ещё есть явление, которое можно назвать тоталитарной сектой адептов доказательной медицины.  Для этой группы индивидуумов закон вообще не писан и, к сожалению, они прям-таки размножаются почкованием в среде российских деятелей от медицины. Есть, например, блоггеры с миллионными подписками, пропагандирующие «недоказанность витаминов» (и, одновременно, рекламирующие всё то, за что было уплачено). В западных странах, такие адепты доказательности открыто подделывают медицинские данные и публикуют эту «дезу» в ведущих англоязычных журналах. Например, свалив в кучу данные о пациентах со всеми заболеваниями подряд, они заявляют, что омега-3 ПНЖК якобы не эффективны. Самое неприятное, что на основе таких фальшивых публикаций в стиле Novichok™ формируется политика Всемирной Организации Здравоохранения! Попытки отдельных разумных людей среди западных учёных указать на несостоятельность текстовых продуктов, производимых “адептами доказательности”, жёстко пресекаются.

3. Дефициты витаминов сохраняются и усугубляются ещё и вследствие густопсового невежества, а также нежелания разбираться в чём-либо вообще. А зачем заниматься анализом больших данных? Зачем разбираться в результатах клинических исследований? Проще рядовым актерам, ряженным выдающимися докторами, заявлять на TV с умным видом, что «витамины – не нужны», “доказательная медицина доказала, что ничего не доказано” и т.п.