Исследователи из Пенсильванского университета использовали языки искусственного интеллекта для анализа более 400 000 сообщений на Reddit и выявления симптомов у пользователей лекарств для похудения, которые не указаны в официальных вкладышах. Исследование, опубликованное в журнале Nature Health, показало, что некоторые побочные эффекты, о которых сообщали пациенты, не были обнаружены в ходе обычных клинических испытаний.
Исследование охватило посты примерно 70 тысяч пользователей за более чем 5 лет. Анализируемые препараты включают семаглутид и тирзепатид, которые широко используются при диабете и для снижения веса. Большие языковые модели, такие как GPT и Gemini, обрабатывали сообщения и классифицировали описанные симптомы.
ИИ выявляет недокументированные симптомы
Среди симптомов, зафиксированных пользователями в социальных сетях, были нерегулярные менструальные циклы, межменструальные кровотечения, озноб, приливы, лихорадочные ощущения и усталость. Эти побочные эффекты не указаны в документации, предоставленной производителями, или в традиционных отчетах о клинических испытаниях.
Предыдущая трудность анализа этой информации заключалась в том, что пациенты по-разному описывают одни и те же симптомы. Искусственному интеллекту удалось стандартизировать и выявить закономерности, которые традиционные методы не улавливают.
По словам Лайла Ангара, профессора информационных систем и соавтора исследования, клинические испытания обычно выявляют только наиболее опасные побочные эффекты. «Но они, возможно, не смогут определить, какие симптомы больше всего беспокоят пациентов. Хотя социальные сети не обязательно являются репрезентативными, большое количество сообщений может отражать дополнительные проблемы», — пояснил он в пресс-релизе.
Преимущество в скорости обнаружения
Предложенный исследователями метод предлагает более быструю альтернативу традиционным клиническим исследованиям. Эта скорость имеет решающее значение, особенно когда препарат почти за одну ночь выходит из ниши применения на основной рынок, как это произошло с семаглутидом и тирзепатидом.
Шарат Чандра Гунтуку, доцент кафедры компьютерных и информационных наук Пенсильванского инженерного института и старший автор исследования, подчеркнул: «Это решение не заменяет клинические испытания, но оно могло бы быть намного быстрее».
Анализ позволил исследователям извлечь ценную информацию из интернет-сообществ без необходимости длительных бюрократических процессов. Reddit послужил богатым источником реальных отчетов от пациентов, которые органично делятся своим опытом.
Следующие шаги в исследовании
Исследователи планируют расширить анализ за пределы Reddit и англоязычных сообществ. Цель состоит в том, чтобы сравнить результаты на разных языках и в разных регионах, чтобы выяснить, существуют ли схожие закономерности в зарегистрированных побочных эффектах.
Такое географическое и лингвистическое расширение может выявить различия в сообщаемых симптомах среди разных групп населения. Данные, собранные в сообществах, говорящих на португальском, испанском, французском и других языках, могут предоставить дополнительную информацию о безопасности этих лекарств.
Результаты будут переданы медицинским работникам, чтобы предупредить пациентов о побочных эффектах, о которых не сообщает традиционная наука. Врачи смогут использовать эту информацию, чтобы лучше информировать своих пациентов о возможных побочных эффектах.
Влияние на мониторинг приема лекарств
Исследование демонстрирует, как искусственный интеллект может дополнять традиционные системы фармацевтического надзора. Регулирующие органы в нескольких странах контролируют лекарства после их одобрения, но нынешняя методология может быть медленной для выявления всех побочных реакций.
Инновационный подход открывает путь к созданию системы раннего предупреждения, основанной на данных социальных сетей. Когда многие пользователи сообщают о конкретном симптоме, алгоритмы могут выявить потенциальные побочные эффекты до того, как они станут серьезной проблемой общественного здравоохранения.
Большие языковые модели также сокращают эксплуатационные расходы на анализ. Раньше для изучения миллионов отчетов требовалось, чтобы большие группы исследователей вручную читали каждое сообщение. Теперь машины могут обрабатывать данные за долю времени.
Надежность социальных сетей как научный источник
Хотя данные социальных сетей не являются репрезентативными для населения в целом, огромное количество сообщений дает ценную информацию. Пользователи Reddit, например, часто делятся подробным и честным опытом о лекарствах.
Пациенты, сообщающие о побочных эффектах, как правило, ищут онлайн-сообщества, чтобы подтвердить свой опыт и найти поддержку. Эти пространства функционируют как естественные лаборатории, где люди описывают реальные симптомы, с которыми они сталкиваются ежедневно.
Добровольный и анонимный характер социальных сетей может способствовать более честным сообщениям по сравнению с формальными медицинскими консультациями, где пациенты могут скрывать информацию по ряду причин.
Исследование представляет собой значительный прогресс в современном фармаконадзоре и показывает, как технологии могут улучшить выявление побочных эффектов примерно в реальном времени для лекарств, широко используемых населением.

