宾夕法尼亚大学的研究人员使用人工智能语言分析了超过 40 万条 Reddit 帖子,并识别了官方包装说明书中未列出的减肥药物使用者的症状。这项发表在《自然健康》杂志上的研究表明,患者报告的一些不良反应在传统的临床试验中并未被发现。
该研究涵盖了 5 年多来约 7 万名用户的帖子。分析的药物包括广泛用于糖尿病和减肥的索马鲁肽和替泽帕肽。 GPT 和 Gemini 等大型语言模型处理帖子并对描述的症状进行分类。
人工智能揭示未记录的症状
用户在社交媒体上记录的症状包括月经周期不规律、经间期出血、发冷、潮热、发烧样感觉和疲劳等。这些副作用不会出现在制造商提供的文件或传统的临床试验报告中。
之前分析这些信息的困难在于患者以不同的方式描述相同的症状。人工智能已成功标准化并识别传统方法无法捕获的模式。
该研究的合著者、信息系统教授 Lyle Ungar 表示,临床试验通常只识别最危险的副作用。 “但他们可能无法确定哪些症状最让患者担心。尽管社交媒体不一定具有代表性,但大量帖子可能反映了额外的担忧,”他在新闻稿中解释道。
检测速度优势
研究人员提出的方法为传统临床试验提供了更快的替代方案。这种速度至关重要,尤其是当一种药物几乎在一夜之间从利基用途进入主流市场时,就像索马鲁肽和替泽帕肽一样。
宾夕法尼亚大学工程学院计算机和信息科学研究副教授、该研究的高级作者 Sharath Chandra Guntuku 强调:“该解决方案不会取代临床试验,但速度可能会快得多。”
该分析使研究人员能够从在线社区中提取有价值的信息,而无需冗长的官僚程序。 Reddit 是有机分享经验的患者真实报告的丰富来源。
下一步研究
研究人员计划将分析范围扩大到 Reddit 和英语社区之外。目标是比较不同语言和地区的结果,看看报告的副作用是否存在相似的模式。
这种地理和语言的扩展可能揭示不同人群报告的症状的差异。从葡萄牙语、西班牙语、法语和其他语言社区收集的数据可能会提供有关这些药物安全性的更多信息。
研究结果将与医疗保健专业人士分享,以警告患者传统科学未报告的副作用。医生将能够利用这些信息更好地为患者提供有关可能出现的不良经历的建议。
对药物监测的影响
该研究展示了人工智能如何补充传统的药物监测系统。一些国家的监管机构在药物批准后对其进行监测,但目前的方法可能很难捕捉到所有不良反应。
这种创新方法为基于社交媒体数据的预警系统铺平了道路。当许多用户报告特定症状时,算法可以在潜在的副作用成为重大公共卫生问题之前标记它们。
大型语言模型还可以降低分析运营成本。以前,研究数百万份报告需要大型研究人员团队手动阅读每篇文章。现在,机器可以在很短的时间内处理数据。
社交网络作为科学来源的可靠性
尽管社交媒体数据不能代表一般人群,但大量的帖子提供了有价值的见解。例如,Reddit 用户经常分享有关药物的详细而诚实的经验。
报告副作用的患者倾向于寻找在线社区来验证他们的经历并寻求支持。这些空间就像天然实验室,人们在这里描述他们每天经历的真实症状。
与正式医疗咨询相比,社交媒体的自愿和匿名性质可能会鼓励更诚实的报告,在正式医疗咨询中,患者可能会出于各种原因隐瞒信息。
该研究代表了现代药物警戒的重大进步,展示了技术如何能够近乎实时地改进人们广泛使用的药物的副作用检测。

