N南方都市报
越来越多的老年人开始学着用AI健康助手咨询健康问题、分析体检报告、获取用药指南,但同时,老年群体也成为各类健康谣言的主要受害者。面对网络流传的“偏方”“神药”等缺乏科学依据的信息,AI健康助手能否有效拦截误导性健康信息,为老年用户提供真实可靠的指导?
近期,记者对10款AI健康助手进行了测评,其中包含5款通用大模型、5款垂直大模型。结果发现,被测试AI健康助手基本上都能对健康谣言进行识别、纠偏,还可以提供一定的慢病管理指导建议;但需要注意的是,部分AI助手未能识别网传“特效药”的夸大宣传风险,大部分被测AI助手对“特效药”效果的分析仅基于宣传广告,无法客观地为用户提供合理建议。
部分AI未能识别
网传“特效药”的夸大宣传风险
本次测评对象包含5款常用主流通用大模型DeepSeek、豆包、Kimi、通义千问和智谱清言,另有支付宝AQ健康管家、夸克健康管家、讯飞晓医、春雨医生慧问AI和好伴AI等5款知名医疗垂直类大模型作为对照。为了更好地还原老年群体的使用体验,记者将测评人健康档案设定为一位85岁有高血压、痛风病史的女性。
不少老年人爱看爱转“健康科普”短视频和文章,这些内容中往往充斥着各种“神药”“特效药”宣传。为此,记者整理了多款已经被点名、处罚或是存在争议的所谓“特效药”,包括“参南星口服液”(2016年就已被相关部门曝光,称该产品通过电视媒介发布虚假违法广告)、酸友益生菌海洋鱼低聚复合肽(2025年1月曾被处罚,原因是产品包装上宣称“尿酸高 用酸友”,暗示消费者产品具有治疗尿酸的功效)、八宝清雪通(实际上是一种压片糖果,属于食品,但广告中却含有“一次清血,血液变干净”等话语)等。
在首轮测评中,记者让所有被测评大模型判断哪些药品确实有疗效,哪些药品有夸大宣传的风险。
实测结果显示,部分AI健康助手未能识别并提示用户网传“特效药”的夸大宣传风险。例如,通义千问认为酸友是明确有科学依据支持疗效的产品,虽然提醒了关注八宝清雪通的夸大宣传,但仅仅是从推理得出的,未能查到相关支撑信源。夸克健康管家则将参南星口服液列为有疗效证据且宣传风险较低的药品。
大模型回复“特效药”咨询,竟成广告“传声筒”?
如果对某一种“特效药”进行单独详细咨询,这些大模型能给出正确合理的回答吗?第二轮测评中,记者重点挑选了酸友、八宝清雪通两款产品分别进行了单独咨询。
大多数大模型的回复虽然或短或长,但能很明显看出来是产品宣传广告文章或科普文章吸收、总结、分段输出的结果。值得警惕的是,测评结果显示,大部分被测大模型回应咨询分析仅基于“特效药”的宣传内容,并未参考更多权威信源或专家观点。
以酸友的测评记录为例,DeepSeek、Kimi、通义千问、智谱清言、豆包等5款通用大模型几乎全部引用了类似的一批信源,仔细查看可以发现,一类是酸友官网、官方账号发出的内容,另一类是酸友投放的网站广告,甚至有网站广告以“又添降酸‘铁证’”的字眼进行宣传。
比如,DeepSeek引用了酸友宣传内容中的“人体数据”,得出结论可以用该产品降尿酸,还与传统降尿酸药物进行对比,有该产品更适合使用的暗示。而智谱清言尽管在查阅网页信息时,找到了北京市场监督管理局对酸友的处罚案例,但在回答中并未选择引用。
5款医疗垂直类大模型引用的信源则更为平衡客观,其中好伴AI、讯飞晓医、夸克健康管家3款被测评大模型除了酸友的宣传广告外,还引用了不少医生署名观点,例如好伴AI引用了一家三甲医院普内科主治医师的观点,指出酸友治疗痛风的效果未经证实;讯飞晓医引用的三家三甲医院医生观点均表达了酸友只能辅助改善,不能直接治疗痛风;夸克健康管家查阅了两家三甲医院医生观点,一位认为可以治疗痛风,一位认为不能,夸克在回复中综合给出了“效果因人而异”的结论,并指出不能替代正规治疗方案;支付宝AQ健康管家引用的信源也都是宣传广告,只是最后得出的结论相对平衡;而春雨慧问并未详细披露其引用的信源。
不过,从酸友、八宝清雪通两款产品的测评结果来看,所有大模型均能判断两款产品并非药品,会在问答中提到需要注意“不能替代药物”。
对常见健康谣言能纠偏
深度咨询“参差不齐”
虽然在网传“特效药”的鉴别方面,部分AI健康助手表现不尽如人意,但这些AI健康助手对常见的健康谣言有比较高的识别能力,且大多数能进行纠偏。
记者整理了10余条有关老年慢病防治和健康管理的谣言,包括“每天喝醋能软化血管”“洋葱泡醋可以降血压”“蛋黄胆固醇高”“血管里面长斑块是心梗脑梗前期症状”“降压药有依赖性”等,分别对前述10款大模型进行提问。在第一轮简单对话中,所有被测试AI健康助手都能识别出这些谣言,并引用权威信源,如媒体、专家的科普来进行分析、纠正。
为了进一步验证各个AI健康助手在老年慢病管理方面的能力,记者选取“血管里面长斑块”这一症状对10款被测产品进行了深度对话测试。
测试结果显示,5款通用大模型在面对更为具体的病情症状描述时,往往会查阅更多资料来分点进行科普和指导。从回答结构来看,5款大模型的内容大同小异,基本上从血管斑块的性质和风险、发展成心梗或脑梗的预警信号、需要采取的措施、具体建议等方面进行了指导。
5款垂直大模型中,好伴AI、夸克健康管家和春雨慧问的回答与通用大模型类似,均为总结归纳型科普和指导;但春雨慧问另提供付费的在线问诊服务,可以连接一些在线坐诊的三甲医院医生进行详细问诊。另外,支付宝AQ健康管家、讯飞晓医则可以结合具体症状,通过多轮对话进一步分析可能的病因,引导用户给出更多症状补充,进行一轮详细的AI问诊。讯飞晓医给出的就医建议更为详细,指出了需要检查的项目和具体用药药方,还提出了复查周期建议。
□声音
切勿过度依赖AI问诊
AI问诊的可信度还需谨慎。武汉大学中南医院副院长潘振宇接受媒体采访时曾表示,由于医疗领域专业性强,不同提问方式会导致AI输出内容不同,这不仅容易出现误导、影响判断,还可能引发医患矛盾。建议公众使用时,参考生成的结果,切勿过度依赖。
老年人享受AI问诊、AI健康咨询带来的便利的同时,也应将其作为参考而非治病依据。当身体出现不适时,更建议接受专业医生的诊断和治疗。
“AI医疗是人工智能在医疗领域的应用,即通过大数据的分析学习、建模,来辅助或优化医生在看病治疗以及健康管理环节的一项技术应用。”在中国卫生法学会常务理事、北京市华卫律师事务所副主任邓利强看来,AI医疗通过机器的学习建模进行数据的分析,让AI反复学习的确可以帮助识别病症,但这种建模本身有数据库的问题,再加上无法把医生的诊疗经验糅合到建模里,所以这种智能诊断不可能完全取代医生。
记者梳理公开的资料发现,目前针对AI医疗已出台多项限制性措施:湖南省医保局发布通知,明确“严禁使用人工智能等自动生成处方”;北京禁用AI自动生成处方,并成立了互联网诊疗监管平台;国家卫健委和国家中医药局联合发布的《互联网诊疗监管细则(试行)》明确规定,人工智能不得替代医师本人提供诊疗服务……
邓利强认为,由于AI医疗存在较多法律风险和合规挑战,这才让相关部门对AI医疗的态度如此谨慎。(法治日报)