编辑:艾丽
审核:李子吉
政审:王军善
中国战略新兴产业融媒体记者 李子吉
自从2017年Transformer架构发布以来,大模型得到了蓬勃发展。2023年3月14日,OpenAI发布的GPT-4的走红让大模型在一夜爆火。Sora、Kimi、Suno等的接连问世,更是让人真切感受到生成式大模型已从一个流行词变成了一股发展的浪潮,浩浩荡荡地卷向每一个行业。
中医药也不例外。
不过,大模型本质上却是使用海量数据训练而成的神经网络模型,然而中医辨证过程是一个基于经验和直觉的过程,涉及大量的主观判断和逻辑推理,这种辨证信息通常是模糊的、不确定性的、非线性的。
这与我们普遍的直观感受也是一致的。在“最新的中医院AI大模型研发”相关新闻消息下,不乏对AI中医院的质疑和不解之声。
>> 网友评论节选。来源:中国网资讯、百度百家号
那么,目前中医药传统经验能成为训练大模型的数据库吗?距离我们用AI中医看病还有多远?中医院标准化模型,难点在哪里?
中医大模型如果能够成功,其应用场景其实可以非常广泛。首先,在临床诊断方面,中医大模型可以通过对患者的症状、体征等信息进行智能分析,为医生提供辅助诊断建议,提高诊断的准确性和效率。其次,在治疗方案制定方面,中医大模型可以根据患者的具体情况,为其推荐最合适的治疗方案,帮助医生制定个性化的治疗方案。此外,中医大模型还可以用于药物研发、疾病预防等领域,为中医药事业的发展注入新的活力。
然而,中医大模型的实现并非易事。由于中医理论和实践的复杂性和独特性,如何从海量数据中提取出有价值的信息,如何将这些信息转化为可用的知识体系,是中医大模型面临的主要挑战。此外,如何保证模型的准确性和可靠性,如何将其应用于临床实践,也是需要解决的重要问题。
数据是人工智能大模型变得“聪明”的关键。
中医药几千年积累的知识是最优质的数据资源,然而中医药面临作用原理说不明白、讲不清楚的“黑箱”问题。目前国内提出的中医药大模型普遍以中医药传统经验知识图谱作为训练数据,缺乏与生命底层语言的作用联系和颠覆性创新。如何在中医理论经验基础上,进一步用现代科学方法解析中医药的作用原理,优化提高中医药临床疗效,是目前中医药发展当中亟须解决的问题。
人类的肌体是一个高度复杂的系统,呈现极强的鲁棒性与自组织性;而中医治疗采用的复方中药同样是高度复杂的系统,表现在药物化学、代谢、分布等多种层面;同时传统的中医理论体系复杂,中药质量控制难度高,中药及方剂的药理机制基础研究不足等挑战,中医药的现代化之路仍有巨大的困局待解。
以复杂性科学的视角分析,中医药的诊疗实质上可以看作一个复杂系统对另一个复杂系统的控制过程。它应用一种药物复杂系统对另一个生命复杂系统进行“合理的”调控,使后者从疾病状态下的“稳态”向健康状态的“稳态”迁移,其复杂程度远远高于经典药理学的研究对象。
当病患服用中药后,药物成分就会与体内的分子物质,如核酸、蛋白质、糖等产生作用而发挥疗效,过程中涉及人体疾病生命语言靶标发现、中药对人体生命分子作用功能的大规模底层实验数据、中医药算力算法等复杂计算和实验、临床论证过程等。
这也就导致中医诊断涉及复杂的辨证过程,通常需要结合多种数据源,如患者的主观描述、医生的观察以及多种检查结果等。然而,中医诊断的个性化、经验性和主观性,导致目前公开可用的中医相关数据集较少;而缺乏充足的数据集,直接限制了智能辨证模型的训练和验证,导致模型性能难以达到预期。
同时,已有公开数据集的质量也存在着较大的差异。目前可用于辨证模型训练的数据集主要来源于住院病历和门诊医案,但往往因为中医医师的经验和个人习惯,导致这些数据存在着标注不准确、信息不完整、数据格式不统一等问题。
另一方面,在中医这种复杂的理论体系中,疾病的发生和发展是一个复杂的过程,涉及多种因素的相互作用。而现有的智能辨证模型往往只关注其中的一部分因素,忽略了其他可能对辨证结果产生影响的因素。这种简化处理虽然可以降低模型的复杂度,但也导致了模型普适性的降低。
数学模型是复杂系统的一种反映,在系统生物学研究中具有强大的作用。
“方剂-中药-组分-靶标-表型-证候”主轴中各节点之间的关系非常复杂,只有尽可能准确地模拟生理系统中复杂药物调控的各个节点变化,最大限度地将系统变化与临床表现的关系联系起来,甚至建立定量关系,人工智能才能够真正在中医药研究领域充分利用好中医药积累的复杂数据。
当前的方剂学、中药学、药物化学、生物化学、分子生物学、病理生理学等经过了百余年的发展,已经积累了大量的关于中医药复杂系统和人体复杂系统的知识,能够在一定程度上或者一定层面上“打开黑箱”,基于部分完整的生理系统进行模拟,同时依据输入和输出信号,设置一部分未知的节点,最终应用大模型对于上述两种复杂系统的相互作用进行一定程度的模拟。
2021年,博奥晶方通过一种基于分子信号通路的中药高通量筛选与智能组方技术,实现了将中医药理论体系归纳成符合现代科学惯例的数据化表达方式,这是为破解中医药面临的现代化与传统之间的系统性挑战蹚出的一条新路径。
据全国人大代表、中国工程院院士、清华大学生物医学工程学院讲席教授程京介绍,分子本草技术是基于世界首创的全景化疾病通路数据库和超大规模中药分子功能数据库,利用AI技术构建的“多弹打多靶”的中药组方筛选大模型,结合了现代生命科学、人工智能、大数据等多学科交叉创新优势,为创新中药的快速研发及作用机制的科学阐释奠定了坚实基础。
分子本草技术的原理主要有三点,一是通过挖掘在疾病状态下,人体的分子信号通路靶标的激活或抑制作用,建立全景化疾病通路数据库;二是通过实验检测药物处理人体疾病细胞模型后的基因表达数据,建立药物的作用信号通路图谱数据库,目前已检测了1200多种中药和食品提取物对人体十大系统疾病细胞模型作用的10亿级真实基因表达数据,涵盖3000万条药物功能核心信号通路数据;三是以疾病信号通路为靶标,以药物组方逆转通路为核心,AI驱动智能组方。从而形成科学内涵清晰、靶标明确的中药组方,提高中药组方用于临床的有效性和确定性。
程京在今年全国两会上提出了《用颠覆性技术构建创新中药AI大模型 守住中国人生命健康红线》的建议。建议在“十四五”规划科技研发专项中尽快设立重大专项,支持大学和企业联合开展“用颠覆性技术构建中医药AI大模型”重大系统化工程,打造从底层中医药知识数据和实验数据、中药功能评价算法工具、中药新产品开发智能平台综合解决方案的大模型赋能产业生态。开发符合中国人生命语言特点的原创中国药,用创新中药守住中国人生命健康红线。
进入2024年以来,与中医药相关的大模型产品不断问世。
同出自清华大学孵化成果的博奥晶方和水木分子宣布,双方将基于在中医药原创研发数据积累、大模型创新算法开发方面的资源优势,重点聚焦中医药AI大模型共建、中药研发新模式探索以及交叉创新人才培养等领域开展深度合作。
这次合作并不是大模型这股风第一次吹到中医药领域。
1月23日,浙江九为健康科技股份有限公司与华为云计算技术有限公司在深圳签署中医药大模型全面深化合作协议。通过整合九为健康在中医药领域的科研实力和华为云在AI大模型领域的技术优势,携手构建“中医药盘古大模型”。
九为健康首席科学家、研发总裁王永华表示,盘古大模型的应用,可以更快、更准确地筛选出具有潜在疗效的中药成分和药物,将大大缩短传统研发周期,为中医药领域带来更多创新疗法与药物。另外,盘古大模型能够根据个体患者的生物信息和病情数据,提供个性化的中医药治疗方案,这将使中医药更加精准地满足每个患者的需求,进一步提高疗效和治愈率。与此同时,盘古大模型的综合分析能力有助于揭示中药与西药之间的相互作用和协同作用机制,为中西医结合治疗探索更多可能性,推动中西医融合治疗模式的创新与进步。
为促进中医药传承创新,4月12日,全球首个中药全产业链大模型“本草智库·中药大模型”在成都正式对外发布。“本草智库”由成都中医药大学等单位联合开发,汇集了1500万条中药材基原物种的基因信息,3000余万条中药成分与靶点的互作信息,400余万个化合物等中药研究底层核心数据,形成了覆盖中药全产业链的2000余万个实体和超20亿个关系对的知识图谱,可以为基础研究、中药种植、质量控制、药物研发等中药全产业链关键环节提供决策支持。
“本草智库”开发团队负责人、中国工程院院士陈士林介绍说,“本草智库”以千亿级参数规模文心大模型为支撑,通过指令微调和检索增强生成技术,具备了中药知识的提取与生成、中药垂直领域解决方案输出、中药产业一站式数字化服务三大功能。
“本草智库”实现中药研究底层核心数据与中药全产业链关键环节的有机结合,对中药材种植、质量控制、药物研发等中药全产业链关键环节有重要意义,有助于提升中药基础研究和产业的整体效率和质量水平,为中药全产业链的关键环节提供精准的决策支持,从而优化生产流程,提高产品质量,确保药品安全。
4月10日-12日,第三届中医药高质量发展大会暨新时代中医药高质量发展战略研讨会于浙江乌镇召开。会上,十位院士、专家联合发布了面向中医针灸领域的专业大模型——“天河灵枢大模型”装置。
“天河灵枢大模型”命名来源于中国传统医学著作《灵枢》,是基于中医经典名著和针灸临床循证证据库以及中医循证知识图谱等专业数据,对2023年5月发布的“天河天元大模型”进行训练微调,开发的面向中医针灸领域的专业大模型,由国家超级计算天津中心联合现代中医药海河实验室及天津中医药大学、天津大学、信创海河实验室等团队合作研发。
当用户寻求针灸治疗建议时,“天河灵枢大模型”能够迅速分析用户的病情,提出包括针刺、艾灸、按压等多种针灸治疗方法的个性化建议。此外,“天河灵枢大模型”在回答用户问题的同时,还会将相关的证据资料一一列出,这些证据资料可能涵盖经典中医典籍的引述、现代医学研究的成果,以及临床循证研究等。
各类中医药大模型的出现,标志着这个产业到了发生变革的时机,但是,深层的问题仍然存在,距离“用AI看病”,无论是在技术和数据方面、还是在用户接受度方面,都还有很长的路需要走。
END
编辑:艾丽
审核:李子吉
政审:王军善
终审:朱永旗