1.引言 为加快医疗健康行业人工智能的技术与产品发展,提升应用效果,提高覆盖范围,赋能优质医疗资源快速扩容需求,开展应用体系创新,各地区以头部医院牵头,以畅通算力供应、数据要素利用、场景开放为重点,建立城市医疗健康行业人工智能应用示范基地,为医疗高质量的发展提供关键助力。 实现城市医疗健康人工智能应用基地平台建设,从逻辑上来看,最上层为依托头部医院打造的全场景智能化中心;中间层则为提供医学人工智能场景应用共性保障的数字基座层,融合医学人工智能应用、综合治理、资源管理调度、数据和模型资源为一体;底层为通过租赁、购置和利旧建设的基础设施。 其中,数字基座层为医疗卫生行业人工智能各类型主体提供便捷接入和共享协作,支持传统人工智能、深度学习、大模型、生成模型、智能体等多类型人工智能的研发应用创新。 2.数字基座总体架构 医疗健康人工智能数字基座由数据中台、AI中台、知识中台、物联网中台、元宇宙中台、区块链中台等六个中台(见下图)组成,依托算力、网络、物联网设备等基础能力和数据湖能力,形成智慧医疗、智能问答、隐私计算等多种数字能力赋能上层应用。 3.数据中台 数据中台主要提供多种智能服务,覆盖基地对内、对外服务场景,促进医疗数字化升级。以DT+AI技术双引擎驱动大数据与AI融合,实现大数据与AI一体化技术底座,助力大数据与AI融合发展。形成感知、观测、决策、执行自闭环大数据智能体,赋能医疗智慧化。功能包括:打造多模态大数据与AI统一门户,支持多模态数据集市、数据检索;提供支持自然语言交互式数据分析、深度洞察能力;提供大模型增强的图谱自动构建、支持亿级图的图查询、图推理、图问答能力。 其中(见上图),下层融AI数据中台通过大数据融AI引擎,形成包含数据采集、数据交换、数据研发、数据治理、数据资产、数据开放、数据标注、特征加工、数据集管理、模型管理、模型训练、模型推理的DT+AI一体化研发能力。上层搭建融AI数据服务,打造融AI数据应用,形成智慧医疗服务、融AI数据门户、大数据智能体等多种能力。 4.AI中台 AI中台主要功能包含多算力集群纳管、高效标训推评、智能大模型标注、大模型高效训练、模型MLOps、MaaS平台、大模型高效推理、多算力集群纳管、多维度监控报警等。 AI中台主要分为三层(见上图)。 AI技术服务层:从模型、应用、数据、算力等开放面向医疗场景的技术服务,促进基地实现多样化的应用场景创新。 AI研发平台层:在面向小模型提供的模型构建、训练、调优、评估等机器学习、深度学习能力之上,提供面向大模型开发的语料标注、模型微调、提升词工程等能力,降低研发门槛,提升研发效率。 AI管理运行层:支撑AI能力生产、服务、运维,包含资源管理、系统管理、存储管理、算力调度等多种功能。 基于AI中台构建医疗大模型,围绕智慧诊疗、智慧就医、智慧管理、智慧医学科研等场景,实现医疗高质量智慧化转型,助力医联体医疗服务均质化发展。 在大模型场景下,MaaS平台(见下图)通过整合大模型+云+网+算力+数据资源,对下进行资源、模型、数据的纳管调度,对上以开放平台的形式提供行业应用数字平台的接口,配套提供区块链、安全配套等能力和技术服务支撑。 平台展示并提供AI模型、数据、应用、算力等资源情况。支持模型广场、算法仓、工具链、资源广场、系统管理等平台核心模块的导航入口。支持TAB页切换的方式动态展示热门的模型、工具和应用,支持模型、工具、应用的简介。支持按照区域进行资源池信息查看,选择某个资源池后,展示该资源池下总体的算力和存力的情况。支持用户创建模型微调的训练任务、查看训练任务列表、查看任务详情、查看训练运行详情、查看训练日志、将训练完成的模型发布为新模型。 5.知识中台 基于大模型、检索增强生成(RAG,Retrieval Augmented Generation)等技术,通过构建知识中台,形成知识生产、知识组织、知识应用等核心能力,提升整体知识获取、处理、运营效率,满足医疗场景中业务决策、知识支撑等业务需求。 知识中台的基础技术包括了知识图谱,自然语言处理和多模态信息的综合应用。这些技术能够以PaaS调用方式对外提供服务,支撑知识中台的高级产品形态和外部系统应用。 1)知识图谱:机器认知世界的基础。机器认知能力的突破,高度依赖大规模知识图谱的运用。知识图谱通过整合企业关联信息,挖掘海量互联网非结构化、半结构化及结构化数据,运用多种智能分析算法,生成全方位洞察,帮助企业打造智能应用。 2)自然语言处理:在知识的加持下,语言理解相关技术能力不断增强,机器也可以逐渐像人一样不断学习、不断进步。通过建立知识增强的语义理解框架,在深度学习的基础上融入知识,机器可以具备人类一样的持续学习能力。通过进一步融入知识、语义理解、以及增强小样本学习能力,机器的阅读理解和对话能力也在迅速增强。 3)图像、语音、视频等多模态信息的综合应用:与人类认知世界的形式类似,机器认知世界时,不仅使用自然语言,也需要综合运用图像、语音、视频等多模态信息处理手段。知识增强的跨模态深度语义理解方法,是通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从“看清”到“看懂”、从“听清”到“听懂”,即图像和语言、语音和语言的一体化理解。融合场景图知识的跨模态语义理解预训练技术,大幅提升了跨模态推理能力。 6.物联网中台 通过建设物联网中泰,连接和管理医院的各类设备,提供数据收集、处理和分析功能,以支持各种应用场景和服务。物联网中台汇聚现有的各个设备管理系统,实现统一管理和数据分析处理。物联网平台整合各部门设备采集通道,统筹建立物联网数据采集体系,实现数据统一采集、汇聚、分析、上报。 平台提供开放式数据汇聚的南向接口,旨在汇聚各式各样的终端设备数据、业务数据和健康数据。南向接口包括通用数据汇聚接口和私有数据汇聚接口两类。 支持终端接入:支持不同厂商、不同型号的终端直接与平台对接,完成终端数据上报。支持终端通过无线、有线等多种网络连接方式接入,可以同时接入固定,移动(3G/4G/5G/NB-IoT)的通信方式。支持设备接入认证功能、设备数据传输加密功能等安全机制。同时支持对终端接入进行认证,对终端身份进行合法性校验,非法终端拒绝接入。 支持平台接入:支持不同行业、不同厂家的垂直应用管理平台与平台对接,完成终端或应用平台数据上报。平台接入支持HTTP/HTTPS协议。支持对平台接入进行认证,对平台身份进行合法性校验,非法平台拒绝接入。 7.元宇宙中台 场景化的验证是医疗人工智能验证中最为难于实现的环节,医疗安全和质量的约束导致在真实场景中很难实现试错。通过数字孪生和数字原生模型的加持,可实现医疗人工智能场景“元宇宙”。 建设医疗人工智能应用元宇宙中台,承载医疗人工智能应用的虚拟试验,可验证评价人工智能应用的安全性、可靠性、可用性、可维护性,客观评价其性能和应用效益。探索利用数字孪生及元宇宙中台技术打造诊室、患者和医生的数字孪生,探索数字人应用的“三重境界”,从而为远程医疗、互联网医院注入了新的发展动力。通过将线上线下的门诊过程细分成了不同的场景,覆盖挂号、分诊、预问诊、问诊和诊断,以方便在不同场景中分级使用纯数字人、人机混合和医生本人的服务,将简单的信息收集任务交给人工智能,而将诊断交给人机协作完成,从而在保证质量和安全的同时提升效率。 8.区块链隐私计算中台 (1)区块链BaaS 区块链BaaS(Blockchain as a Service)服务模块可以为用户快速构建管理区块链网络服务,实现业务上链,并为用户提供区块链运维、管理、应用开发提供独有的解决方案,降低用户区块链技术使用成本。 区块链BaaS模块分为基础资源、平台管理层、区块链运维管理层以及区块链应用中间层(见下图)。 (2)隐私计算 隐私计算功能包括:计算引擎(机密计算、多方安全计算、联邦学习),计算支撑(任务调度、隐私sql、计算编排与任务管理),计算管理(数据源管理、计算节点管理、日志管理、应用管理、权限管理),公告版(数据目录列表、隐私合约列表)等。 隐私计算总体可以分为三个部分: 第一部分,计算引擎。包括本地服务层和算法层,主要含隐私计算的三大技术方向,多方安全计算引擎、可信执行环境引擎和联邦学习引擎。 第二部分,计算支撑。包括计算调度层、计算表达层和计算管理层。 第三部分,管理界面。包括匿踪查询、联合计算、联合统计、联合建模等功能层,和用户交互界面、API、轻量化界面等客户端层。 当需要发起隐私计算任务的时候,通过平台交互界面创建任务请求,明确所使用的数据、SQL命令、算法、参与方等信息。平台调度组件接收到有关信息后,从算法库中载入所需要执行的统计或机器学习算法及参数,生成相关配置,发给有关的三类参与方。获得配置后,由数据提供方以元数据形式构建输入因子,并将其传输给计算方;计算方根据元数据调用算法执行隐私计算,得到输出因子,反馈给结果使用方。以上流程执行完毕后产生的所有操作和结果,以日志形式由平台记录下来,标记相应任务已执行完毕,完成一个任务的周期。 9.数字基座的实施 数字基座平台通过租赁与购置相结合的方式进行实施,旨在构建高效、安全、智能的医疗健康服务新生态。 (1)租赁与购置相结合,构建多元化硬件设施体系 采取“租赁+购置”的方式,灵活配置人工智能硬件设施。对于核心设备与关键技术,应优先购置,确保技术的先进性与稳定性;对于辅助设备或临时性需求,可通过租赁方式快速部署,满足项目快速推进的需要。这种组合方式将有效降低建设成本,同时提高资源利用效率。 (2)云网边端一体化设计,打造智能化网络架构 充分利用云计算、大数据、边缘计算等技术,构建云网边端一体化的网络架构。通过云计算平台实现数据存储、处理与分析的集中化,通过网络实现信息的高效传输与共享,通过边缘计算实现数据的实时处理与响应。这种架构将大大提升医疗健康服务的智能化水平,为医生提供精准的诊断支持,为患者提供更加便捷、高效的服务。 (3)1+N场景布局,实现场景与算力的深度融合 按照“1+N”场景布局进行规划与建设。其中,“1”代表核心场景,即医院内部的智能化应用;“N”代表多个拓展场景,包括远程医疗、健康管理、公共卫生等领域。可根据不同场景的需求,合理配置算力资源,实现场景与算力的深度融合。通过这种布局,能够构建一个覆盖全生命周期、全方位医疗健康服务的智能化生态体系。 (4)数据贡献的安全空间保障,确保数据的安全与隐私 在数据贡献方面,应建立严格的数据安全管理制度和技术保障体系。通过数据加密、访问控制、安全审计等手段,确保数据在传输、存储、处理过程中的安全性与隐私性。同时,还将建立数据贡献激励机制,鼓励医疗机构、企业、科研机构等各方积极参与数据共享与贡献,共同推动医疗健康人工智能应用的创新与发展。 通过本方案的实施,可构建一个集租赁与购置、云网边端一体化、1+N场景布局于一体的医疗健康人工智能应用基地。该基地将充分发挥人工智能技术的优势,提升医疗健康行业的智能化水平,为患者提供更加优质、高效、便捷的医疗服务。 10.结语 人工智能数字基座的建设将在算力保障、数据要素利用、场景开放、安全保障、培训推广、监管评价、研发应用一体化等方面形成服务能力。通过实施人工智能数字基座,可为探索人工智能在医疗健康领域的创新应用模式提供助力,从而加速推进医疗健康行业人工智能应用传统模式升级,推动新业态发展壮大,培育以生成式人工智能和大模型应用为代表的未来行业生态,为行业的可持续发展贡献力量。 作者简介:王咸宁(XianningWang),就读于密歇根州立大学(MSU)工程学院。开源IT技术探索者,致力于AI技术在健康和医学中的应用研究。 |