AI与具身智能体:协同重构科研范式

来源:韦豪创芯 #韦豪创芯# #AI# #具身智能体#
6357

导言

根据托马斯·库恩的《科学革命的结构》,范式是一种普遍认可的科学成就,奠定了某一科学共同体(如物理学家、生物学家群体)在特定时期内共同接受的理论体系、方法论与价值标准的集合,为一个领域的快速发展提供了共识基础和快速发展的保障。

而范式的转换往往由一系列重大发明或理论更新来推动。如地心说到日心说的转变、经典物理到量子力学的转变、工业革命、计算机科学与互联网等。范式过渡的时间甚至可以按世纪计算。

我们当下正在经历的,便是由AI for Science(人工智能驱动的科学研究)所驱动的新一轮范式重构。

当我们在谈及人工智能对科研领域的重大贡献时,话题不会局限于软件算法。如果要将AI带来的数据成果落实到实操层面,Tangible(现实)的实验室环境内也必须匹配同等重要的硬件设施,也就是具身智能体。

人工智能在科研领域的垂直大模型,与客制化具身智能体,这两者间的软硬件协同,整合而成的平台型协同体(下文简称协同体),才能够推动各行业领域科学研发的加速与颠覆。

垂直领域大模型

自ChatGPT和Deepseek的崛起以来,自然语言问答的AI工具已经为我们的生活带来了极大的便利。在以月份为单位的时间跨度中,我们对这一工具的认知已从新奇惊讶转变为了理所当然。

所有这些AI工具都是基于通用大模型来建立,通用大模型的知识面覆盖极广,适用人群偏向普通群众,有广度但欠缺深度。与此同时,为满足各个专业细分领域的具体需求,“垂直模型”的发展也从未落下。

与通用大模型相比,垂直模型以深度为优先,训练数据需求低但训练语料集中。通过学习指定领域的结构化数据,参数量级从通用的千亿级缩减至十亿或百亿级,训练成本更低,成型时间更快,可以为特定的细分领域服务,直接满足业务需求、驱动业务决策。

行业案例:

生物医药

新药研发的创新严重依赖无数科学家漫长的尝试和实验过程。要发现一款药物,需要上百名科研人员高频次次的科学实验和累计百万小时的工作时间,一个分子结构往往需要经过成百上千次的验证,整个研发流程所需的成本也将高达数亿美元。

如果将药物分子式的研发工作由生成式的垂直模型进行,则可以极大缩短分子式、药物的发现周期,节省人工成本和实验成本,全面提高研发效率。

一个合格的药物研发垂直模型,应当可以完成自动文献检索、文献匹配、自动设计合成路径、逆合成分析、评估分子式有效性与合成难度、成本核算、原料库匹配度等工作。

而根据药物种类和实验室场景的区别,垂直模型可以进一步细分拓展,例如小分子和大分子分别的合成、纯化、实验场景,每个单一研发步骤都值得训练对应的垂直模型。多条药物研发流程将会发展成多个独立垂直模型的流程整合。

半导体

半导体的研发、制造、检测领域,都对AI垂直模型有着很高的需求。

例如在模拟芯片EDA领域,通过对已有版图设计和不同软件间工艺移植数据的学习,相关垂直模型可以做到对所需版图的自动生成、将已完成电路转化为用于芯片制造的版图、协助工程师完成布局和布线、自动完成不同软件间的格式转换。

目前,AI EDA工具行业尚处在早期阶段。美国的头部EDA企业均有对针对性AI工具的布局,国内也有企业正致力于开发自动化AI EDA工具的开发。

在AOI检测领域,传统自动化算法的AOI检测有着很高的误判率,本该替代人工目检的算法,在复杂的检测环境下,反过来还需依赖人工复检,对人力成本的优化有限。

而通过使用更强性能的摄像头组件,结合计算机视觉和深度学习,学习了海量图像语料的AI AOI设备,可以提升检查准确率,一定程度上优化总体效率。当前仅国内,针对无线细分的半导体检测场景,可通过AI算法助力检测设备的企业厂家已全面开花。

化工/材料

与生物医药类似,化工和材料学领域的垂直模型需求,往往也与化合物的生成相关。结合到特定领域,具体研发的内容转变到了高分子材料或催化剂的开发。

除此之外,基于行业的特殊性,部分化工和材料行业会涉及到高危物质和废料处理等场景,这部分场景对AI垂直模型的需求,往往不限于具体化学结构或材料的研发,而是会转变为对工作流程调度的协同,还有无人工作场景的需求。

这类需求会把我们的关注点,从纯软件的AI垂类模型,放宽到新的层面,即【流程优化调度Agent】,还有【具身智能】两个层面。

流程调度Agent与MCP

 流程Agent

从上述几个简要的行业案例看,我们可以发现,即便垂直模型可以从软件层面提升科研步骤的效率,这些效率提升往往停留在某几个工作节点上,业务与业务之间尚未打通。

以制药行业为例,一款药物研发工序会涉及不同科研人员间的协作,也涉及多个步骤的时间调度。

因此针对复杂业务动线的整合就显得必不可少。流程调度类的AI模型(即Agent),不需要对任一研发垂类模型的细节有所了解,但必须对医药研发的全局工序有所掌握,并能够实现工作流设计、研发周期时间表调度、科研人员日程调度、实验室闲忙管理、监控运维助手、关键节点预估等智能工作流需求。

 MCP

MCP即Model Context Protocol(模型上下文协议),是一种开源协议,用于集成AI模型与外部数据、各类工具间的集成和多向互联,成为一个高效的信息枢纽。

通俗来讲,MCP可以理解成AI软件层面的USB转接口,实现本地数据和云数据的互联、新兴AI工具与传统IT工具的互联、各个AI工具模型之间的互联,突破应用程序和AI模型之间的数据孤岛,实现本地文件、数据库、Web 服务的无缝交互,从而抹除平台壁垒,极大提升工作效率。

MCP Architecture (Credits: Pieces for Developers)

OpenAI已经宣布对MCP协议的全面支持,我国许多互联网企业和人工智能科技企业也在加码对MCP协议的应用。

垂直模型的其他应用

专精的垂直模型几乎可以应用到所有行业,在科研领域之外,垂直模型也拥有广阔的应用前景。

如金融领域有专门处理量化数据、财务报表和提供投资决策建议的垂直模型。法务领域有可以自动分析案件、批量处理卷宗、辨识协议的垂直模型。

在动植物学界,有集成了物种多样性数据平台的图像识别助手,用于识别野外拍摄到的动植物,可快速分析出所摄物种的所属类目信息。

游戏领域,当前的AI应用主要还集中在图像与视频生成等单一场景。在关卡设计、内容策划、复杂交互、代码编写等层面暂无可用方案。据国内某头部游戏企业反馈,部分游戏公司也在通过场外调研、投资初创公司、追踪技术发展等形式,寻求可能的应用突破口。

前沿物理领域,笔者访谈了加州某大学的物理学博士,据悉在这一领域暂无代表性的垂直模型或AI工具。物理和数学可能会是AI最后的攻坚地。

局限性

1. 除去小部分极端领域未触及的缺口,垂直领域模型和通用大模型一样,易受到“幻觉”的干扰,可能会向使用者提供没有根据的编纂内容,或提供错误的反馈。这样的缺陷,在AI工具替使用者节省大量时间的同时,又向使用者提出了更严苛的专业要求和辨识能力要求。

AI工具的产出质量是否经得起考验?对应的科研成果与学术论文到底能让“科学受益”,还是让“科学家受益”,这样的争论一直存在。

2. 另一方面,AI工具的稳定性也开始遭受考验,7月19日有开发者反馈,开发协作平台Replit出现数据库遭到删除和掩盖的恶性事故,使用者数十次的自然语言命令并没有得到模型的正确响应。这样的生产事故标志着现有AI工具尚存在不稳定和不可控的风险;当前市面上百花齐放的工具与平台,并不一定都具备完备的安全措施或回滚机制;开发者对自身AI产品的安全性和稳定性上,还有相当大的优化空间,而这一部分的优化是需要人工干预和微调的,暂不能期待AI的自主优化。

3. 在道德伦理的规范层面,AI工具的界限同样仰赖于开发者的调校,且AI工具的伦理标准受限于开发者本身的认知与立场限制。这套标准还会受到开发者所在的国家主体的各类法规限制或公序良俗影响,也会遭到地缘政治与意识形态博弈的干涉。

就通用大模型而言,部分海外知名头部模型,对涉及政治正确或犹太人的相关冒犯性内容上有着极端严格的审查标准,但这类保护性审查限制在当时并未覆盖亚洲人和非洲人。部分模型对于完全一致的生成内容,如果描述主体在美国两大党派之间切换时,其自主规制条件也会发生灵活松动。

延伸到专有垂直模型层面,不同行业也有着针对性的伦理或安全风险评估。例如训练语料是否掺入知识产权敏感信息,导致产出结果侵犯他人专利;化工反应链路的成果,可能会和特定的环保原则、排放标准产生冲突;在自动驾驶或危险生产环境,如果AI决策造成了人身危害事故,责任归属的界定可能会引发争议等等。

这些问题不但需要宏观上道德法制的跟进完善,也依赖于每个特定行业内相关标准的有效执行与更新。

从垂直模型到具身智能

本文截止目前,主要都在阐述垂直模型相关的纯软件领域。然而对于科研场景,特别是实际研发环节和实验室环节,仅靠软件层面产出的数据结果,并不能有效驱动科研效率的提升或研发流程的进化。

务实且有效的效率飞跃,不能仅停留在脑力的辅助,还必须触及体力的替代。因此我们要引入下一个主题,即具身智能体的应用领域。

具身智能强调通过机器人实体进行感知、行动、决策,需结合匹配的AI工具,是AI for Science概念从纯软件系统向现实世界拓展的重要一环。

具身智能体

具身智能的特点

具身智能是新质生产力的重要组成部分,具身智能体在AI大脑的指挥下,需要自主感知复杂的环境,自主完成学习和任务执行。其涉及学科广泛,包括人工智能、机器人科学、认知科学、传感技术等。

针对不同的行业,以及行业内的细分使用场景,机器人的表现形态、功能组件、智能化程度都会有很大的不同,这也能显示出具身智能定制化这一题材,拥有潜力巨大的发展空间和市场空间。

核心部件及进阶发展

具身智能体要实现感知、行动、决策这三大需求,需要其各个感知元件、行动部件和匹配算法的协同支持,即“多模态融合感知技术”,需要机器人的视觉、听觉、触觉感知高度协同,模拟人类感知,从多维度收集并融合多种模态的数据,同时理解外部环境并进行融合分析,以完成决策。多模态数据如何进行融合对齐、交互理解,也是具身智能需要深入钻研的重要课题。

部分具身智能体所需的关键零部件如下:

1. 视觉传感器

为了满足感知这一基础需求,机器人需要配备多种视觉传感器,不同于人类仅需双眼即可满足日常生活。受限于活动关节角度、传感器配置限制、算法算力限制等情况,具身智能体需要较多的视觉传感器和摄像头。按使用场景的不同,可能需要配置观察使用环境的视觉摄像头、用于测量距离的TOF摄像头、机械臂上针对细致操作的摄像头等等。

针对进阶需求,机器人也会配备不可见光、雷达等其他传感器。

2. 机械臂

机械臂是具身智能体最基础也是最必备的原件。其性能和可活动关节数等因素,决定了机器人在应用场景中的灵活度。除了活动功能,其表面也需要整合基础的触觉感应,以便在运行中避开障碍磕碰,不损伤其本身或场景,更不能伤害场景中的工作人员。

3. 抓手

机械抓手(机械爪)用于机械臂末端的精细执行操作,按使用场景的需求,存在二爪、三爪等多种制式。仿生的五指灵巧手也存在,但当前对现实应用的落地能力有待考证。机械爪的灵敏度和制作材料也需要适配使用场景,如涉及玻璃等易碎易坏物品时,机械爪力需要整合力反馈功能。如针对危废工厂的场景,机械爪需要选用低成本易替换的材质。

机械爪的进化方向,包括多维度力测量、霍尔效应触觉传感器、摄像头视觉感知、柔性表面等等。

4. 移动底盘

在部分应用场景,如科研实验室等环境内,机器人需要配备移动底盘以拓展可触及范围。拥有移动能力的具身智能体被称作多用途柔性机器人,能够极大拓展应用纵深。

按照某大型制药企业的反馈,同样具备感知能力和机械臂的机器人,是否拥有移动能力将决定机器人的应用场景。不可移动的机器人更适合量产场景,可作为固定工作站的一部分。而可移动的机器人才能胜任研发环境,以针对科研环境内更灵活的应用环境。

移动底盘本身除去最基本的移动功能,还需要集成独立的自动巡路、路线规划、智能避障等功能,不占用机器人主要功能的算力,因此也需要集成各类传感器和计算能力。

5. IOT协同

在实验室环境中,具身智能体需要与场景内的许多实验仪器实现互动,较为务实的方案是将已有的设备接入IOT网络,将各个设备读取的如温度、重量等信息传递至移动机器人的数据云端,以此产生协同。

这一方案仅需对现有的实验器材进行最低限度的调整,不用为了铺设机器人而大幅调整现有实验环境,从而改变工作流程,影响人员工作习惯,产生本末倒置的负面影响。

6. VLA模型

VLA模型不是具体的物理部件,而是一种延伸至物理空间的模型,即视觉-语言-动作模型(Vision-Language-Action Models,简称VLA)。过往的机器人、人工智能协同模式下,视觉、语言、动作系统是相互独立的。VLA模型通过整合上述各个核心零部件,能够理解复杂的图像和语言命令,提高机器人的能动性,让机器人拥有对应复杂实时场景的能力。

市场环境与投资机会

市场规模分析

AI大模型及具身智能体作为当前最热门的两大领域,可融合的场景过于宽泛,因此其总体市场规模的预测失去了实际意义。但若集中于科研领域,我们可以通过某些维度的信息进行粗略的了解。

通过截取相关产业上市公司晶泰科技、已申报公司镁伽科技公开的招股说明书,我们可以大致列出部分细分领域的市场体量,具体如下,仅供参考,不具备投资决策价值:

针对上文提到的AI EDA领域,根据Mordor Intelligence数据,2023年中国模拟芯片市场规模为3026.7亿元,预计2024年将达到3175.8亿元。参考2021-2024年国内模拟IC设计行业上市公司数据,粗略估计模拟芯片版图和电路设计软件对应的市场规模约为190亿元。Gartner在2023年发布的半导体技术趋势报告中提到,AI/ML在EDA工具中的渗透率约为10% - 15%(覆盖布局、验证等环节),并预测到2026年将增长至30%以上,预计到2026年AI EDA对应的国内市场将达到约60亿元。

海内外市场行情

基于上文提到的市场空间,在全球范围内,各行业的研发环节都会对AI垂直模型+具身智能体的协同体产生海量需求。

中国拥有全世界最大最全甚至唯一的全产业工业体系,网络上,部分网友用“工业克苏鲁”来形容中国大陆的工业实力对全世界的碾压。在可预见的未来,具身智能体产业将由中国大陆主导,海外部分头部企业和高校会对掌握部分高端技术,但难以弥补工业体系存在的鸿沟。

因此,海外需求方也将把目光集中到国内,国内拥有特定领域专长的企业,也能因此获得较好的订单机会。

对国内开发者和初创公司来说,由于国内市场的客户习惯,纯算法或模型的软件产品,很难具备盈利水平,许多企业因此被动发展出硬件开发能力,这种软硬件结合的能力可以让企业在面对客户时拥有更好的综合优势与议价权。

而面对海外客户,单纯的软件产品也能拥有更好的销售机会。如果要与海外客户签订硬件产品的订单,则很考验企业的跨境运维支持能力。

合作生态

在AI垂直模型和机器人算法的科研场景中,产业上下游各角色的特征,决定了合作生态。

1. 产业方

行业龙头企业和跨行业集团,这类企业一般对终端消费者输出产品。如3C数码产品与汽车等厂商、互联网巨头、制药厂、科研机构和高校等角色。

其中部分具有综合研发实力的科技属性综合企业,一般都会对自身的流水线做定制化智能开发,也拥有一定的AI开发实力。这类公司对AI模型与具身智能体整合属于可预见事项。然而这类企业的整合成果,大多用于满足内部生产需求,与其内部流程高度集成,不会作为对外生产的产品,也缺乏配合客户做定制化的动力。

部分单一领域龙头企业,如制药厂和化工厂,可能积累了庞大的生产数据,可以作为AI训练的语料,但不一定具备垂直模型的开发能力或执行力,具身智能体的启动门槛更是高于模型训练。

因此,对于非头部科技企业、大部分单一领域龙头、规模非顶级的企业、规模中小型的科研单位,为了拥有整合了AI模型的机器人研发平台(协同体),必须向外部开发者寻求支持。

2. 开发者/初创公司

拥有AI模型训练能力和机器人硬件整合能力的公司,有机会在这一轮范式重构的热潮中获取战略机会。

许多拥有开发需求但缺乏能力和动力的大型企业,一旦获得能实际落地的协同体,几乎可以在落地瞬间立刻提升工作效率(因为无论何种程度的优化和自动化都能带来效益提升)。这种协同体的软硬件定制化需求都非常高,需要贴合产业方的流程和生产惯例,且一旦落地之后,产业方自然会持续性的寻求优化迭代和新需求落地,且轻易不会更换供应商。

因此,开发者若是能抓住指定的细分领域,只要与单个颇具规模产业方形成合作关系,就能够保证自身的存活能力,如果能借助初始的产业方客户完成首单落地,那么通过贴身服务和长期磨合积累的宝贵经验,会助力开发者站稳脚跟。

部分产业方甚至愿意开放自身的生产数据,与开发者共同开发/委派开发者训练更有针对性的垂类模型。这也将成为开发者可贵的成长经验。

3. 模组厂、元件厂

对于纯专注于机器人硬件产品的机械厂商(模组厂),当前的重点应当从通用领域转入具体细分场景,聚焦某一集中的市场方向。细分领域所需的应用场景相对单一,需要感知的环境和设备相对标准化。相比通用场景和更复杂的消费场景,垂直场景的协同体应用将更容易落地。因此专精于特定小场景的开发者,往往会比执着于通用场景的开发者拥有更好的发展机会。如果能与提供匹配AI工具的企业结盟联合,则有机会获得更好的成长空间。这种情况下,速度和实绩就成为了能否成功的关键。

对于机器人核心零部件的研发机构,其针对特定部件的产品能力和技术深度必然优于模组厂,这类企业如果可以直接与开发者建立联系,则能够为开发者带来技术优势,可以与开发者共同服务于产业方客户。

总结

优势

1. AI for Science的热潮下,AI垂直模型能够为研发环节带来全面的效率提升,从整体流程、单个研发环节、对高端科研人员的人力解放层面都大有裨益,这种优势是不可逆的。

从事相关协同体产品的企业不但坐拥赛道本身的市场空间,在迫切的需求和外溢效应下,协同体可以进一步挖掘存量市场的改造升级需求。对于被解放的人力成本,其原先对应的市场规模也可以计入开发者的营收之内。

2. AI大模型和工具的发展会快于具身智能体的发展,而AI行业的持续发展将会倒逼机器人行业迭代更新,从而弥补智能协同体在实际物业环境中的短板。两者高度相关又相辅相成,可以形成互相促进的螺旋形进化趋势。

3. 中国大陆基于产业门类全、规模大、对新技术导入的态度积极,就算面对垂直场景,也能够产生出相当大的市场体量,支撑发展和迭代。而发达的机电供应链,对于机器人本体的快速性能迭代与成本下降也提供了有力保障。

只要能够实现快速落地并产生即时的经济效益,国内的具身智能体行业将获得持续性的快速发展。

挑战

1. 反过来需要注意,产业的极端发达也意味着产能过剩和内卷。随着AI大模型热潮与具身智能体热潮的叠加,智能机械工业可能很快就会面临拥挤,不正当的竞争会将成本杀到很低的区间。短期内该行业大概率会进入红海阶段,重蹈光伏和碳化硅的覆辙。反映在投融资市场上,针对具身智能体领域的行业风口可能会非常短暂,后入局的玩家有可能会承担较大的回报压力。

2. 与短期内卷同时发生的,将会是中长期的高端瓶颈。现阶段的具身智能体产业还有许多亟待解决的技术问题,机械关节强度、电池续航能力、散热能力、传感器精度、触觉灵敏度、极端场景特化等等方面都存在大小不一的门槛。

这些高精尖的技术突破可能只会掌握在极少数头部大厂或科研机构的手中。且必须正视尖端领域尚存的技术差距,有些关键性的技术发明中长期还会由国外企业和高校掌控。这意味着中低端具身智能体在供大于求的同时,高端具身智能体市场会十分紧俏甚至出现空挡。

如何实现特定细分领域的领先、如何在中低端市场内守好护城河,将会是从业者很快要面临的现实问题。

3. 纵观本篇全文,AI大模型的开发、具身智能体的落地,都对开发者有着极高的专业领域知识需求,甚至是相关行业的多年从业实践需求。如果欠缺对应领域的实操经验,那么协同体的开发就缺失根基,并随时会面临失败的风险。未来,同时拥有AI大模型训练能力和行业专精背景的复合型人才,将会是这一领域的中流砥柱。

展望

AI垂直模型与具身智能体的整合是多维度且互相缠绕的,能够在软硬件协同&人机协同的新工作流模式中,引发生产力的指数级上升。AI for Science的概念会逐渐向Agent for Science,乃至具身智能for Science的方向进化,最终转化为全新的、尚未被人总结概括出的全新科研范式。在这一范式的实现过程中,产业方、开发者、模组部件厂商、投身于该赛道的投融资机构,只要能抓住机遇,都有机会享受到发展带来的红利。

而无论结果如何,这种科研进步带来的时代红利,最终还会融入到每个人的生活中。正如疫苗、空调、冰箱、现代物流、互联网等科技进步给普通人带来的红利一样,未来的人自然会能够享受到比前人更优质又更具性价比的生活品质。

在这波变更与迁移的时代浪潮中,每个人都会是见证者和受益者。


责编: 爱集微
来源:韦豪创芯 #韦豪创芯# #AI# #具身智能体#
THE END
关闭
加载

PDF 加载中...