在庆祝香港回归祖国28周年之际,招商局狮子山人工智能实验室面向全球发布并开源自研智能体(以下简称“Agent”)强化学习训练推理系统——Lionrock-Zero(以下简称“L0系统”)。
该系统大幅降低了Agent强化学习过程的人为干预,有效解决了当前主流系统对提示词工程和复杂系统编排的高度依赖问题,成功让模型产生探索、验证与记忆等自学能力,有望开启智能体研发应用的自主进化新篇章,推动人工智能特别是自主式智能体(Agentic AI)领域的长足进步。
在智能体出现之前,以GPT系列和ChatGLM系列为代表的生成式人工智能(Generative AI),核心能力是根据提示生成内容,无法主动发起任务,无法与外部世界真实交互,更无法实现持续目标跟进。Agent的诞生,标志着人工智能迈出了从“被动生成”到“主动执行”的第一步。Agent是在大语言模型这个“大脑”的基础上,增加了感知、推理和行动的能力,形成“感知-思考-行动”的闭环 ,更为重要的是被赋予使用工具的能力。
在L0系统研发过程中,团队创造性提出结构化Agent框架——Notebook-Agent(简称“NB-Agent”),使Agent不再只是简单地执行指令,而是能够理解一个模糊的、高层次的目标,并自主地将其分解、规划、分配给“团队”内的不同“角色”,并通过动态沟通和反馈来调整策略,最终完成任务。
同时,L0系统仅通过RLVR学习范式,就能引导Agent从零开始,逐步学会规划、探索、验证和记忆,最终自主形成具备解决复杂问题的多轮推理能力。
Lionrock-Zero系统架构图
L0系统相关工作开源后,收获AI领域专家、学者以及广大社区开发者的好评。硅基流动(SiliconFlow)创始人兼首席执行官袁进辉(中国机器学习开源框架的最早开拓者)表示,“在AI技术日趋封闭的当下,L0系统的全面开源树立了全新标杆。不仅核心算法与架构详尽开放,其训练数据、完整管线乃至模型训练细节亦无私共享。”他认为,此项目将为全球研究者提供极具价值的公共知识财富。著名科技媒体“量子位”表示,L0系统使得Agent不再是生硬地调用工具,而是真正理解了怎么利用代码和这个世界交互,展现了通往更高级通用智能的清晰路径。
下一步,招商局狮子山人工智能实验室将继续保持“夜以继日、通宵达旦、放手一搏、奔赴星辰”的创业者姿态,在具身智能和Agentic-AI前沿领域勇攀科技高峰、引领行业技术发展,并为集团“第三次创业”和数智科技产业培育注入强劲动能。
正规股票配资官网,股市如何加杠杆,山西股票配资网站提示:文章来自网络,不代表本站观点。