此前推出首个数字大脑多模态决策大模型填补国内空白

近日,上海数字脑研究院(以下简称“数字研究院”)推出首个数字脑多模态决策大模型(简称DB1),填​​补了国内该领域的空白,进一步验证了文本中的预训练模型,在图文、强化学习决策、运维优化决策等方面的应用潜力。目前DB1代码已经开源,项目链接:. 此前,MADT()/MAT()等多智能体模型是由数研所团队提出的。在一些离线大模型中,通过序列建模,该模型在一些单/多智能体任务中取得了显着的效果,并在该研究方向继续使用。

过去几年,随着预训练模型的兴起,学术界和工业界在预训练模型的参数量和多模态任务等方面都取得了新的进展。它被认为是通向通用人工智能的重要路径之一。专注于决策智能研究的数学研究所创新性地尝试将预训练模型的成功复制到决策任务中,并取得了突破。

此前,GATO 的推出将单智能体决策任务、多轮对话、图文生成任务统一为一个基于单一的自回归问题,并在 600 多个不同的任务上取得了良好的性能,表明序列预测可以解决了一些简单的强化学习决策问题,从侧面验证了数研所决策预训练模型研究方向的正确性。

这一次,数研所推出的DB1在很多方面都超越了Gato。DB1的参数数量达到了12.1亿,在参数方面已经尽可能接近Gato;实验任务数达到870个,比Gato提升了44.04%,整体性能有所提升。2.23%;可以看出,DB1的整体性能已经达到了与Gato相同的水平,开始向更贴近实际业务的需求域演进,很好地解决了NP-hard TSP问题欧创知识付费平台,而Gato则没有朝这个方向探索。

图片[1]-此前推出首个数字大脑多模态决策大模型填补国内空白-东山资源库

可以看出,DB1的整体性能已经达到了与Gato相同的水平,开始向更贴近实际业务的需求域演进,很好地解决了NP-hard TSP问题,而Gato之前没有往这个方向走。探索。

DB1(右)和GATO(左)指标对比

图片[2]-此前推出首个数字大脑多模态决策大模型填补国内空白-东山资源库

DB1在强化学习模拟环境下的多任务性能分布

与传统的决策算法相比,DB1在跨任务决策能力和快速迁移能力方面有很好的表现。在跨任务决策能力和参数量方面,实现了从单个复杂任务的千万级到数十亿级参数到多个复杂任务的数十亿级参数的飞跃,并持续增长,具备能力解决复杂的业务环境。足够的能力解决实际问题。在迁移能力上,DB1完成了从智能预测到智能决策、从单智能体到多智能体的跨越欧创知识付费平台,弥补了传统方法在跨任务迁移上的不足,让构建大型模型成为可能企业内部。

目前,国际、国内领先的企业和研究机构,如、、Meta、华为、百度、达摩院等都对多模态大模型进行了研究,并进行了一定的商业化尝试,包括在自身产品中的应用或提供模型API和相关行业解决方案。相比之下此前推出首个数字大脑多模态决策大模型填补国内空白,数学研究所更关注决策问题,支持游戏AI决策任务、运筹学优化TSP求解任务、机器人决策控制任务、黑盒优化求解任务和多轮对话应用程序尝试的任务。

不可否认的是,目前的多模态决策预训练模型DB1虽然取得了一定的成绩,但是仍然存在很多问题,比如跨域任务的采样权重敏感、跨域知识迁移困难、长效难等。序列建模,对专家数据的依赖性强。. 虽然挑战很多,但在现阶段看来,多模态决策模型就是要实现决策代理从游戏到更广泛的场景,从虚拟到现实,进行独立的感知和决策- 在真实的开放动态环境中制作,最终达到更通用的目的 人工智能的重点探索方向之一。在将来,

© 版权声明
THE END
点赞5 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片