188体育app官网_188体育投注

返回首页

CCF山西大学学生分会协助举办CMAS 2025分论坛“多智能体强化学习”

阅读量:3 2025-07-09 收藏本文

202567日下午,CMAS 2025“多智能体强化学习分论坛在西安电子科技大学会议中心A103会议室成功举办。该分论坛由中国计算机学会(CCF)主办,山西大学计算机与信息技术学院承办,CCF山西大学学生分会协办。CCF杰出会员、山西大学魏巍教授担任论坛主席,并与西南财经大学杨新教授共同主持了本次论坛。论坛邀请了来自清华大学、上海交通大学、天津大学、四川大学、中南大学等高校的专家学者,围绕多智能体强化学习领域的前沿动态开展深入探讨,聚焦技术突破、应用场景与未来趋势,为该领域的发展注入新动能。


1 嘉宾合影

论坛首先由魏巍教授介绍背景。他指出,多智能体强化学习作为一种群体智能的重要方法,已在游戏AI、无人系统等领域取得初步应用成果。随着大模型、具身智能与AI Agent技术的快速发展,多智能体强化学习领域仍然面临具身任务难泛化、复杂场景难协作、动态场景难建模、交互数据难收集、奖励函数难设计等挑战,为此,本次论坛聚焦多智能体强化学习这一前沿议题,汇聚顶尖专家深入探讨技术演进路径。通过思想碰撞与经验分享,推动多智能体强化学习的快速发展,为人工智能发展注入创新动能。


2 CCF 杰出会员、山西大学魏巍教授主持

在报告环节,天津大学郝建业教授带来了题为《具身智能大模型Scaling Law》的特邀报告。他首先从语言和多模态大模型的背景和基础讲起,介绍了当前具身智能大模型所面临的挑战和学习范式,并介绍了课题组在具身智能大模型方面的相关研究工作。

3天津大学郝建业教授作《具身智能大模型Scaling Law》特邀报告(左);魏巍教授为郝建业教授颁发感谢牌(右)

东南大学罗彪教授作了题为《强化学习智能优化控制与决策》特邀报告,介绍了课题组在强化学习在优化控制与决策等方面的相关研究成果。报告从控制理论技术演进出发,从自动化角度阐述了强化学习方法。这些研究成果不仅具有重要的理论价值,也为强化学习在智能制造、工业控制等领域的实际应用提供了新的技术路径。

4 罗彪教授作《强化学习智能优化控制与决策》特邀报告(左);魏巍教授为罗彪教授颁发感谢牌(右)

四川大学郭宏亮副研究员作了《离散环境下的多机器人可靠性决策》特邀报告,并分享了课题组188体育投注:机器人在离散环境中的可靠性导航与移动目标搜索研究的最新进展,同时展示了课题组在无人车路径规划、交通路网可靠最短路径规划及多机器人移动目标搜索三大核心场景展开的相关研究,这些成果为解决大规模下的多智能体系统所面临的不确定性挑战提供了新思路。

5 四川大学郭宏亮副研究员作《离散环境下的多机器人可靠性决策》特邀报告(左);杨新教授为郭宏亮副研究员颁发感谢牌(右)

上海交通大学温颖副教授作了题为《面向大模型智能体的强化学习》的特邀报告。他在报告中探讨了大模型的数据再生产过程,并从大语言模型的任务环境、奖励信号及算法等多个角度,阐述了如何用多智能体强化学习来激发大语言模型的认知与元认知能力,提升了大语言模型智能体的泛化能力和决策任务性能。

6 上海交通大学温颖副教授作《面向大模型智能体的强化学习》特邀报告(左);杨新教授为温颖副教授颁发感谢牌(右)

清华大学赵昊助理教授作了题为《生成式仿真赋能具身智能》的特邀报告,主要汇报了课题组针对具身智能特有的数据需求,将生成式模型应用于仿真环境构建的一系列工作。这些工作通过构建具有丰富物理光学属性的三维四维生成式模型,以其赋能真实感黑盒白盒神经渲染仿真,进一步推进端对端具身智能感知决策算法的进步。

7 清华大学赵昊助理教授作《生成式仿真赋能具身智能》特邀报告(左);杨新教授为赵昊助理教授颁发感谢牌(右)


8 CCF山西大学学生分会成员与会人员合影

本次论坛历时四个小时,魏巍教授对本次论坛进行了总结。通过此次论坛,听众对多智能体强化学习的未来发展产生了许多新的认识,同时也看到了多智能体强化学习理论与应用的潜在融合方式。最后,论坛在一片热烈的氛围中圆满结束。

9 CCF山西大学学生分会成员与CMAS与会专家合影