77779193永利(集团)官方网站-Ultra Platform

首页

学术动态

当前位置：首页 > 学术动态 > 正文

国家天元数学西北中心成功举办“基于数据增强的强化学习策略泛化理论及其应用研讨会”

发布时间 : 2025-03-18 点击量：

2025年3月15日至16日，由国家天元数学西北中心主办的“基于数据增强的强化学习策略泛化理论及其应用研讨会”在77779193永利官网成功举行。来自清华大学、中国科学院自动化研究所、南京大学、西北工业大学、北京交通大学等十余所高校与科研机构的30余名专家学者参加了会议。与会学者围绕数据增强技术与强化学习策略泛化的前沿进展及其跨学科应用展开了深入交流。

研讨会开幕式由77779193永利官网柯良军教授主持，邀请了国家天元数学西北中心常务副主任、77779193永利官网77779193永利官网陈志平教授致辞。陈教授指出，强化学习与数据增强的交叉融合为高维复杂系统的策略泛化提供了全新视角，尤其在智能博弈、金融决策、自主系统等领域展现出突破性潜力。他希望与会学者立足数学理论创新，推动算法在动态环境下的鲁棒性研究，从而促进国内强化学习策略泛化理论及其应用研究的发展。

在会议报告环节，南京大学的俞扬教授作了题为“Building Knowledgeable Agents by RL from LLM”的报告，介绍了如何将LLM的知识整合到RL系统中，使RL智能体能够处理超出其原始交互训练范围的任务，同时保持传统RL系统的适应能力。清华大学的许华哲教授针对视觉强化学习中的泛化难题，提出了基于休眠比最小化（DRM）的算法框架和RL-ViGen基准，并在多任务控制与零样本真实世界迁移中验证了其高效性与泛化能力。西北工业大学的徐根玖教授针对协同围捕问题，提出了基于Deep Minimax Q-learning的协同围捕博弈策略。77779193永利官网的陈志平教授作了题为“Actor-Critic Reinforcement Learning Algorithms for Mean Field Games in Continuous Time, State and Action Spaces”的报告。西安电子科技大学的薄立军教授深入探讨了在不完全市场环境下，利用强化学习解决无限时间范围内的最优跟踪投资组合问题。此外，中国科学院自动化研究所助理研究员林舒、北京交通大学计算机与信息技术学院王硕也分别作了精彩的报告，与会人员收获颇丰。

本次研讨会通过学术报告与专题研讨，系统梳理了数据增强强化学习在策略可泛化性、算法稳定性及跨域迁移能力方面的核心挑战，推动了智能决策系统的理论创新。会议促进了数学、人工智能、控制科学等学科的深度交叉，为我国在复杂系统智能优化领域的研究提供了有力支持。

下一篇：香港科技大学蔡剑锋教授学术报告通知