您当前的位置: 首页 >> 团队成员 >> 正文
赵铭慧 实验师
2022/11/07

   

赵铭慧,硕士

南开大学人工智能学院,实验师

天津市智能机器人技术重点实验室,机器人与信息自动化研究所

教育与工作经历

2013.09-2017.07

东北林业大学

机电工程学院

工学学士

2017.09-2020.06

南开大学

人工智能学院

工学硕士

2020.07-

南开大学

人工智能学院

实验师

研究方向

深度学习强化学习智能博弈装配序列规划

科研项目

1.急性颅脑技术研究,国家级项目,课题负责人,40万

2.面向大规模场景博弈技术研究,横向课题,项目负责人,40万

3.基于MAPPO的分布式多智能体训练算法研究,横向课题,项目负责人,30万

论文著作

期刊

1.李博文, 王臆淞, 赵铭慧*, 骞晨旭, 程光权, 张雪波. 面向智能空中博弈的风险约束离线强化学习算法. 控制与决策, 2026, 41(6): 1665-1675.

2.王臆淞赵铭慧*张雪波. ASM2:面向海空联合场景的多对手多智能体博弈算法控制理论与应用2025, 42(07): 1275-1284.

3.J. Zhang, M. Zhao*, C. Qian, X. Zhang. IOS-RAFS: Intelligent Opponent Selection Training Framework via Fuzzy Logic-based Switching between “Rule-AI” Dual Strategy Libraries. Guidance, Navigation and Control, 2025, 5(3): 345–360.

4.赵铭慧, 张雪波, 郭宪, 欧勇盛. 基于分层强化学习的通用装配序列规划算法, 控制与决策, 2022, 37(4) : 861-870.

5.M. Zhao, X. Guo*, X. Zhang, Y. Fang, Y. Ou. ASPW-DRL: assembly sequence planning for workpieces via a deep reinforcement learning approacheces, Assembly Automation, 2019, 40(1): 65-75.

会议:

1.Y. Wei, L. Li, M. Zhao, C. Qian, X. Zhang. DTHV-PPO: A UAV Control Method with Dynamic Task Goal Adaptation and High-Value Experience-Guided Replay Based on PPO. 2025 44th Chinese Control Conference (CCC). 2025: 2771-2777.

2.S. Luo, M. Zhao*, Z. Zhao, L. Li, S. Zhang and X. Zhang. FT-TF: A 4D Long-Term Flight Trajectory Prediction Method Based on Transformer. 2023 42nd Chinese Control Conference (CCC). 2023: 4616-4621.

3.M. Zhao, X. Guo, X. Zhang. Key Frame Extraction of Assembly Process Based on Deep LearningIEEE 8th Annual International Conference on CYBER Technology in Automation, Control, and Intelligent Systems, Tianjin, China, 2018: 611-616.

标准:

1.作为组长单位组织编写团体标准《智能兵棋推演系统算法与模型技术要求》。

教学与指导成果

1.2026,腾讯开悟人工智能全球公开赛,智能体决策算法北部赛区决赛一等奖(总决赛进行中)。

2.2025,第十三届中国工业智能挑战赛,全国一等奖。

3.2024,第十二届中国工业智能挑战赛,全国一等奖。

4.2024,第八届全国兵棋推演大赛-智能空中博弈算法挑战赛,全国一等奖。

5.2023,第七届全国兵棋推演大赛-智能空中博弈算法挑战赛,全国一等奖、优秀算法奖。

6.2023,第十一届中国工业智能挑战赛,全国特等奖。

联系方式

      E-mail:zhaomh@nankai.edu.cn