
赵铭慧,硕士
南开大学人工智能学院,实验师
天津市智能机器人技术重点实验室,机器人与信息自动化研究所
教育与工作经历
2013.09-2017.07 |
东北林业大学 |
机电工程学院 |
工学学士 |
2017.09-2020.06 |
南开大学 |
人工智能学院 |
工学硕士 |
2020.07-今 |
南开大学 |
人工智能学院 |
实验师 |
研究方向
深度学习、强化学习、智能博弈、装配序列规划
科研项目
1.急性颅脑技术研究,国家级项目,课题负责人,40万元。
2.面向大规模场景博弈技术研究,横向课题,项目负责人,40万元。
3.基于MAPPO的分布式多智能体训练算法研究,横向课题,项目负责人,30万元。
论文著作
期刊:
1.李博文, 王臆淞, 赵铭慧*, 骞晨旭, 程光权, 张雪波. 面向智能空中博弈的风险约束离线强化学习算法. 控制与决策, 2026, 41(6): 1665-1675.
2.王臆淞, 赵铭慧*, 张雪波. ASM2:面向海空联合场景的多对手多智能体博弈算法, 控制理论与应用, 2025, 42(07): 1275-1284.
3.J. Zhang, M. Zhao*, C. Qian, X. Zhang. IOS-RAFS: Intelligent Opponent Selection Training Framework via Fuzzy Logic-based Switching between “Rule-AI” Dual Strategy Libraries. Guidance, Navigation and Control, 2025, 5(3): 345–360.
4.赵铭慧, 张雪波, 郭宪, 欧勇盛. 基于分层强化学习的通用装配序列规划算法, 控制与决策, 2022, 37(4) : 861-870.
5.M. Zhao, X. Guo*, X. Zhang, Y. Fang, Y. Ou. ASPW-DRL: assembly sequence planning for workpieces via a deep reinforcement learning approacheces, Assembly Automation, 2019, 40(1): 65-75.
会议:
1.Y. Wei, L. Li, M. Zhao, C. Qian, X. Zhang. DTHV-PPO: A UAV Control Method with Dynamic Task Goal Adaptation and High-Value Experience-Guided Replay Based on PPO. 2025 44th Chinese Control Conference (CCC). 2025: 2771-2777.
2.S. Luo, M. Zhao*, Z. Zhao, L. Li, S. Zhang and X. Zhang. FT-TF: A 4D Long-Term Flight Trajectory Prediction Method Based on Transformer. 2023 42nd Chinese Control Conference (CCC). 2023: 4616-4621.
3.M. Zhao, X. Guo, X. Zhang. Key Frame Extraction of Assembly Process Based on Deep Learning. IEEE 8th Annual International Conference on CYBER Technology in Automation, Control, and Intelligent Systems, Tianjin, China, 2018: 611-616.
标准:
1.作为组长单位组织编写团体标准《智能兵棋推演系统算法与模型技术要求》。
教学与指导成果
1.2026,腾讯开悟人工智能全球公开赛,智能体决策算法北部赛区决赛一等奖(总决赛进行中)。
2.2025,第十三届中国工业智能挑战赛,全国一等奖。
3.2024,第十二届中国工业智能挑战赛,全国一等奖。
4.2024,第八届全国兵棋推演大赛-智能空中博弈算法挑战赛,全国一等奖。
5.2023,第七届全国兵棋推演大赛-智能空中博弈算法挑战赛,全国一等奖、优秀算法奖。
6.2023,第十一届中国工业智能挑战赛,全国特等奖。
联系方式
E-mail:zhaomh@nankai.edu.cn