基于强化学习的医院运输机器人自主避障研究
摘要
决策滞后等局限。本文提出一种基于改进深度 Q 网络(DQN)的医院运输机器人自主避障方法,通过构建融合医院场景
特征的强化学习框架,优化状态空间、动作空间与奖励函数,实现机器人在复杂环境下的实时避障决策。首先,基于医院
实地调研数据与 ROS 搭建高保真场景仿真平台;其次,引入动态权重因子改进 DQN 算法,提升模型对突发障碍物的响应
速度;最后,通过仿真测试与实地实验验证算法性能。结果表明,该方法在医院常见场景下的避障成功率达 96.7%,平均
避障决策时间缩短至 0.19s,优于传统 A * 算法与基础 DQN 算法,可为医院运输机器人的智能化应用提供技术支撑。
关键词
全文:
PDF镜像
|参考
[1] 刘朝阳 , 程维国 . 多措并举提高机器人在医院物流的
运营效率 [J]. 中国物流与采购 ,2025,(10):67-68.
[2] 姜朋 . 基于强化学习的室内移动机器人避障策略研
究 [D]. 浙江大学 ,2023.
[3] 李明 , 王强 . 医院运输机器人避障技术现状与展望 [J].
机器人技术与应用 ,2022,35 (4):45-52.
[4] 宋海荦 . 基于多模态深度强化学习的移动机器人避
障方法研究 [D]. 中国科学技术大学 ,2021.
[5] 鲁志 , 刘莹煌 , 张绪坤 , 等 . 融合 A* 与 DWA 算法的
移动机器人动态避障研究 [J]. 电子测量技术 ,2025,48(8):34-
45.
[6] 曾 俊 杰 , 秦 龙 , 徐 浩 添 , 等 . 基 于 内 在 动 机
的 深 度 强 化 学 习 探 索 方 法 综 述 [J]. 计 算 机 研 究 与 发
展 ,2023,60(10):2359-2382.
[7]Mnih V,,Kavukcuoglu K,Silver D,et al. Human-level
control through deep reinforcement learning[J]. Nature, 2015,
518(7540): 529-533.
[8]Van Hasselt H,Guez A,Silver D. Deep reinforcement
learning with double q learning[C]. Proceedings of the AAAI
conference on Artificial Intelligence. 2016, 30: 2094-2100.
[9]Wang Z, Schaul T, Hessel M, et al. Dueling network
architectures for deep reinforcement learning[C]. International
Conference on Machine Learning. PMLR, 2016: 1995-2003.
[10] Schaul T,Quan J,Antonoglou I, et al. Prioritized
experience replay[J]. arXiv preprint arXiv: 1511.05952, 2015.
(5 摘要 Views, 26 PDF Downloads)
Refbacks
- 当前没有refback。