开放期刊系统

基于强化学习的医院运输机器人自主避障研究

张乐宇, 黄一展

摘要

针对医院室内运输场景中人员密集、环境动态变化、障碍物类型复杂等问题，传统运输机器人避障技术存在适应性差、
决策滞后等局限。本文提出一种基于改进深度 Q 网络（DQN）的医院运输机器人自主避障方法，通过构建融合医院场景
特征的强化学习框架，优化状态空间、动作空间与奖励函数，实现机器人在复杂环境下的实时避障决策。首先，基于医院
实地调研数据与 ROS 搭建高保真场景仿真平台；其次，引入动态权重因子改进 DQN 算法，提升模型对突发障碍物的响应
速度；最后，通过仿真测试与实地实验验证算法性能。结果表明，该方法在医院常见场景下的避障成功率达 96.7%，平均
避障决策时间缩短至 0.19s，优于传统 A * 算法与基础 DQN 算法，可为医院运输机器人的智能化应用提供技术支撑。

关键词

强化学习；医院运输机器人；自主避障；深度 Q 网络

全文:

PDF

镜像

参考

[1] 刘朝阳 , 程维国 . 多措并举提高机器人在医院物流的

运营效率 [J]. 中国物流与采购 ,2025,(10):67-68.

[2] 姜朋 . 基于强化学习的室内移动机器人避障策略研

究 [D]. 浙江大学 ,2023.

[3] 李明 , 王强 . 医院运输机器人避障技术现状与展望 [J].

机器人技术与应用 ,2022,35 (4):45-52.

[4] 宋海荦 . 基于多模态深度强化学习的移动机器人避

障方法研究 [D]. 中国科学技术大学 ,2021.

[5] 鲁志 , 刘莹煌 , 张绪坤 , 等 . 融合 A* 与 DWA 算法的

移动机器人动态避障研究 [J]. 电子测量技术 ,2025,48(8):34-

45.

[6] 曾俊杰 , 秦龙 , 徐浩添 , 等 . 基于内在动机

的深度强化学习探索方法综述 [J]. 计算机研究与发

展 ,2023,60(10):2359-2382.

[7]Mnih V,,Kavukcuoglu K,Silver D,et al. Human-level

control through deep reinforcement learning[J]. Nature, 2015,

518(7540): 529-533.

[8]Van Hasselt H,Guez A,Silver D. Deep reinforcement

learning with double q learning[C]. Proceedings of the AAAI

conference on Artificial Intelligence. 2016, 30: 2094-2100.

[9]Wang Z, Schaul T, Hessel M, et al. Dueling network

architectures for deep reinforcement learning[C]. International

Conference on Machine Learning. PMLR, 2016: 1995-2003.

[10] Schaul T,Quan J,Antonoglou I, et al. Prioritized

experience replay[J]. arXiv preprint arXiv: 1511.05952, 2015.

(17 摘要 Views, 49 PDF Downloads)

Refbacks

当前没有refback。

用户名
密码
记住我