开放期刊系统

基于强化学习的医院运输机器人自主避障研究

张 乐宇, 黄 一展

摘要

针对医院室内运输场景中人员密集、环境动态变化、障碍物类型复杂等问题,传统运输机器人避障技术存在适应性差、
决策滞后等局限。本文提出一种基于改进深度 Q 网络(DQN)的医院运输机器人自主避障方法,通过构建融合医院场景
特征的强化学习框架,优化状态空间、动作空间与奖励函数,实现机器人在复杂环境下的实时避障决策。首先,基于医院
实地调研数据与 ROS 搭建高保真场景仿真平台;其次,引入动态权重因子改进 DQN 算法,提升模型对突发障碍物的响应
速度;最后,通过仿真测试与实地实验验证算法性能。结果表明,该方法在医院常见场景下的避障成功率达 96.7%,平均
避障决策时间缩短至 0.19s,优于传统 A * 算法与基础 DQN 算法,可为医院运输机器人的智能化应用提供技术支撑。

关键词

强化学习;医院运输机器人;自主避障;深度 Q 网络

全文:

PDF


参考

[1] 刘朝阳 , 程维国 . 多措并举提高机器人在医院物流的

运营效率 [J]. 中国物流与采购 ,2025,(10):67-68.

[2] 姜朋 . 基于强化学习的室内移动机器人避障策略研

究 [D]. 浙江大学 ,2023.

[3] 李明 , 王强 . 医院运输机器人避障技术现状与展望 [J].

机器人技术与应用 ,2022,35 (4):45-52.

[4] 宋海荦 . 基于多模态深度强化学习的移动机器人避

障方法研究 [D]. 中国科学技术大学 ,2021.

[5] 鲁志 , 刘莹煌 , 张绪坤 , 等 . 融合 A* 与 DWA 算法的

移动机器人动态避障研究 [J]. 电子测量技术 ,2025,48(8):34-

45.

[6] 曾 俊 杰 , 秦 龙 , 徐 浩 添 , 等 . 基 于 内 在 动 机

的 深 度 强 化 学 习 探 索 方 法 综 述 [J]. 计 算 机 研 究 与 发

展 ,2023,60(10):2359-2382.

[7]Mnih V,,Kavukcuoglu K,Silver D,et al. Human-level

control through deep reinforcement learning[J]. Nature, 2015,

518(7540): 529-533.

[8]Van Hasselt H,Guez A,Silver D. Deep reinforcement

learning with double q learning[C]. Proceedings of the AAAI

conference on Artificial Intelligence. 2016, 30: 2094-2100.

[9]Wang Z, Schaul T, Hessel M, et al. Dueling network

architectures for deep reinforcement learning[C]. International

Conference on Machine Learning. PMLR, 2016: 1995-2003.

[10] Schaul T,Quan J,Antonoglou I, et al. Prioritized

experience replay[J]. arXiv preprint arXiv: 1511.05952, 2015.


(5 摘要 Views, 26 PDF Downloads)

Refbacks

  • 当前没有refback。