本刊推荐:本文创新性地提出一种融合深度确定性策略梯度(DDPG)与改进利希滕伯格算法(ILA)的双层路径规划架构,有效解决了植保无人机在复杂农田场景中的动态避障与静态覆盖优化问题。研究通过多奖励机制设计加速DDPG收敛,结合ILA优化航向角控制 ...
本文旨在探索DDPG算法如何解决连续动作控制难题,从而进一步提升生物工程领域AI驱动的医疗机器人的强大功能。 引言 想象一下,你正在手术过程中控制着一台机械臂。此机械臂的离散动作可能有: 在这些情况下,你需要的不仅仅是选择一个动作——你必须 ...
股票交易策略在投资公司中起着至关重要的作用。然而,在复杂多变的股票市场中获取最优策略颇具挑战。本文探索深度强化学习在优化股票交易策略以实现投资回报最大化方面的潜力。选取 30 只股票作为交易标的,其每日价格作为训练和交易的市场环境。
【摘要】[目的]智能航行控制系统作为智能船舶的大脑和中枢,其控制性能的好坏直接决定船舶航行的安全性和经济性,因此需要对船舶智能航行控制系统进行验证。面向智能船舶智能航行控制系统的验证问题,提出一种通用型验证平台——变稳船。[方法]首先 ...
[导读]“双碳”背景下 ,光储充电站逐渐成为未来充电站的一种主流形式 。为提高光储充电站的经济效益并降低二 氧化碳 排放 ,提出了一种基于改进深度强化学习的光储充电站实时控制策略 。首先 ,建立以碳排放最小与运行成本最低为目标的优化 模型并将其转换 ...
10月10日至10月13日,IEEE车载技术会议(IEEE Vehicular Technology Conference)在中国香港举行。由西南交通大学信息科学与技术学院作为第一单位的论文“DDPG-based Multi-AP Cooperative Access Control in Dense Wi-Fi Networks”荣获大会唯一的最佳学生论文奖(IEEE VTC2023-Fall ...
在本文中,我们将介绍在 Reacher 环境中训练智能代理控制双关节机械臂,这是一种使用 Unity ML-Agents 工具包开发的基于 Unity 的模拟程序。我们的目标是高精度的到达目标位置,所以这里我们可以使用专为连续状态和动作空间设计的最先进的Deep Deterministic Policy ...