基于时延Q学习的机器人动态规划方法Dynamic Planning Method Based on Time Delayed Q-Learning
庄 夏 国家自然科学基金支持
计算机科学与应用 Vol.7 No.7, July 25 2017, PDF, HTML, XML DOI:10.12677/CSA.2017.77078 被引量
基于分布式Q学习的Femtocell两层网络功率控制方法Power Control for Femtocell Two-Tier Networks Based on Distributed Q-Learning
宁海芹, 潘沛生
无线通信 Vol.3 No.1, , PDF, , DOI:10.12677/HJWC.2013.31001 被引量
对带熵的随机线性二次最优控制问题的收敛性证明The Proof of the Convergence of Stochastic Linear Quadratic Optimal Control Problem with Entropy
舒 心
理论数学 Vol.13 No.3, March 30 2023, PDF, HTML, XML DOI:10.12677/PM.2023.133071 被引量
带熵的随机线性二次最优控制问题Linear Quadratic Optimal Control Problem with Entropy
应用数学进展 Vol.11 No.12, December 23 2022, PDF, HTML, XML DOI:10.12677/AAM.2022.1112931 被引量
结合趋势的深度强化学习股票交易策略Deep Reinforcement Learning Stock Trading Strategies Combining Trends
何祁栋
计算机科学与应用 Vol.12 No.3, March 22 2022, PDF, HTML, XML DOI:10.12677/CSA.2022.123068 被引量
时间尺度多样性结合强化学习促进囚徒困境博弈中的合作Time Scale Diversity Combined with Reinforcement Learning to Promote Cooperation in Prisoner’s Dilemma Game
李卓君, 王书博, 杨 梅, 程贞敏
运筹与模糊学 Vol.14 No.1, February 18 2024, PDF, HTML, XML DOI:10.12677/ORF.2024.141012 被引量
一种基于增强学习的飞行自组网地理路由协议A Geographic Routing Protocol for FANETs Based on Reinforcement Learning
杨 斌, 王辛果 科研立项经费支持
计算机科学与应用 Vol.12 No.2, February 17 2022, PDF, HTML, XML DOI:10.12677/CSA.2022.122030 被引量
云环境下基于AI知识分析的负载均衡方法Load Balancing Based on AI Knowledge Analysis in Cloud Environment
李 莹, 刘 忻, 邱 洋, 武 扬
计算机科学与应用 Vol.12 No.8, August 24 2022, PDF, HTML, XML DOI:10.12677/CSA.2022.128208 被引量
基于强化学习的多智能体系统一致性跟踪控制算法Reinforcement Learning-Based Consensus Tracking Control Algorithm for Multi-Agent Systems
刘人志
计算机科学与应用 Vol.15 No.4, April 29 2025, PDF, , XML DOI:10.12677/csa.2025.154110 被引量
基于自激原理的负载倒立摆的摆起与稳摆Swing-Up and Stability Control Method of Loaded Inverted Pendulum Based on Self-Excitation Principle
张 呈, 王 冰, 袁少强 科研立项经费支持
动力系统与控制 Vol.11 No.4, October 27 2022, PDF, HTML, XML DOI:10.12677/DSC.2022.114018 被引量