强化
-
南洋理工发布量化交易大师TradeMaster,涵盖15种强化学习算法
近日,量化平台大家庭迎来了一位新成员,基于强化学习的开源平台: TradeMaster— 交易大师。 TradeMaster 由南洋理工大学开发,是一个涵盖四大金融市场,…
-
研究表明强化学习模型容易受到成员推理攻击
译者 | 李睿 审校 | 孙淑娟 随着机器学习成为人们每天都在使用的很多应用程序的一部分,人们越来越关注如何识别和解决机器学习模型的安全和隐私方面的威胁。  …
-
首次引入!用因果推理做部分可观测强化学习
这篇《Fast Counterfactual Inference for History-Based Reinforcement Learning》提出一种快速因果推理算法,使得因…
-
清北联合出品!一篇Survey整明白「Transformer+强化学习」的来龙去脉
Transformer模型自发布后,很快就成了自然语言处理和计算机视觉领域在有监督学习设置下的主流神经架构。 虽然Transformer的热潮已经开始席卷强化学习领域,但由于RL本…
-
七个流行的强化学习算法及代码实现
目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。 这些算法已被用于在游戏、机器人和决策制定等各种应用中,并且这些流行的…
-
强化学习中的Transformer发展到哪一步了?清华、北大等联合发布TransformRL综述
强化学习(RL)为顺序决策提供了一种数学形式,深度强化学习(DRL)近年来也取得巨大进展。然而,样本效率问题阻碍了在现实世界中广泛应用深度强化学习方法。为了解决这个问题,一种有效的…
-
Transformers+世界模型,竟能拯救深度强化学习?
很多人都知道,当年打败李世石、柯洁等一众国际顶尖棋手的AlphaGo一共迭代了三个版本,分别是战胜李世石的一代目AlphaGo Lee、战胜柯洁的二代目AlphaGo Maste…
-
强化学习的起源:从老鼠走迷宫到AlphaGo战胜人类
谈到强化学习,很多研究人员的肾上腺素便不受控制地飙升!它在游戏AI系统、现代机器人、芯片设计系统和其他应用中发挥着十分重要的作用。 强化学习算法有很多不同的类型,但主…
-
西山居AI技术专家黄鸿波:游戏中强化学习与行为树融合实战
2022年8月6日-7日,AISummit 全球人工智能技术大会如期举办。在7日下午举办的《人工智能前沿探索》分论坛上,西山居AI技术专家黄鸿波带来了《游戏中强化学习与行…
-
从Transformer到扩散模型,一文了解基于序列建模的强化学习方法
大规模生成模型在近两年为自然语言处理甚至计算机视觉带来的巨大的突破。最近这股风潮也影响到了强化学习,尤其是离线强化学习(offline RL),诸如 Decision Transf…