在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:PARL开源软件地址:https://gitee.com/paddlepaddle/PARL开源软件介绍:
特点可复现性保证。我们提供了高质量的主流强化学习算法实现,严格地复现了论文对应的指标。 大规模并行支持。框架最高可支持上万个CPU的同时并发计算,并且支持多GPU强化学习模型的训练。 可复用性强。用户无需自己重新实现算法,通过复用框架提供的算法可以轻松地把经典强化学习算法应用到具体的场景中。 良好扩展性。当用户想调研新的算法时,可以通过继承我们提供的基类可以快速实现自己的强化学习算法。 框架结构PARL的目标是构建一个可以完成复杂任务的智能体。以下是用户在逐步构建一个智能体的过程中需要了解到的结构:Model
Algorithm
Agent
提示: 请访问教程 and API 文档以获取更多关于基础类的信息。 简易高效的并行接口在PARL中,一个修饰符(parl.remote_class)就可以帮助用户实现自己的并行算法。以下我们通过 #============Agent.py=================@parl.remote_classclass Agent(object): def say_hello(self): print("Hello World!") def sum(self, a, b): return a+bparl.connect('localhost:8037')agent = Agent()agent.say_hello()ans = agent.sum(1,5) # run remotely and not comsume any local computation resources 两步调度外部的计算资源:
如上图所示,真实的actor(橙色圆圈)运行在CPU集群,learner(蓝色圆圈)和remote actor(黄色圆圈)运行在本地的GPU上。对于用户而言,完全可以像写多线程代码一样来实现并行算法,相当简单,但是这些多线程的运算利用了外部的计算资源。我们也提供了并行算法示例,更多细节请参考IMPALA, A2C and GA3C。 安装:依赖
pip install parl 算法示例
|
请发表评论