深度强化学习实验室报道
作者:DeepRL
本文作者来自于宾夕法尼亚州立大学,提出了一种使用深度强化学习解决交通问题的方法。
智能交通信号灯控制对于高效的交通系统至关重要。现有的交通信号灯主要由手工制定的规则操作,而智能交通信号灯控制系统应动态调整为实时交通。使用深度强化学习技术进行交通信号灯控制的新兴趋势,最近的研究显示出令人鼓舞的结果。但是,现有研究尚未在现实世界的交通数据上测试这些方法,它们仅专注于研究奖励而不解释策略。而作者提出了一种用于交通信号灯控制的更有效的深度强化学习模型。并在从监控摄像头获得的大规模真实交通数据集上测试了方法。
作者在现有研究方法的基础上提出了使用深度强化学习解决交通控制的方法,整体结构图如下:从图中可以看出右侧使我们熟悉的强化学习的模型结构。在此基础上定义了一些交通控制中的参数
下面是作者提出的模型结构:其中的Q网络结构如下左侧,而经验池的结构如右侧在实验的初始化中,作者设置的相关参数如下在以上模型的基础上,他们针对济南的交通数据进行了相关实验结果如下:原文请详细查看原论文:https://faculty.ist.psu.edu/jessieli/Publications/2018-KDD-IntelliLight.pdf
下面给大家推荐一个我的好朋友,他在学习机器学习技术的同时运营公众:当交通遇上机器学习
重 要 推 荐 !!!
公众号《当交通遇上机器学习》:以各类交通大数据为主线,专注于人工智能,机器学习、深度学习在轨道交通和道路交通的科研前沿与应用~
公众号主要讲述:循环神经网络RNN、LSTM、卷积神经网络CNN、残差网络ResNet、自编码器AutoEncoder图卷积神经网络GCN、Transformer等在各类交通大数据(包轨道交通刷卡数据、国内外出租车GPS数据、国内外共享单车轨迹数据、共享单车订单数据、公交刷卡数据等)领域内的科研前沿与应用现状~
关注公众号:
后台回复“数据”即可获取高达175G的四个月的滴滴GPS数据和滴滴订单数据的获取方式,以及从数据处理(Oracle数据库)、模型构建(机器学习)、编程实现(python)到可视化(ArcGIS)等一系列视频教程和软件安装包。具体请参阅:你想要的交通大数据和学习资料,分享给你!
后台回复“纽约”获取美国纽约10年的出租车轨迹数据以及7年的共享单车轨迹数据。
后台回复“芝加哥”获取美国芝加哥6年的共享单车轨迹数据下载地址。
后台回复“加州”获取美国加州近20年的高速公路交通流量监测数据下载地址。
后台回复“GCN”获取GCN在交通领域内的应用总结PPT。
后台回复“书籍”获取交通领域几本经典pdf书籍,包括城市规划原理,现代交通规划学,交通规划原理。
关于科研,公众号的主要文章列表有:
关于科研生活,公众号的主要文章列表有:
关于投稿,公众号的主要文章列表有: