本發明公開了一種基于深度Q網絡的共享單車預測調度方法,包括步驟:1、設計用于模擬共享單車實際調度的仿真環境;2、獲取用戶信息并構建用戶行為數據矩陣;3、訓練由線性回歸模型和SVM模型構成的預測網絡模型;4、結合預測網絡模型訓練基于深度Q網絡的預測調度模型;5利用訓練完成的模型進行實時調度。本發明能夠在缺乏足夠訓練數據的情況下,通過結合線性回歸模型、SVM模型及深度Q網絡的深度強化學習方法提前預測出未來時間段各用車區域的用車需求,從而提前對各用車區域的共享單車實施快捷、合理的調度。
聲明:
“基于深度Q網絡的共享單車預測調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)