本發明提供一種按需派送車輛的路徑規劃方法及裝置。該方法包括:獲取待分析的訂單數據;將所述訂單數據輸入到雙階段強化學習預測模型中,得到所述雙階段強化學習預測模型輸出的車輛配送路徑規劃策略;其中,所述雙階段強化學習預測模型是基于預設的樣本訂單數據、所述樣本訂單數據對應的配送路徑規劃策略及其結果迭代訓練得到;所述雙階段強化學習預測模型包括:用于進行操作算子選擇的算子選擇器以及用于進行操作算子作用路徑選擇的路徑選擇器。采用本發明按需派送車輛的路徑規劃方法,能夠基于雙階段強化學習預測模型引入深度強化學習的方法指導啟發式操作在策略空間中進行高效搜索,提高了按需派送車輛的路徑規劃的效率和準確度。
聲明:
“按需派送車輛的路徑規劃方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)