本發明是一種基于深度強化學習的冶金工業車間天車調度方法,屬于車間天車調度技術領域。本發明包括:(1)獲取冶金車間內天車所在跨區的空間布局,以及歷史天車運輸任務數據表;(2)根據跨區空間布局,以天車作為智能體,以跨區空間作為環境,創建天車調度的深度強化學習模型;(3)根據歷史天車運輸任務數據表,對深度強化學習模型進行參數優化和訓練;(4)定時獲取跨區內當前天車位置、狀態,以及正在執行和待執行的運輸任務情況,生成環境狀態輸入訓練好的深度強化學習模型,生成天車調度方案。本發明針對冶金工業車間內隨機產生或臨時變動的運輸任務,能及時生成全局優化的調度方案,提高天車調度效率,且具有較強的魯棒性和有效性。
聲明:
“基于深度強化學習的冶金工業車間天車調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)