本發明提供了一種基于深度強化學習PPO算法的磨削恒力控制方法,該方法首先對球形砂輪磨削過程時的末端執行器進行受力分析,通過力處理獲取真實磨削力;利用深度強化學習PPO算法訓練當前磨削力和預設磨削力之差與末端執行器法向補償位移之間的關系模型,包括訓練數據歸一化預處理、基于歐式距離的獎勵函數設計、針對性深度神經網絡結構設計與促進算法收斂設計;基于PPO算法的控制器訓練與磨削機器人恒力控制器使用。本發明的方法不用提前建立磨削力誤差和法向位移之間的先驗模型,能完成平面磨削和曲面磨削時把磨削力控制在目標磨削力內的任務,同時具有良好的自適應能力。
聲明:
“基于深度強化學習PPO算法的磨削恒力控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)