本發明提供一種處理用戶空間文件系統故障的方法、系統、設備和存儲介質,方法包括:動態獲取集群中所有計算節點的列表,并根據列表向所有計算節點分發守護程序;通過守護程序檢測計算節點的管理進程狀況是否正常,響應于計算節點的管理進程狀況正常,通過守護程序檢測計算節點的用戶空間文件系統掛載點是否失效;響應于計算節點的用戶空間文件系統掛載點正常,通過守護程序檢測能否通過用戶空間文件系統掛載點訪問分布式文件系統文件;以及響應于不能通過用戶空間文件系統掛載點訪問分布式文件系統文件,取消用戶空間文件系統掛載點并重新掛載。本發明能夠極大的提升Hadoop集群運維效率,減少計算資源浪費,提升用戶對Hadoop集群的滿意度。
聲明:
“處理用戶空間文件系統故障的方法和裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)