本發明公開一種基于故障數據建模的HPC可靠性評估方法,包括以下步驟:對目標系統的所有故障單元,進行故障數據采集;基于故障嚴重等級,對采集到的故障數據進行故障分類,將故障數據分為嚴重故障數據與非嚴重故障數據;篩除與失效無關的非嚴重故障數據;選定時間區間,將該時間區間內的所有嚴重故障數據作為采樣樣本,采用最大似然估計法,計算weibull分布參數,獲得該時間區間內的目標系統的失效時間分布模型;計算時間區間上的目標系統的MTTF,即weibull分布的特征值;根據不同時間區間的目標系統的MTTF變化,評估目標系統的可靠性變化特征。本發明能夠真實反映系統運行中的可靠性指標,可以在線分析出系統在不同時間段的可靠性水平,指導系統容錯和日常運維。
聲明:
“基于故障數據建模的HPC可靠性評估方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)