本發明涉及一種基于復雜抽樣和改進決策森林算法的化合物致癌毒性預測方法,適用于根據有機小分子結構信息對該化合物進行計算致癌毒性評價和虛擬篩選。首先對分子結構分子采用相關力場進行優化并進行電荷計算,對初始訓練集中的化合物進行復雜抽樣用于訓練子集的產生,并根據復雜抽樣算法結果固定描述符的組成計算分子中的各種相關描述符;然后使用基于相關矩陣分析和因子分析方法優化描述符池;最后使用改進的決策森林方法對訓練集分子的致癌毒性數據和及其相應化學表征進行數據挖掘,得到分類的預測可信區間,致癌毒性預測模型和判斷規則。該方法在高通量虛擬篩選和計算致癌毒性評價中具有良好應用前景。
聲明:
“基于復雜抽樣和改進決策森林算法的化合物致癌毒性預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)