本發明公開了一種基于共現分析和譜聚類的醫療數據信息檢索方法,對檢索任務詞匯進行查詢擴展,將擴展后的檢索任務詞匯分類為檢索詞、擴展詞和特征詞,對文獻進行首次記分,如果首次得分大于閾值T則選中文獻,小于閾值T則放棄文獻;對選中文獻進行二次計分和共現分析,得到二次得分和共現得分,并通過首次得分、二次得分和共現得分計算文獻的綜合得分;使用詞袋模型將文獻的化學詞列表、醫學主題詞列表、摘要和關鍵詞列表組成描述文獻的向量,以向量距離矩陣作為譜聚類的輸入對選中文獻進行聚類,輸出聚類簇;輸出平均綜合得分最高的那個類作為檢索結果,并對檢索結果中的文獻按綜合得分進行降序排序輸出。
聲明:
“基于共現分析和譜聚類的醫療數據信息檢索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)