本發明公開了一種基于糾錯的基因組測序數據無損壓縮方法及相關設備,所述方法包括:識別并糾正原始測序短片段中的測序堿基錯誤,并記錄堿基錯誤信息,所述堿基錯誤信息包括測序錯誤的堿基位置及原堿基;將原始測序短片段歸類到糾正后的索引區域文件中,并將測序錯誤糾正信息加入到索引區域文件中;對不同的索引區域文件內原始測序短片段中的堿基序列進行排序并進行壓縮,得到基因組測序數據的壓縮結果文件。本發明實現了高效的測序短片段測序錯誤的糾正,通過糾正堿基當中的測序錯誤,使得更多相似測序短片段被分配到同一桶中,進而提高了后續桶內測序短片段的壓縮效率,通過記錄糾正測序短片段中的桶索引序列,實現對基因組測序數據的無損壓縮。
聲明:
“基于糾錯的基因組測序數據無損壓縮方法及相關設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)