本發明提出了一種基于自適應編碼順序的DNA測序質量分數無損壓縮方法,主要解決現有質量分數壓縮方法預測模型不夠準確導致壓縮率偏低的問題。其實現方案為:1)通過兩個編碼壓縮塊P1和P2提取FASTQ文件中的質量分數數據和堿基數據;2)計算第一編碼壓縮塊P1所提取文件中每行質量分數的均值并進行量化,得到M×1的行均值矩陣F;3)統計編碼字符的上下文信息、堿基信息和行均值信息,4)設置兩個標識符C和D,并對3)統計的信息統一量化,以構建編碼模型;5)用編碼模型驅動自適應算數編碼器,并采用蛇形編碼順序沿相關性最強的方向對第一編碼壓縮塊P1進行遍歷壓縮。本發明提高了壓縮效率,可用于基因數據的存儲與傳輸。
聲明:
“基于自適應編碼順序的DNA測序質量分數無損壓縮方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)