本發明涉及一種DNA測序質量分數無損壓縮方法,采用類run-length編碼方法將提取出來的質量分數進行轉換:例如,對于某質量分數A連續出現2次以上相同字符的質量分數串,其出現次數記為n,將該質量分數A的連續出現次數n的相反數-n作為該質量分數串的長度值,以便將該質量分數串轉換為A(-n),并存儲到壓縮文件中,從而壓縮此類質量分數。本發明提出了一種特別面向質量分數的無損壓縮方法,降低了單獨出現的質量分數的編碼量,打破了經典的run-length的數據結構,即質量分數-長度對,適應性的公開了一種新機制來對長度進行變換,使得它與質量分數的值域不相交,且壓縮方面具備高效性能。
聲明:
“DNA測序質量分數無損壓縮方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)