一、gzip解壓NR庫的時候,報錯格式違法的解決方法
1、檢查NR庫文件是否下載正確
NR 庫文件應該是 gz 格式的,如果文件格式不正確,會導致解壓失敗。檢查一下下載的 NR 庫文件是否正確。如果不正確,嘗試重新下載。
2、使用工具比對文件校驗和值是否相同
文件在傳輸或下載過程中可能會發生損壞,也可能導致解壓失敗。嘗試重新下載 NR 庫文件,或者下載同樣的文件來比較校驗結果。在下載 NR 庫文件之后,可以使用 MD5 校驗和工具或 SHA1 校驗和工具來比對文件校驗和值是否相同。
3、確認解壓命令的正確性
如果下載的 NR 庫文件沒有問題,則應該確認解壓命令的正確性。在解壓命令中指定正確的參數,例如 “-d” 告訴 gzip 解壓縮源文件并將解壓縮的文件放入目標目錄中。
二、Linux gzip命令
1、簡介
Linux gzip命令用于壓縮文件。gzip是個使用廣泛的壓縮程序,文件經它壓縮過后,其名稱后面會多出”.gz”的擴展名。
2、語法
gzip [-acdfhlLnNqrtvV][-S <壓縮字尾字符串>][-<壓縮效率>][--best/fast][文件...] 或 gzip [-acdfhlLnNqrtvV][-S <壓縮字尾字符串>][-<壓縮效率>][--best/fast][目錄]
參數:
-a或–ascii:使用ASCII文字模式。-c或–stdout或–to-stdout:把壓縮后的文件輸出到標準輸出設備,不去更動原始文件。-d或–decompress或—-uncompress:解開壓縮文件。-f或–force:強行壓縮文件。不理會文件名稱或硬連接是否存在以及該文件是否為符號連接。-h或–help:在線幫助。-l或–list:列出壓縮文件的相關信息。-L或–license:顯示版本與版權信息。-n或–no-name:壓縮文件時,不保存原來的文件名稱及時間戳記。-N或–name:壓縮文件時,保存原來的文件名稱及時間戳記。-q或–quiet:不顯示警告信息。-r或–recursive:遞歸處理,將指定目錄下的所有文件及子目錄一并處理。-S<壓縮字尾字符串>或—-suffix<壓縮字尾字符串>:更改壓縮字尾字符串。-t或–test:測試壓縮文件是否正確無誤。-v或–verbose:顯示指令執行過程。-V或–version:顯示版本信息。-<壓縮效率>:壓縮效率是一個介于1-9的數值,預設值為”6″,指定愈大的數值,壓縮效率就會愈高。–best:此參數的效果和指定”-9″參數相同。–fast:此參數的效果和指定”-1″參數相同。3、實例
壓縮文件:
[root@runoob.com a]# ls //顯示當前目錄文件a.c b.h d.cpp[root@runoob.com a]# gzip * //壓縮目錄下的所有文件[root@runoob.com a]# ls //顯示當前目錄文件a.c.gz????b.h.gz????d.cpp.gz[root@runoob.com a]#
接范例1,列出詳細的信息:
[root@runoob.com a]# gzip -dv * //解壓文件,并列出詳細信息a.c.gz:???? 0.0% -- replaced with a.cb.h.gz:???? 0.0% -- replaced with b.hd.cpp.gz:???? 0.0% -- replaced with d.cpp[root@runoob.com a]#
接范例1,顯示壓縮文件的信息:
[root@runoob.com a]# gzip -l * compressed uncompressed ratio uncompressed_name 24 0 0.0% a.c 24 0 0.0% b.h 26 0 0.0% d.cpp
延伸閱讀1:NR庫是什么
NR(Non-Redundant Protein Sequence Database)非冗余蛋白庫,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,對于所有已知的或可能的編碼序列,NR記錄中都給出了相應的氨基酸序列(通過已知或可能的讀碼框推斷而來)以及專門蛋白數據庫中的序列號。NR庫相當于一個以核酸序列為基礎的交叉索引,將核酸數據和蛋白數據聯系起來。