先新建一个project文件夹
然后新建一个id文本,将要下载的SRA number放进去
直接cat >id 然后把下载好的accession list复制黏贴到命令行
然后ctrl+c就可以了,然后输入cat id,确保已经输入
安装sratoolkit
直接安装失败的话,可以先搜索一下sratoolkit哪个版本能安装
然后直接安装这个版本
conda install -c https://conda.anaconda.org/daler sratoolkit
如果这个版本失败了
可以在这个rna环境或者新环境下安装prefetch和aspera,注意我写的版本!prefetch或者aspera版本太高太低了都不行,一定要合适!这是我试过的能成功的版本,其他版本不太清楚
conda install sra-tools=2.9.6 -y
conda install -c hcc aspera-cli=3.7.7
然后使用prefetch 来下载数据
因为数据很大,可以挂在后台下载,用()表示就是挂在后台下载
cat id |while read id ;do (prefetch $id &);done
然后开始下载
如何查看任务进程
top -c
ps -ef
直接查看prefetch任务 ps -ef |grep prefetch
也可以进行删除不想下载的进程任务:kill +第二行的编码(4158等)
如果想要直接删除全部下载任务,则可以使用
ps -ef |grep prefe|awk '{print $2}
ps -ef |grep prefe|awk '{print $2}' |while read id ;do kill $id;done
那下载成功的数据都放在哪里呢?
cd ~/ncbi/public/sra/
然后一定要查看清楚下载的数据大小是否正确,如果大小不正确,很可能是下载错误了,需要删除后重新下载。