下载数据-RNA-seq上游分析

先新建一个project文件夹

然后新建一个id文本,将要下载的SRA number放进去

直接cat >id  然后把下载好的accession list复制黏贴到命令行

然后ctrl+c就可以了,然后输入cat id,确保已经输入

安装sratoolkit

直接安装失败的话,可以先搜索一下sratoolkit哪个版本能安装

然后直接安装这个版本

conda install -c https://conda.anaconda.org/daler sratoolkit

如果这个版本失败了

可以在这个rna环境或者新环境下安装prefetch和aspera,注意我写的版本!prefetch或者aspera版本太高太低了都不行,一定要合适!这是我试过的能成功的版本,其他版本不太清楚

conda install sra-tools=2.9.6 -y

conda install -c hcc aspera-cli=3.7.7

然后使用prefetch 来下载数据

因为数据很大,可以挂在后台下载,用()表示就是挂在后台下载

cat id |while read id ;do (prefetch $id &);done

然后开始下载

如何查看任务进程

top -c 

ps -ef

直接查看prefetch任务 ps -ef |grep prefetch

也可以进行删除不想下载的进程任务:kill +第二行的编码(4158等)

如果想要直接删除全部下载任务,则可以使用

ps -ef |grep prefe|awk '{print $2}

ps -ef |grep prefe|awk '{print $2}' |while read id ;do kill $id;done

那下载成功的数据都放在哪里呢?

cd ~/ncbi/public/sra/

然后一定要查看清楚下载的数据大小是否正确,如果大小不正确,很可能是下载错误了,需要删除后重新下载。

生物医学科研方法

一个月接受,这本3分多的SCI,值得关注~

2021-1-16 9:44:47

生物医学科研方法

【基础知识】什么,你都还不懂测序?(2)第二代测序

2021-1-16 13:24:28