如何在NCBI中下载SRA数据?

背景介绍
假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。
目前,在NCBI中下载SRA数据主要有三种方式:
  • 利用Aspera工具下载。
  • 利用SRA Toolkit下载。
  • 利用wget命令直接下载。
    小编的个人经验:第一种Aspera工具在批量下载时偶尔会出错。第二种SRA Toolkit的prefetch命令下载,只能将数据下载到home目录下。关于前两种方法网上有很多详细的介绍,感兴趣的朋友们可以自行搜索,我们今天主要来介绍第三种wget命令的方式,这种方法的关键是找到SRA数据对应的ftp地址。
获取ftp地址
进入NCBI网页后,按如下步骤操作:
  • Step1.设置NCBI的分类为:SRA
  • Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
  • Step3.点击右上角的Send to
  • Step4.在Choose Destination中选择File
  • Step5.在Format输入栏选择RunInfo
  • Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。

     

wget命令
接下来呢,用wget命令下载SRA数据,有两种方式:
下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载:
wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run-4/ERR635048/ERR635048.1
若想批量下载这个样本的四个SRA数据,可以将这四个ftp地址整合到一个文件中(如文件名为list.txt)。

利用wget函数,-i 参数给出文件的名字
wget -c 50 -i list.txt
小编总结
如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?get了这个技能,你就可以原地休息啦!
生物信息学

基于甲基化评估肿瘤纯度R包-InfiniumPurify

2020-8-28 4:13:19

生物信息学

网络可视化R包-geomnet

2020-8-28 4:21:24

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索