Tips:
# 仅供 IEMB-1 用户参考。
# 进入登陆服务器页面后,所有命令可直接使用复制粘贴使用。
# 由于内置比对程序,第一步的脚本仅限深夜登录服务器空载时运行!不要有侥幸心理,杨老师 is watching you!
# 在登陆服务器运行第一步的脚本之前,一定要先运行top命令看一下服务器负载状态,一定不要在登录服务器CPU负载率40%以上时硬跑!服务器很娇贵!
# 不要修改脚本生成文件的文件名,可能会导致脚本无法识别文件的问题。
1. 结合端粒信息,统计基因组GCdepth
推荐使用基因组组装及过滤(2):Gapclose、去除短片段及细菌污染的中间文件XX.scaffolds.gt500.fasta作为输入的基因组文件。如果端粒结构未知,可以先尝试进行基因组组装及过滤(1):搜寻基因组端粒结构。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
# ln -s yourReads.R1.fastq ./
# ln -s yourReads.R2.fastq ./
# ln -s yourAssembly.fasta ./
# 以'XX.scaffolds.gt500.fasta'作为输入基因组文件为例
# 5'端的端粒结构为CCCCAAAA,3'端端粒结构为TTTTGGGG
# 二代双端测序数据文件分别为'reads.R1.fastq'和'reads.R2.fastq'
# 二代双端测序数据也可以是压缩文件格式如'reads.R1.fastq.gz'和'reads.R2.fastq.gz'
# 使用'nohup'命令运行脚本
nohup /apps/users/andrew/littletools/assembly_GCdepth_stat.sh XX.scaffolds.gt500.fasta CCCCAAAA TTTTGGGG reads.R1.fastq reads.R2.fastq &
# 获得5幅'png'格式的GCdepth组合散点图,下载到本地查看
# 图片中可以根据颜色区分包含端粒的情况,主图中的圆圈表示点的密度
# 综合GCdepth信息,指定GC%和depth的过滤标准(即分别设定一个cutoff值,将GC%高于GC%的cutoff值的contigs,和depth低于depth的cutoff的contigs删掉)
|