【对zgtools模块感兴趣的,可联系QQ:1954616586】
【300M-1G基因组,Survey+组装+HIC只需要3-7天】
【300M-1G基因组,T2T组装+Gap填补+端粒延伸修补+评估只需要7-14天】
【收学员,教你怎么写怎么做,学费私】
【个人项目,非开源项目,也有科研咨询服务~】
【有HIC调图教程视频,很详细!需要私,包值】
T2T测序(可以加我好友):
①HIFI 13500一个Cell,保底80g 一般可以测到90g;如果需要测少量的HIFI,即散测。散测费用是建库2000 测序180/g。
②HIC 是一个文库4000 测序10/g;
③ONT 默认N50:100K,目前11000一个Cell,单个Cell产出植物15G,哺乳动物20G以上,水产和昆虫这些暂不承诺。
④二代数据:提取建库110 测序10/G
zgtools达到的T2T水平:
①0 Gap:最基本的要求;
②全端粒:每条染色体末端端粒重复次数大于100次(一般1000次以上比较好);
③全rDNA:有rDNA末端的染色体也完善出端粒;
④全着丝粒:整个基因组准确鉴定着丝粒。
结果文件请见示例【example】,要求作图与结果均达到CNS水平
目前zgtools能做的分析:
0、T2T端粒延伸+Gap填补+T2T纠错+T2T各项评估
1、Survey分析+倍型分析+二代/三代NT比对去污染
2、常规基因组组装/分型基因组组装/T2T基因组组装(端粒延伸、补Gap、全rDNA和动物T2T-Y染色体的PAR区)+各项评估
3、HiCUP评估(HiC小测/HiC大测)+HiC挂载调图+染色体级别基因组生成+HiC热图+未挂载区去冗余+共线性分析+各项评估
4、Subphaser亚基因组分型+亚基因组特有分析(SV分析/等位基因表达不平衡分析/亚基因组优势分析/KaKs差异分析)
5、LAI评估+LTR插入时间分析+LTR-RTs系统发育树(最大似然法)
6、着丝粒预测(优于目前已发表的所有生信鉴定着丝粒软件)
7、重复基因鉴定+KaKs分析+功能富集
8、圈图、基因共线性
9、注释与进化(待更新)
最近更新:
☆GapCloser 2.0(速度再提升)
搭配最新的telomere_repair模块,对于600M基因组,12分钟延伸/修补完的6个不完整末端的端粒,8分钟补完11个Gap并且全有超多reads覆盖补Gap后的区域。
☆端粒延伸/修补(速度非常快,内存消耗小)
测试:900M基因组有6个末端没有端粒,通过检测repeat序列的分布以及鉴定rDNA,将不存在端粒的末端进行分类,使用三代数据/组装序列保证序列高一致性的情况下进行延伸修补。时间花费:半小时;
绘制端粒/rDNA/Gap预览图如下:
注: 端粒/rDNA分布预览图中, 末端的绿色为端粒基序重复次数大于100的端粒, 深蓝色为45 rDNA, 浅蓝色为5S rDNA, 红色为Gap.
☆Gap填补(速度非常快,内存消耗小)
测试:500M基因组17个gap和2G基因组5个gap,分别用时13分钟和5分钟,填补速度非常快,消耗内存非常小,有补gap绘制reads覆盖图检查HIC调图是否有问题和补gap后对新区域进行reads验证检查是否有问题。目前来说其他软件:
①TGS-Gapcloser很容易给基因组补出许多序列,补gap前后可能多出好几M,其次缺点还有就是容易爆内存。
②quarTeT的补gap也有问题,效果差,补完gap,多出100多M也不说了。如果实在要补gap还是用TGS-Gapcloser吧,慢慢跑,慢慢补应该不会爆内存。其他的例如,LR-gapcloser也效果不是很好。
☆Gap填补后的新区域的Reads覆盖图(从上到下: 其他组装版本、HIFI数据、ONT数据reads覆盖图)
☆T2T圈图
①展示所有共线性
②ID保持邻近,只展示Chr01A_vs_Chr01B,...的共线性
③Y轴对称(当基因组为异源四倍体时,则不会Y轴完全对称),只展示Chr01A_vs_Chr01B,...的共线性
☆T2T共线性图(浅蓝色:5S rDNA;深蓝色:45S rDNA;黄色:Gap;黑色:端粒;蓝色填充:Ref基因组的基因密度;)
其他可交付:
③LAI评估+LTR插入时间分析+LTR-RTs系统发育树:
示例:
example
├── 1.1.survey Survey流程
├── 1.2.nt NT比对, 去细菌污染
├── 2.1.hifiasm hifiasm组装
├── 2.2.nextpolish2_for_T2T_genome HIFI+NGS纠错(针对T2T基因组+提升QV)
├── 2.2.polish_for_ont_genome racon+plion纠错(常规ONT基因组纠错)
├── 2.3.purge 去冗余流程
├── 2.4.busco BUSCO评估
├── 2.5.qv QV评估
├── 2.6.mappingdata Mapping回比评估
├── 2.7.LAI+LTRinsertTime LAI评估+LTR插入时间分析+LTR-RT系统发育树
├── 3.1.hicup HiCUP评估
├── 3.2.haphic HapHiC(HIC互作流程)
├── 3.3.makechr 生成染色体级别基因组, 检查Gap与小ctg
├── 3.4.subphaser SubPhaser亚基因组分型
├── 3.5.ragtag Ragtag同源挂载/排序
├── 3.6.syntenic 各种共线性图
├── 3.7.align minimap2比对出dotploty图
├── 3.8.genomeview 检测基因组的rDNA/端粒/Gap并出图
├── 3.9.hicplot HIC热图
├── 4.0.dupgene_enrich DupGene富集图
└── 5.0.centromere 着丝粒预测(优于市面上所有的软件)