再次飞越!1篇Nature Genetics,中国学者进一步阐述棉花的基因组组装

更新时间:2019-03-19 22:36:40点击:554 科研管理新闻

异源四倍体棉花是世界上经济上重要的天然纤维生产作物。在多倍化之后,陆地棉(Gossypium hirsutum L.)进化以产生更高的纤维产量并且比生产优质纤维的海岛棉(Gossypium barbadense)更好地在恶劣环境中生存。这些种间差异的全球遗传和分子基础尚不清楚。2019年3月18日,浙江大学/南京农业大学张天真团队在Nature Genetics(IF=27.125)在线发表题为“Gossypium barbadense and Gossypium hirsutum genomes provide insights into the origin and evolution of allotetraploid cotton”的研究论文,该研究报告了这两种栽培异源四倍体物种的高质量从头组装基因组,在重复DNA富集的着丝粒区域有显著的改善。全基因组比较分析显示,基因表达,结构变异和扩展基因家族的物种特异性改变是这些物种的物种形成和进化历史的原因。这些发现有助于阐明棉花基因组的进化及其驯化历史。所产生的信息不仅可以使育种者提高纤维质量和对不断变化的环境条件的适应能力,而且还可以转化为其他作物,以便更好地了解其驯化历史和改进用途。棉花属共包括46个二倍体棉种和5个四倍体棉种, 所有的二倍体棉花物种均可能由1个共同的祖先进化而来, 随后分化为8个基因组, 包括A、B、C、D、E、F、G和K, 而所有的四倍体棉花种均是由A基因组亚洲棉和D基因组雷蒙德氏棉进行种间杂交加倍形成。棉花解码棉花基因组能够深入了解棉种起源进化及棉花重要农艺性状形成的遗传基础。因此, 由中国农业科学院棉花研究所牵头, 分别对二倍体棉种雷蒙德氏棉和亚洲棉进行了基因组测序, 并随后完成了四倍体棉种陆地棉的全基因组测序。组装参数2012年, Wang等和Paterson等分别完成了棉花D基因组雷蒙德氏棉 (Gossypium raimondii) 的全基因组测序工作。利用全基因组鸟枪法 (Whole genome shotgun, WGS) 测序得到78.7Gb的数据, 测序深度为103.6倍, 利用遗传连锁图谱上的1369个分子标记, 将73%的组装序列锚定到染色体上, 总大小为567.2 Mb, 一共含有40 976个编码蛋白的基因, 其中92.2%的基因通过转录组数据得到了验证。TM-1和Hai7124基因组的同步表征2014年, Li等完成了棉花A基因组亚洲棉 (Gossypium arboreum) 石系亚1号的全基因组测序及组装工作。同样采用全基因组鸟枪法测序得到193.6 Gb的数据, 测序深度是112.6倍, 利用高分辨率的遗传图谱将90.4%的组装序列锚定到13条染色体上, 组装后的G.arboreum的基因组大小为1694 Mb, 其中各种形式的重复序列占总基因组的68.5%, 预测含有41 330个编码蛋白的基因, 其中96%的基因通过转录组数据得到了验证。异源多倍体棉花基因组的进化棉花A组和D组基因组测序的完成, 为棉花栽培品种陆地棉的全基因组测序奠定了很好的基础。2015年, Li等和Zhang等分别独立完成了异源四倍体棉花品种陆地棉 (Gossypium hirsutum) TM-1的全基因组测序及组装。采用全基因组鸟枪法测序、人工细菌染色体文库测序及高分辨率遗传图谱3种方法相结合, 组装得到陆地棉的基因组大小为2173 Mb, 88.5% (1923 Mb) 的基因组锚定到26条染色体上, 其中At为1170Mb, Dt为753 Mb。一共预测有76 943个基因, 其中72 142个基因分布在染色体上, 35 056个基因分布在At基因组上, 37 086分布在Dt基因组上。G.arboreum和G.hirsutum的共线性较高, 分别覆盖了A和At基因组的68.2%和65.9%;G raimondii和G.hirsutum的共线性更高, 分别覆盖了D和Dt基因组的91.9%和88.8%。同源基因丢失比较发现, Dt丢失643对同源基因, At丢失了478对同源基因, 说明D基因在进化过程中基因丢失更严重。而四倍体棉花基因中At和Dt基因组丢失同源基因的数目分别为523和461对, 二倍体棉花A基因组和D基因组丢失同源基因数目分别为234和390对, 说明四倍体棉花丢失基因的频率高于二倍体棉花, 而且在AD基因组杂交形成四倍体的过程中At基因组丢失了更多的基因。TM-1和Hai7124之间的结构变化棉花异源四倍体栽培品种有陆地棉和海岛棉2种。由于海岛棉产量低, 因此种植面积不到陆地棉的1%;但是, 海岛棉能够产生超长纤维, 纤维品质及抗病性都明显优于陆地棉。为了更好地分析这些差异形成分子机制, Yuan等和Liu等采用全基因组鸟枪法测序、人工细菌染色体文库测序及高分辨率遗传图谱3种方法相结合, 分别对海岛棉品种3-79和Xinhai 21进行了全基因组测序及组装, 结果:3-79全基因组大小为2.57 Gb, 编码80 876个蛋白质, 含有63.2%的重复序列;而Xinhai 21基因组大小为2.47 Gb, 编码76 526个蛋白质, 含有69.11%的重复序列。但是,这两种棉花的基因组质量不是非常高,尤其是着丝粒区;另外对于两者极大的生理学差异,一直不是很清楚。模型描述了TM-1中耐热和耐寒的分子基础该研究报告了这两种栽培异源四倍体物种的高质量从头组装基因组,在重复DNA富集的着丝粒区域有显著的改善。全基因组比较分析显示,基因表达,结构变异和扩展基因家族的物种特异性改变是这些物种的物种形成和进化历史的原因。这些发现有助于阐明棉花基因组的进化及其驯化历史。所产生的信息不仅可以使育种者提高纤维质量和对不断变化的环境条件的适应能力,而且还可以转化为其他作物,以便更好地了解其驯化历史和改进用途。论文链接:(来源:iNature)科研管理新闻科研管理系统