近日,中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所張圣平團(tuán)隊(duì)在國(guó)際著名期刊《Molecular Plant》在線發(fā)表題為A near-complete cucumber reference genome assembly and Cucumber-DB, a multi-omics database的文章,公布了黃瓜第一個(gè)近完整參考基因組(CLv4.0)和參考轉(zhuǎn)錄本數(shù)據(jù)集(CsRTD1),并整合泛基因組、群體變異組、轉(zhuǎn)錄組以及核心種質(zhì)材料信息,建立了第一個(gè)黃瓜多組學(xué)綜合數(shù)據(jù)庫Cucumber-DB(http://www.cucumberdb.com/),可為黃瓜功能基因組學(xué)和分子育種研究提供全面的共享平臺(tái)。
黃瓜(Cucumis sativus L.)是葫蘆科(Cucurbitaceae)的重要經(jīng)濟(jì)蔬菜作物,也是研究植物性別決定、維管束形成的重要模式系統(tǒng)。黃瓜基因組中有近30 %的區(qū)域是由45s rDNA和微衛(wèi)星等復(fù)雜重復(fù)序列組成的,這個(gè)比例遠(yuǎn)高于水稻、玉米和西瓜等作物(< 5%),并且受當(dāng)時(shí)測(cè)序技術(shù)及組裝方法的限制,目前廣泛使用的華北密刺型(‘ChineseLong’)黃瓜自交系‘9930’參考基因組(CLv3.0版本)仍然有大量未知序列(~130 Mb)和72個(gè)缺口;與此同時(shí),這些重復(fù)序列也嚴(yán)重影響基因注釋的準(zhǔn)確度,黃瓜參考基因組質(zhì)量亟待提高。為此,該研究首次利用約~100×的超長(zhǎng)ONT(N50=200 kb)和~70×的 Pacbio HiFi 測(cè)序數(shù)據(jù),結(jié)合遺傳圖譜和Hi-C測(cè)序數(shù)據(jù)進(jìn)行組裝調(diào)整和驗(yàn)證,除一個(gè)位于2號(hào)染色體的缺口外,其他6條染色體均為一條連續(xù)序列,獲得了黃瓜參考基因組近完成圖(CLv4.0)。該基因組大小為321.53 Mb,比CLv3.0版本多組裝出近100 Mb序列,解析了著絲粒和端粒區(qū)域的45s rDNA和微衛(wèi)星序列,確定了7個(gè)完整著絲粒區(qū)域。
完整準(zhǔn)確的基因注釋信息,將極大地推動(dòng)植物功能基因組學(xué)發(fā)展。該研究對(duì)黃瓜全發(fā)育期(29個(gè)組織時(shí)期)和7個(gè)主要脅迫處理進(jìn)行轉(zhuǎn)錄組測(cè)序,包括0.84 Tb PacBio全長(zhǎng)轉(zhuǎn)錄組和1.21 Tb Illumina鏈特異性轉(zhuǎn)錄組數(shù)據(jù),整合多個(gè)注釋流程,注釋出27,360個(gè)高質(zhì)量基因,其中包括5070個(gè)新基因,BUSCO值達(dá)到99.19%;更為重要的是,該研究構(gòu)建了第一個(gè)黃瓜參考轉(zhuǎn)錄本數(shù)據(jù)集(CsRTD1),獲得了17萬個(gè)高質(zhì)量的轉(zhuǎn)錄本,其中87.92%的轉(zhuǎn)錄本來源于全長(zhǎng)轉(zhuǎn)錄組,為開展轉(zhuǎn)錄本準(zhǔn)確定量和可變剪切功能研究提供重要參考。
基于以上研究,該研究搭建了第一個(gè)黃瓜多組學(xué)數(shù)據(jù)庫Cucumber-DB(http://www.cucumberdb.com/),囊括了重要的黃瓜泛基因組(Li et al., 2022)、核心種質(zhì)變異組(Qi et al., 2013)和轉(zhuǎn)錄組數(shù)據(jù),開發(fā)了數(shù)十個(gè)實(shí)用分析工具,為科研人員提供一站式服務(wù);通過這個(gè)數(shù)據(jù)庫,可以同時(shí)獲得12個(gè)不同黃瓜種質(zhì)基因組序列和基因模型信息、核心種質(zhì)資源變異數(shù)據(jù)(SNPs、InDels及SVs)、馴化選擇區(qū)間、基因及轉(zhuǎn)錄本表達(dá)譜可視化(eFP)、可變剪切信息、共表達(dá)調(diào)控網(wǎng)絡(luò)及下游靶基因預(yù)測(cè)等相關(guān)數(shù)據(jù)和工具。
中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所官健濤助理研究員、苗晗副研究員、青島農(nóng)業(yè)大學(xué)張忠華教授、中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所董邵云副研究員為該文的共同第一作者;中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所張圣平研究員為該文通訊作者,中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所為通訊單位。中國(guó)熱帶農(nóng)業(yè)科學(xué)院黃三文院士對(duì)該研究提供了重要指導(dǎo)。該研究得到了蔬菜生物育種全國(guó)重點(diǎn)實(shí)驗(yàn)室、國(guó)家重點(diǎn)研發(fā)計(jì)劃(2023YFD1201500)、中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程項(xiàng)目(CAAS-ASTIP-2021-IVF)以及國(guó)家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系(CARS-23)項(xiàng)目的資助。
論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(24)00192-8
日期:2024-06-24
黃瓜(Cucumis sativus L.)是葫蘆科(Cucurbitaceae)的重要經(jīng)濟(jì)蔬菜作物,也是研究植物性別決定、維管束形成的重要模式系統(tǒng)。黃瓜基因組中有近30 %的區(qū)域是由45s rDNA和微衛(wèi)星等復(fù)雜重復(fù)序列組成的,這個(gè)比例遠(yuǎn)高于水稻、玉米和西瓜等作物(< 5%),并且受當(dāng)時(shí)測(cè)序技術(shù)及組裝方法的限制,目前廣泛使用的華北密刺型(‘ChineseLong’)黃瓜自交系‘9930’參考基因組(CLv3.0版本)仍然有大量未知序列(~130 Mb)和72個(gè)缺口;與此同時(shí),這些重復(fù)序列也嚴(yán)重影響基因注釋的準(zhǔn)確度,黃瓜參考基因組質(zhì)量亟待提高。為此,該研究首次利用約~100×的超長(zhǎng)ONT(N50=200 kb)和~70×的 Pacbio HiFi 測(cè)序數(shù)據(jù),結(jié)合遺傳圖譜和Hi-C測(cè)序數(shù)據(jù)進(jìn)行組裝調(diào)整和驗(yàn)證,除一個(gè)位于2號(hào)染色體的缺口外,其他6條染色體均為一條連續(xù)序列,獲得了黃瓜參考基因組近完成圖(CLv4.0)。該基因組大小為321.53 Mb,比CLv3.0版本多組裝出近100 Mb序列,解析了著絲粒和端粒區(qū)域的45s rDNA和微衛(wèi)星序列,確定了7個(gè)完整著絲粒區(qū)域。
完整準(zhǔn)確的基因注釋信息,將極大地推動(dòng)植物功能基因組學(xué)發(fā)展。該研究對(duì)黃瓜全發(fā)育期(29個(gè)組織時(shí)期)和7個(gè)主要脅迫處理進(jìn)行轉(zhuǎn)錄組測(cè)序,包括0.84 Tb PacBio全長(zhǎng)轉(zhuǎn)錄組和1.21 Tb Illumina鏈特異性轉(zhuǎn)錄組數(shù)據(jù),整合多個(gè)注釋流程,注釋出27,360個(gè)高質(zhì)量基因,其中包括5070個(gè)新基因,BUSCO值達(dá)到99.19%;更為重要的是,該研究構(gòu)建了第一個(gè)黃瓜參考轉(zhuǎn)錄本數(shù)據(jù)集(CsRTD1),獲得了17萬個(gè)高質(zhì)量的轉(zhuǎn)錄本,其中87.92%的轉(zhuǎn)錄本來源于全長(zhǎng)轉(zhuǎn)錄組,為開展轉(zhuǎn)錄本準(zhǔn)確定量和可變剪切功能研究提供重要參考。
基于以上研究,該研究搭建了第一個(gè)黃瓜多組學(xué)數(shù)據(jù)庫Cucumber-DB(http://www.cucumberdb.com/),囊括了重要的黃瓜泛基因組(Li et al., 2022)、核心種質(zhì)變異組(Qi et al., 2013)和轉(zhuǎn)錄組數(shù)據(jù),開發(fā)了數(shù)十個(gè)實(shí)用分析工具,為科研人員提供一站式服務(wù);通過這個(gè)數(shù)據(jù)庫,可以同時(shí)獲得12個(gè)不同黃瓜種質(zhì)基因組序列和基因模型信息、核心種質(zhì)資源變異數(shù)據(jù)(SNPs、InDels及SVs)、馴化選擇區(qū)間、基因及轉(zhuǎn)錄本表達(dá)譜可視化(eFP)、可變剪切信息、共表達(dá)調(diào)控網(wǎng)絡(luò)及下游靶基因預(yù)測(cè)等相關(guān)數(shù)據(jù)和工具。
中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所官健濤助理研究員、苗晗副研究員、青島農(nóng)業(yè)大學(xué)張忠華教授、中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所董邵云副研究員為該文的共同第一作者;中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所張圣平研究員為該文通訊作者,中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所為通訊單位。中國(guó)熱帶農(nóng)業(yè)科學(xué)院黃三文院士對(duì)該研究提供了重要指導(dǎo)。該研究得到了蔬菜生物育種全國(guó)重點(diǎn)實(shí)驗(yàn)室、國(guó)家重點(diǎn)研發(fā)計(jì)劃(2023YFD1201500)、中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程項(xiàng)目(CAAS-ASTIP-2021-IVF)以及國(guó)家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系(CARS-23)項(xiàng)目的資助。
論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(24)00192-8
日期:2024-06-24