

文章亮點
構建了一個包含29個葡萄基因組全基因組圖譜,這是目前最大的葡萄基因組數據集之一;
通過GWAS分析發現了許多與果實品質相關的基因,這有助于改善葡萄的品種選育和提高產量;
研究者還提出了一些新的策略,例如針對SV的遺傳分析和多目標育種等,這些策略有望進一步提高葡萄育種的效率和質量。
文章信息
英文題目:Grapevine pangenome facilitates trait genetics and genomic breeding中文題目:葡萄泛基因組助力性狀遺傳學與基因組育種研究
發表期刊: nature genetics
影響因子:29.0/Q1
發表時間:2024年10月1日
涉及組學:泛基因組、GWAS、GS。
技術路線

摘 要
本研究旨在通過構建葡萄基因組參考圖譜(Grapepan v.1.0)和對466個葡萄品種進行重測序數據的分析,探索復雜農藝性狀的遺傳基礎,并為育種提供支持。研究人員使用SNP和結構變異(SVs)建立了一個變異地圖,并將SVs整合到全基因組關聯研究中,共發現了29個農藝性狀的148個數量性狀位點,其中12個性狀顯著受SVs影響。此外,還發現了一些代謝和果實發育等不同類型的性狀之間的遺傳相關性。研究結果表明,包括SVs在內的全基因組關聯研究可以提高遺傳可解釋性的平均值,并且在多性狀選擇模型下,可以通過基因組預測方法來實現多個性狀的育種。這項研究為葡萄藤的育種提供了新的思路和工具。
前 言
葡萄基因組具有高度的雜合性,部分原因是由于克隆繁殖過程中遺傳變異的積累。這種繁殖方式已持續數千年。例如,二倍體霞多麗(Chardonnay)和赤霞珠(Cabernet Sauvignon)的基因組中包含超過10%的雜合位點,包括單核苷酸多態性(SNPs)、插入缺失(InDels)和結構變異(SVs)10,24,25。盡管常用的參考基因組PN40024經過9代自交后已高度純合,但與雜合品種相比,它仍缺失了超過10%的基因。在不同品種之間,只有約7%的基因是共享的,而每個品種特有的基因則占約8%。葡萄基因組的高度變異性表明,有必要構建一個泛基因組參考,以納入存在-缺失變異,提高對基因組變異(包括結構變異)的檢測能力,并減少參考偏差。
研究內容
1.構建首個馴化葡萄圖形泛參考基因組(Grapepan v.1.0)
研究人員對9個具有代表性的二倍體樣品進行了HiFi測序、Hi-C測序和超長納米孔測序,其中包括1個亞洲特有野生種Vitis retordii的品系以及8個葡萄栽培品種(7個鮮食葡萄和1個釀酒葡萄)。這9個樣品產生了18個單倍型,經過填補缺口后達到了T2T水平的組裝。基因組大小范圍為479.15至539.30 Mb。通過高連續性(>99.9%)、最小切換錯誤率(<0.05%)和低Hamming錯誤率(<2.83%)(圖1a,b),證實了單倍型組裝的質量。使用通用單拷貝同源基因評估基準測試表明,這些單倍型的平均完整性為98.4%。我們使用相同的流程對所有單倍型進行注釋,以確保結果的一致性。在18個單倍型中,編碼蛋白基因的數量范圍為34,536至38,526,每個單倍型的TE序列長度范圍為263.86 Mb(54.68%)至312.10 Mb(59.03%)。此外,我們在所有組裝結果中鑒定了著絲粒和端粒序列(圖1c)。與之前的研究結果一致27,著絲粒的主要重復單元長度為107 bp。總體而言,這18個組裝的單倍型及其注釋代表了迄今為止所生成的高質量葡萄基因組數據集之一。
圖|T2T基因組組裝及Grapepan v.1.0的構建
2.復雜農藝性狀的GWAS及SV的重要性
為了研究結構變異對數量性狀的貢獻,我們對324個新測序的葡萄品種進行了為期兩年(2016年和2017年)的表型調查,共涉及29個性狀(圖2a)。這324個栽培品種包括106個釀酒葡萄、108個鮮食I類葡萄和110個鮮食II類葡萄。這29個性狀包括五個表型類別:果穗(6個)、內容物(8個)、漿果性狀(8個)、果實大小(4個)和果皮(3個)(圖2a)。以往的研究已利用約6,000個SNP位點對與果實組成和尺寸相關的表型性狀進行過GWAS分析36。本研究更大的樣本量和全基因組范圍內的變異數據,有助于同時對多個性狀進行基因組選擇。首先,研究人員分析了兩年間數量性狀之間的相關性,并采用主成分分析(PCA)對表型進行映射(圖2b)。在漿果內容物類別中,果糖(Fru)、葡萄糖(Glu)和可溶性固形物含量(SSC)等性狀兩兩之間存在顯著的正相關關系(P<<0.001)。此外,不同類別之間的性狀也存在相關性。例如,內容物類別的可滴定酸(TAC)與果實大小的四個測量指標之間存在顯著的負相關關系:漿果重量(BeWe)、漿果體積(BV)、漿果長度(BL)和漿果寬度(BeWi)。這些相關性可能源于這樣一個事實:在果實轉色期(veraison)時,酸的合成通常會停止,而這種停止會導致果實繼續成熟和膨大過程中酸濃度的稀釋。表型之間的這些相關性可能導致一些候選的GWAS位點重疊,并對具有多種理想性狀的優質葡萄品種的基因組選擇產生潛在影響。
圖2 | 不同葡萄群體間29項農藝性狀的相關性分析。
以往GWAS研究難以同時處理大量品種、多性狀及高分辨率數據,且葡萄研究中從未納入結構變異(SVs)。我們利用Grapepan v.1.0平臺對SNP和SVs進行GWAS分析,發現148個基因座與農藝性狀相關(136個由SNP檢測,12個由SVs捕獲),覆蓋27.61 Mb基因組區域(~5.58%)。其中26個位點(~17.57%)與已知功能位點重疊。例如,18號染色體上AGL11基因(調控種子發育)與無籽性狀相關;BL1位點95bp缺失(PVE 6.31%)與果實長度相關;SN6基因座1.1 kb缺失(PVE 6.08%)與光裂合酶基因相關;Suc1基因座139 bp插入(PVE 6.60%)影響蔗糖含量。PNT2T參考基因組分析顯示,91.18%的位點與泛基因組SNP結果一致。
此外,SSC7和BeWi9位點的顯著SNP(P值6.05%/5.91%)與漿果寬度相關。局部系統發育樹顯示栽培葡萄存在選擇性清除。SNP 17_6489512和17_6484258分別影響可溶性固形物和漿果寬度。該區域注釋出NEPS和NRT1基因家族,其中Vitvi031750和Vitvi031760高表達,Vitvi031756在釀酒葡萄中表達更高。
圖3|與農藝性狀相關的候選基因座及其人工選擇的基因組足跡
4.葡萄農藝性狀的分歧選擇
通過XP-EHH分析發現,鮮食葡萄組間21.45 Mb(4.4%)基因組區域存在顯著分化(P?<?0.05),FST分析前5%異常值呈現相似模式。GSEA顯示分化區域富集于激素和脅迫響應相關通路。六個GWAS候選位點(BC4、SA1、BeS2、BuW5、FF6、Tar4)位于分化區域,分別調控果實顏色、澀味、形狀、穗重、硬度和酒石酸含量。其中,BC4位點含MYB基因簇,FF6位點(PVE 7.35%)使鮮食組果肉硬度顯著提升11.7%(P?<?0.01)。
釀酒與鮮食葡萄比較發現21.35 Mb分化區域(P?<?0.05),GSEA提示糖胺、谷胱甘肽代謝及毒素分解通路富集。45個GWAS位點與果實大小相關,32個位點關聯風味代謝物(如總酸、單寧、糖類)。分化選擇顯著影響BV12、BeWe6等果實大小位點及TAC3、SSC7等代謝位點,表明農藝性狀分化與育種目標密切相關。
圖4|亞群間農藝性狀的差異選擇
5.SVs提高了葡萄性狀的遺傳力估計
本研究發現,大多數結構變異(SV)與單核苷酸多態性(SNP)無連鎖,且部分GWAS信號區域僅由SV驅動,表明SV對遺傳力缺失具有獨特貢獻。通過LDAK模型分析顯示,SV對性狀遺傳力的貢獻(0.5%-86.1%)顯著高于SNP(0.01%-52.3%),其中定量性狀主要受SNP多基因效應調控,而定性性狀更依賴SV大效應。典型案例如BeWi表型(SV解釋74.6% vs SNP 0.5%)、SSC性狀(SV 35.8% vs SNP 0.6%)以及BL性狀(SV引入使遺傳力從20.9%提升至64.9%)。特別值得注意的是,Chr7上5.6 kb缺失(SSC2)通過調控異淀粉酶基因Vitvi011368顯著影響SSC表型。在育種應用方面,整合SV與SNP的多性狀分析顯示20.7%的性狀存在顯著遺傳相關(rG=0.41-0.97),基于多基因評分(PGS)的預測準確率平均超過50%,較傳統方法提升16%以上,其中BL性狀預測準確率高達79.53%。這些發現為葡萄分子設計育種提供了新的理論依據和技術支撐。
圖5|缺失的遺傳力、遺傳相關性和農藝性狀的基因組預測
總 結
研究人員成功地構建了一個包含29個完整基因家族的葡萄基因組學全基因組圖譜,并發現其中許多基因與果實品質相關。通過對這些基因進行進一步的功能分析,研究人員得出了一些關于葡萄生長發育的重要結論,這對未來的葡萄育種和生產具有重要的指導意義。同時,該研究也證明了全基因組測序技術和高精度組裝技術在植物基因組學研究中的重要性和應用前景。
參考文獻:Liu Z, Wang N, Su Y, et al. Grapevine pangenome facilitates trait genetics and genomic breeding. Nat Genet. 2024 Dec;56(12):2804-2814. doi: 10.1038/s41588-024-01967-5. Epub 2024 Nov 4.


















