2025-09-08
中文題目:西部紅柏基因組選擇:從概念驗證到實際應用
發表期刊:New Phytologist
發表時間:2024年8月
材料選擇:西部紅柏(Thuja plicata),北美太平洋西北地區特有的柏科植物
群體選擇:訓練群體(1520個樣本)、測試群體(2897個樣本)
分析內容:模型預測準確性評估、模型穩定性評估、育種周期縮短評估
研究摘要
自然環境中,森林資源面臨著諸多威脅。傳統育種方法可能過于緩慢,無法培育出適應性強的樹木,但基因組選擇(GS)可以加速這一過程。研究人員描述了一項關于西部紅柏從概念驗證到實際應用的全面基因組選擇研究。利用基因組數據,研究人員在樹木訓練群體(TrP)上開發了模型,用于預測目標幼苗群體(TaP)的生長、心材化學和葉片化學性狀的育種值(BVs)。同時使用交叉驗證來評估TrP中的預測準確性(PACC);同時也在TaP中驗證了早期表達葉片性狀的模型。
研究背景
森林作為地球陸地生態系統的重要組成部分,承擔著關鍵的生態功能,特別是在應對氣候變化方面發揮著不可替代的作用。針葉林作為全球森林資源的主體之一(約占30%),廣泛分布于北半球溫帶和寒帶地區,具有極高的生態和經濟價值。然而,全球森林正面臨衰退威脅,這使得通過科學手段提升森林質量和恢復能力成為當務之急。傳統針葉樹育種面臨三大核心挑戰:時間成本高昂;性狀表達滯后;遺傳評估復雜。基因組選擇(GS)技術通過以下創新機制克服傳統育種瓶頸:不依賴特定功能標記,全面捕捉遺傳變異;早期精準預測;育種周期縮短:理論上可減少80%以上的育種時間。
模型選擇和數據處理
研究人員采用了之前確定的最佳系譜模型(ABLUP,基于重建的全同胞系譜估計的Amat)和基因組模型(GBLUP,基于SNPs估計的Gmat)進行所有分析。研究涵蓋三個世代:G0(創始世代,包含113個親本);G1/第一育種周期(TrP:從第一育種周期/第一代多系雜交子代試驗中取樣的1520棵樹);G2/第二育種周期(TaP:從多系雜交子代試驗中反向選擇的親本通過全同胞設計交配產生的2978株幼苗,屬于第二代育種周期/第一代全同胞子代試驗)。經過數據過濾后,保留了113個親本、TrP中的1506個個體、TaP中的2966株幼苗和45,378個高質量SNPs用于后續的GS分析。
預測準確性分析
研究人員使用三種驗證方案對預測模型進行了全面驗證,評估指標為預測能力(PA)和一種預測準確性(PACC)估計值,同時聚焦三種代表性的性狀:樹高(代表生長性狀)、葉片總單萜(代表葉片抗性)和心材總提取物(代表心材耐久性)。隨機抽樣(驗證方法1)表明ABLUP模型的PACC比GBLUP低0.04-0.09,同時PA則在葉片總單萜中最高,心材總提取物次之,樹高最低。完全去除親緣關系(驗證方法2)表明,使用基因組關系矩陣(Gmat)鑒定的無關個體數量少于系譜矩陣(Amat)(例如隨機個體n=1359(Gmat) vs 1386(Amat)),導致PACC輕微降低。但兩種親緣關系去除方法在各性狀間呈現相同模式。GBLUP模型使用Amat去除親緣關系后,PACC降低幅度從樹高的39%到α-側柏酮的68%不等,但生長性狀和心材總木脂素的PACC仍保持較高水平。跨世代驗證(驗證方法3)發現自上而下預測(親本→子代)準確性低于自下而上(子代→親本),將親本加入訓練群體可顯著減少所需群體規模。
圖 在訓練群體中驗證GS的有效性
目標群體(TaP)中早期表達葉片抗性性狀的基因組選擇驗證
研究人員通過在訓練群體(TrP)和目標幼苗群體(TaP)中測量葉片單萜類化合物,成功驗證了基因組選擇(GS)在TaP中的預測效果。經過系譜校正后,估計TaP中存在16%的系譜錯誤率,并鑒定出96株與TrP無關的幼苗和5株自交起源的幼苗。傳力估計在TrP與TaP之間以及不同模型(ABLUP和GBLUP)之間均無顯著差異。α-側柏酮的遺傳力(h2=0.31-0.33)略高于葉片總單萜(h2=0.28-0.32)。GBLUP模型對所有遺傳參數估計都產生了更小的標準誤,并且在群體間獲得了更高且顯著的brB值,說明GBLUP模型的預測優勢優于ABLUP。同時發現,驗證嚴格度與PACC呈負相關,親緣關系越近,驗證的準確度越高。
圖 目標群體(TaP)中對葉片α-側柏酮進行的獨立驗證
生長與木材性狀預測
利用經過驗證的GBLUP與ABLUP模型,對TaP(測試群體,Test Population)的樹高和木材總提取物進行了預測。將GBLUP預測結果(包括單株幼苗及其家系平均的基因組育種值)與ABLUP預測結果比較后發現:GBLUP能夠計入孟德爾抽樣誤差,從而捕捉到巨大的家系內變異。家系平均GBLUP預測值與ABLUP預測值的相關性(樹高r = 0.90,木材總提取物r = 0.95)高于單株GBLUP預測值與ABLUP的相關性(樹高r = 0.85,木材總提取物r = 0.86)。此外,GBLUP與所有測試的貝葉斯模型在兩個性狀上的相關性都非常高。
圖 測試群體在兩種不同模型中的育種值比較
多性狀早期選擇
研究人員按照指數111:三性狀等權重(生長/葉化學/心材=1:1:1);指數112:心材權重加倍(1:1:2)構建分析指數,相關性分析表明兩個選擇指數高度相關(r=0.95)。由于預測性質,目標群體(TaP)的GBLUP預測育種值與訓練群體(TrP)的GBLUP測量育種值具有一定差異,因此通過群體特異性標準化校正后進行后續分析。研究表明,合并最優選擇的兩組結果(選擇指數111選100株,指數112選80株)共獲得119株幼苗。最優選擇組的遺傳多樣性指標是頂端選擇組(指數112)的3.4倍。最優選擇組的預期遺傳增益在樹高、葉片總單萜和心材總提取物上分別是頂端選擇組的0.5、1.4和0.5倍。
圖 選擇指數比較分析
總 結
基于GS選擇育種模型,研究人員探究了生長、環境、年齡、親緣關系和世代對預測能力(PA)和預測準確性(PACC)的影響,并利用TaP中的早期表達葉片性狀獨立驗證了基于TrP訓練的模型,驗證了將這些模型用于預測TaP中晚期表達的生長和木材性狀的可行性。最后,研究人員在TaP中采用最優多性狀選擇策略,選出119株幼苗用于建立商業化種子培養園,這比傳統育種方法提前了數十年。這一實際應用可將育種周期從25年縮短至約2–4年,時間減少12.5倍,預計可將遺傳增益比傳統育種提高7到10倍。
圖 GS育種應用流程