2017-09-14
馬鈴薯膨大的含淀粉的塊莖、柑橘富含維生素C的果實、辣椒的口感辛辣的果實、園林植物多樣的花形、藥用植物具生物活性的次生代謝產物……高等植物豐富多樣的特化的性狀廣泛吸引了研究者的關注。目前,研究熱點主要集中于具有生產效益和經濟價值的性狀上,研究方向涉及果實發育成熟、特異代謝產物合成、農藝性狀(產量、品質)、園藝性狀(花形、花期)、植株病蟲抗性等方面。通過基因de novo測序可以一次鑒定到目標性狀的多個相關基因,發現新的基因位點,揭示性狀形成和調控的遺傳機制,為進一步的驗證和應用提供指導。
性狀相關基因鑒定分析的實驗設計主要包括種間比較和種內比較兩個途徑。種間比較常通過遺傳和表型差異較大的品種間比較、同屬或同科的近緣有參物種間比較,或以模式植物擬南芥為參考進行比較,鑒定并比較目標性狀相關的同源基因,比較內容涉及基因表達情況和拷貝數等。種內比較通常考察相關基因的表達情況,通過在根、莖、葉、花、果等不同組織部位取樣,或在不同生長發育階段取樣,來比較目標基因的表達差異并分析其與特異性狀的關系。基因表達模式的檢測常采用轉錄組測序或表達譜測序,或進行拷貝數檢測等。
對于實驗結果的討論可結合研究物種的特點,綜合進化分析內容,如基因家族的擴張/收縮、全基因組倍增事件、多倍化事件等驅動高等植物進化的事件或馴化改良施加的選擇壓力,提出目標基因可能的形成原因,闡釋目標性狀產生的遺傳和分子機制,并規劃進一步的驗證工作。通過以下文獻案例,我們可對這方面的研究思路窺見端倪。
1. 辣椒果實發育及辣椒素合成相關基因
這是2014年PNAS的一篇文章,通過對同屬茄科但分屬不同果實發育模式的辣椒和番茄的比較,鑒定了果實發育相關基因,通過對辛辣和不辣的辣椒品種的比較及轉錄組測序,鑒定了辣度相關基因并分析了其表達模式。
果實的成熟過程顯著影響果實品質和保存期限,在躍變型果實(番茄)和非躍變型果實(辣椒)間差異顯著。非躍變型果實軟化過程更為緩慢且對乙烯無響應。比較番茄和辣椒在果實成熟期的表達譜,發現番茄有2281個特異基因,而辣椒有1440個特異基因,這兩個物種的特異基因均涉及細胞壁重構、激素信號傳導和代謝、碳水化合物代謝、蛋白質降解以及非生物逆境響應等。
但兩者的差異在于以下4點:1)涉及乙烯生物合成的基因數目在辣椒中更低,辣椒的8個編碼1-氨基環丙烷-1-羧酸鹽合酶(乙烯生產的關鍵酶)的基因在果實成熟過程中無一上調,與辣椒較低的乙烯合成一致,而番茄中的2個該基因被強烈誘導;2)在辣椒中與乙烯信號和茉莉酸信號傳導相關的差異表達基因的數目更低;3)與生長素和脫落酸相關的差異表達基因數目更大,包括與非生物逆境相關的基因,這與草莓(非躍變型果實)成熟過程中脫落酸的積累一致;4)葉片衰老的負調控因子WRKY70和ZAT10在辣椒中受到更強烈的誘導,表明這些轉錄因子的誘導可能對于辣椒的長保存期起到重要作用;5)9個番茄XTH(木葡聚糖內源轉糖基酶/水解酶)基因中的15個在果實成熟過程中呈現差異表達,而辣椒的25個XTH基因中只有6個差異表達,表明XTH活性降低導致辣椒果實成熟過程中軟化減弱。
辣椒素的積累,主要包括辣椒素和二氫辣椒素,為辣椒屬植物獨有且導致了果實的辛辣度(辣椒素合成通路見圖1)。基于對辣椒辣度的前期研究,在辣椒、番茄、馬鈴薯和擬南芥中,鑒定了51個涉及辣椒素合成的基因家族及其同源基因。進化分析顯示,與其他3個物種相比,辣椒有獨立的、特有的13個基因家族的重復(如ACLd、AT3、β-CT、C3H、CAD、CCR、Kas I和PAL)。基因重復中的序列差異可能導致功能差異或新功能的產生,促進特異性的辣椒素生物合成的進化。
圖1. 辣椒素生物合成通路,來源:文獻補充資料
以AT3為例,在辣椒中鑒定了3個At3(Pun1)的串聯拷貝,編碼假定的酰基轉移酶且在某些辣椒屬植物中對辣度起調控作用。野生和栽培辣椒中AT3-D1和AT3-D2均在保守的DFGWGKP結構域有氨基酸替換。對AT3-D1的分析表明(圖2),在非辛辣基因型中,pun1等位基因(C位點)有2724/2930bp的缺失,橫跨假定的啟動子區和第一外顯子。在辛辣的辣椒品種中,AT3-D1和AT3-D2(圖3)同樣鑒定到了短InDel和單堿基非同義替換。
圖2. AT3-D1基因結構,來源:文獻補充資料
圖3. AT3-D2基因結構,來源:文獻補充資料
辣椒素生物合成相關基因的組織特異性和發育相關表達模式檢測發現(圖4),多數基因家族,除ACL-D4和ACL-D5外,伴隨辣椒素積累呈現組織和發育階段特異性的表達模式。然而CCoAOMT-D9、AT3-D1和AT3-D2只在辣椒素合成的果實發育階段顯著表達。上述基因在5個非辛辣種的表達模式顯示,AT3-D1檢測不到或微量,表達缺失可能由于pun1等位基因的大片段缺失,使其成為非辛辣辣椒中的假基因。有趣的是,在非辛辣種中,AT3-D2的表達或能保持微量的辣椒素和二氫辣椒素。推測AT3-D1和AT3-D2在C位點的劑量補償效應形成了辣椒中辣度的差異。
圖4. 辣椒素生物合成相關基因表達模式,來源:文獻原文
2. 棉纖維形成和伸長相關基因分析
這篇2012年的Nature Genetics文章通過對開花后3天(DPA)胚珠的轉錄組測序,在無纖維的雷蒙德氏棉和有纖維的陸地棉之間發現了關鍵成纖維基因的轉錄本的定量差異,包括Sus、KCS、ACO、MYB和bHLH基因。
鑒別到的4種蔗糖合酶(Sus)基因中,3種(SusB、Sus1和SusD)在陸地棉中表達量大幅高于雷蒙德氏棉。(圖5)
圖5. Sus基因表達量差異,圖片來源:文獻原文
若干種3-酮乙基-輔酶A合酶(KCS)基因,包括KCS2、KCS13和KCS6只在陸地棉中表達,而兩種棉中都存在中等表達量的KCS7基因。表明高表達水平的Sus和KCS基因家族對于纖維細胞的形成和伸長可能確為必需的。(圖6)
圖6. KCS基因表達量差異,圖片來源:文獻原文
相對的,編碼1-氨基環丙烷-1-羥酸氧化酶(ACO)的轉錄本在雷蒙德氏棉存在極端高含量,表明乙烯在纖維細胞發育早期有重要作用。(圖7)
圖7. ACO基因表達量差異,圖片來源:文獻原文
此前研究提出假設,即棉纖維在形態和起源上與植物表皮毛相似,表皮毛為多種植物組織中存在的毛狀表皮細胞,常見于葉片和莖表面。假設提出,在擬南芥表皮毛發育中起重要作用的轉錄因子可能與棉纖維形成相關。在擬南芥中,MYB和bHLH類轉錄因子與TTG1形成復合物共同起作用調控表皮細胞發育。總計2706個轉錄因子,包括208個bHLH和219個MYB基因在雷蒙德氏棉基因組中得到鑒定。大量的MYB和bHLH基因在陸地棉胚珠中顯著表達,而雷蒙德氏棉胚珠中只有殘量表達,表明這些基因的部分可能為纖維早期發育所必需。(圖8)

圖8. MYB和bHLH基因表達量差異,圖片來源:文獻原文
這篇文章同樣對棉子酚生物合成基因進行了鑒定和進化分析。棉會產生一種獨有的萜類,包括脫氧半棉酚、半棉酚、棉子酚、半棉酚酮、殺實夜蛾素。棉植株在色素腺體中積累棉子酚及相關倍半萜類來防御病蟲害。大部分棉倍半萜類都有一個共同前體衍生出來,(+)-δ-杜松萜烯,由(+)-δ-杜松萜烯合酶(CDN)通過法尼基二磷酸的環化作用合成,是棉子酚生物合成的第一個關鍵步驟。以前,CDN-A和CDN-C均被報道編碼CDN酶活性。利用雷蒙德氏棉和其他8種有參物種的進化分析表明,除了水稻,萜環化酶基因家族為多種植物所共有。然而,只有雷蒙德氏棉和可可(同屬錦葵目Malvales)擁有具生化功能的CDN1基因家族。似乎棉子酚合成能力與古六倍體和全基因組倍增事件均相關相關。在近緣分支的番木瓜和毛果楊中沒有發現CDN1的同源基因,表明棉子酚的產生是在這些物種分離之后出現的。DDtYD和DDVAE結構域是棉子酚生物合成的關鍵因素,其他植物萜環化酶基因不編碼含DDVAE結構域的蛋白因此不屬于CDN同源基因。
圖9. 棉子酚CDN1基因家族進化分析,圖片來源:論文原文
3. 木槿的花期和抗病基因
2017年DNA Research的一篇文章做了木槿的de novo測序并研究了花期調控和植株抗性相關基因。不同植物花發育的的遺傳和分子機制是高度保守的,包含4種主要的開花通路(光周期、自主調控、春化作用和赤霉素)。光周期通路中主要的開花信號受到FLOWERING LOCUS T (FT)的調控,而春化作用通路是通過暴露于特定刺激物后FT抑制劑的去除起作用。木槿是長日照開花植物,花期長且每天開花20~30朵不等。而一朵花只開放一天。為了揭示調控這些表型的遺傳機制,研究了無油樟、擬南芥、可可、雷蒙德氏棉和木槿中4個開花通路涉及的基因,且研究了花、子房、根和葉等不同木槿組織中的基因表達模式。
花期基因的進化分析識別到木槿特異性的分支。由于花期經常取決于基因拷貝數,使用擬南芥的基因為參考,界定不同植物基因組中拷貝數變化,發現木槿的拷貝數為其余4者的2~7倍。本研究涉及的花期調控基因中,涉及晝夜節律調節(CO,ELF4, FKF1, GI, LHY, PHYs)和花芽形成(FCA, FLK, FT,LFY, VIN3, SOC1, TFL, SVP)基因數在木槿中顯著提高。此外,調控光敏色素A信號的FAR1家族基因的拷貝數在木槿中更高。穗狀花序的植物,如大麥、水稻、小麥,同樣包含FAR1基因的高拷貝數,因此,FAR1的高拷貝數或可同樣影響木槿的表型。(表1)
表1. 花期基因拷貝數比較,圖片來源:論文原文
多數抗病基因家族(R)編碼含NBS和富含亮氨酸重復序列(LRR)的胞內蛋白。編碼NBS的R基因家族是木槿最大的基因家族之一,含472個基因,約為無油樟和擬南芥的3倍。這些基因基于Toll/白細胞介素受體(TIR)結構域的差異分為2個分支。相比番茄、雷蒙德氏棉和可可,木槿中TIR基因顯著過表達。錦葵目植物(木槿、可可、雷蒙德氏棉)中多于70%的編碼NBS的基因在26個亞類中共享,表明多數R基因由共同祖先衍生而來。另外,木槿中來自4個亞類的125個NBS編碼基因約比其他錦葵科植物擴增了5倍,而來自7個亞類的18個NBS編碼基因為木槿獨有。木槿基因組中TIR和RPW8編碼基因亞類顯示出廣泛的擴張,經歷了不均等復制事件,顯示出植物基因組中高度多樣性。木槿基因組中不同的R基因組成提示成簇的R基因的擴張和多樣性可能涉及種系特異性的基因倍增事件,最終導致近緣種的趨異進化。這些結果為多年生植物中花期和抗病基因的進一步比較分析提供了初步的信息支持。(表2)
表2. NBS-LRR基因家族數目比較

參考文獻
[1] Qin C, Yu C, Shen Y, et al. Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J]. Proceedings of the National Academy of Science, 2014, 111(14):5135-40.
[2] Wang K, Wang Z, Li F, et al. The draft genome of a diploid cotton Gossypium raimondii.[J]. Nature Genetics, 2012, 44(10):1098.
[3] Kim Y M, Kim S, Koo N, et al. Genome analysis of Hibiscus syriacus provides insights of polyploidization and indeterminate flowering in woody plants[J]. Dna Research An International Journal for Rapid Publication of Reports on Genes & Genomes, 2017, 24(1):71-80.