2017-08-31
發表期刊 Nature Genetics
影響因子 27.96
在GWAS分析中找不到Peak SNP腫么辦?如果你也有這樣的苦惱,我們一起來看一看高大上的文獻是怎么做到的?最近在Nature Genetics上刊登了一篇陸地棉選擇消除分析和GWAS相結合的文章,該研究利用基因組重測序技術對陸地棉在馴化過程中受到的選擇區域進行鑒定和驗證,并對控制皮棉產量和棉纖維質量等多個重要農藝性狀相關的基因進行快速定位,而且定位效果非常不錯哦,部分性狀直接到單基因水平!
研究背景
陸地棉是世界上最重要的棉花栽培品種,占全球棉花種植面積的90%以上。然而其栽培種的遺傳多樣性以及在改良過程中一些遺傳特性的變化仍然未知。
研究方法
對318株來自世界各地的陸地棉樣本進行重測序,包括35個地方種,258個改良種、13個優質栽培種以及12個近緣外群品種。
測序平臺Illumina HiSeq2500,測序深度5X,PE文庫
研究結果
1. 遺傳變異檢測及群體結構分析
通過對318株陸地棉進行重測序,與參考基因組TM-1比對,共鑒定到8,621,073個SNPs,其中A、D亞基因組特有SNPs分別占31.2%和20.5%。進化樹分析結果表明陸地棉栽培種的遺傳多樣性較低,大多來源于同一祖先。地方種和改良種之間的Fst值僅有0.04,群體分化程度較低。
陸地棉在馴化過程中經歷了比較弱的選擇作用,在地方種和改良種的基因組中共檢測到25個信號較弱的受選擇區域,其中只有3個報道過,說明這些基因座可能經歷了二次選擇作用。

2. 全基因組關聯分析
利用1,871,401個高質量SNPs的表型數據進行GWAS分析,共鑒定到119個性狀相關位點,其中71個與皮棉產量相關,45個與纖維質量相關,另外3個與黃萎病抗性相關。進一步分析發現皮棉產量和纖維質量相關位點在A亞基因組上的數量要多于D亞基因組,然而,3個與黃萎病抗性相關位點全部位于D亞基因組上。結合GWAS分析和選擇清除分析,在4個受選擇區域周圍發現了控制棉花衣分、纖維長度和強度的基因座。

3. 增加皮棉產量的兩個候選基因
通過多種分析方法相結合,鑒定到了與多個農藝性狀相關聯的兩個基因座,它們與棉花衣分、株鈴數的增加和籽指降低有顯著相關性。在位于A02染色體上的基因座附近,鑒定到了候選基因AIL6,該基因與擬南芥ERF型轉錄調控因子同源,轉錄組數據表明AIL6在花后20至25天高表達。qRT-PCR分析結果表明AIL6在TM-1中的表達量是在改良種ZMS12中的10倍;另一個是位于D08染色體2.8-3.0Mb區段內的EIL基因,該基因在TM-1和ZMS12中差異表達,qRT-PCR分析也再次驗證了該結果。

4. 與其他農藝性狀相關的候選基因
在75.90-76.05Mb的LD連鎖區域內鑒定到一個候選基因——GhXIK,該基因編碼XI-K肌球蛋白家族的一個成員,該基因在纖維伸長和次生細胞壁合成過程中高表達。非同義突變導致1,011位的丙氨酸突變為纈氨酸,這與棉纖維長度、纖維強度的增加以及棉纖維的整齊度提高顯著相關。在3個與黃萎病抗性相關基因座附近,鑒定到一個編碼疾病抗性相關蛋白的候選基因。
結論
該研究將GWAS分析、轉錄組數據、GBA以及擬南芥直系同源基因的功能注釋進行了有效整合,在陸地棉中快速鑒定到多個與重要農藝性狀相關的候選基因,并進行了功能驗證。這對于陸地棉栽培種的改良以及多倍體作物的進化分析具有重要的遺傳學意義。
文章索引
Fang L, Wang Q, Hu Y, et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits[J]. Nature Genetics, 2017, 49(7):1089.
