国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

GSEA結果怎么看?云平臺實戰解讀+多圖詳解

2025-09-07

在轉錄組數據分析中,我們常常關注哪些基因在兩組樣本(如對照組 vs 處理組)之間存在表達差異。除了常規的差異基因篩選和功能富集分析之外,基因集富集分析(GSEA) 正逐漸成為深入挖掘生物學機制的重要工具。接下來,小派將帶你系統理解GSEA的分析邏輯、結果解讀方法及其實際應用。

一、什么是GSEA?

Gene Set Enrichment Analysis (GSEA,基因集富集分析)用來評估一個預先定義的基因集的基因在與表型相關度排序的基因表中的分布趨勢,從而判斷其對表型的貢獻。其輸入數據包含兩部分,一是已知功能的基因集 (KEGG通路或GO 條目或者其他基因集),一是表達矩陣 (也可以是排序好的列表,例如根據log2FC排序基因列表),軟件分析時會對基因根據其與表型的關聯度(可以理解為表達值的變化)從大到小排序,然后判斷基因集內每條注釋下的基因是否富集于排序表的上部或下部,從而判斷此基因集內基因的協同變化對表型變化的影響。

與常規富集分析不同,GSEA不依賴于“差異基因”的篩選閾值(如log2FC和p.val),而是利用全部基因的表達變化排序信息,檢測哪些基因集在不同組別比較中整體呈現上調或下調趨勢。

二.GSEA分析結果怎么看?

(以云平臺GSEA分析結果為例)

1.GO/KEGG分析部分--下載全部GSEA結果表格

每個比較組中包含兩個結果表格,在GO/KEGG-GSEA分析部分下載查看結果。以WW_vs_TT組為例,WW_vs_TT_KEGG_GSEA_enrichment_TT.xls文件中,為在TT組(處理組)中上調的通路結果(包含顯著及非顯著通路),在WW文件中,則是在WW組(對照組)上調(即在處理組中下調)的通路結果。

下方為GSEA_enrichment表格示例

ID&Description:基因集的名稱(GO term或KEGG pathway名稱);

Size:通路/條目下包含的基因數目(經過條件篩選后的值);

ES:富集得分(enrichment score);

NES:ES的標準化值(normalized enrichment score),同時考慮基因集的個數及基因數目,NES的值代表該基因集中的基因在整體基因排序列表中的富集程度。簡單理解NES為正值基因集上調,負值基因集下調

NOM p-val:P-value,針對ES的排列檢驗,表示基因集富集的顯著性;

FWER p-val:用FWER法(Bonferonni校正)校正后的P值;

FDR q-val:FDR法校正的p值;

RANK AT MAX:當ES值達到最大時對應的那個基因在排序好的基因列表中所處的位置;

LEADING:核心基因集,對ES貢獻最大的基因成員;該處有3個統計值:

tags:核心基因集占該基因集中基因總數的百分比;

list:核心基因占所有基因的百分比;

signal:將前兩項統計數據合在一起計算出的富集信號強度;

CORE ENRICHMENT:該通路下的核心基因列表。

2.GO/KEGG-GSEA富集分析圖部分-查看每個條目/通路富集分析圖片

每個條目或者通路具體的GSEA富集圖(重要)在GO/KEGG-GSEA富集分析圖部分查看。

GSEA富集圖共包含三部分:

第一部分是排序后所有基因rank值的分布,熱圖紅色部分對應的基因在TT組中高表達,藍色部分對應的基因在WW組中高表達;

第二部分用線條標記了基因集合中成員出現在基因排序列表中的位置,黑線代表排序基因表中的基因存在于當前分析的功能注釋基因集,每個黑線代表該通路中的一個基因;第三部分,Enrichment score折線圖,:顯示了當分析沿著排名列表按排序計算時,ES值在計算到每個位置時的展示。最高峰處的得分 (垂直距離0.0最遠)便是基因集的ES值。

在上圖中,我們一般關注ES值以及NES值,p-value值以及adjust-P值,NES為正值代表基因集在處理組上調,負值代表基因集在處理組下調(也就是在對照組上調),一般認為|NES|>1,NOM p-val<0.05,FDR q-val<0.25的通路是顯著富集的。在右側分析設置部分可選擇不同比較組以及關注通路重新分析運行。

除了上述圖片,每一個通路(條目)包含一個表格文件,在表格中主要關注哪些基因是核心基因,也就是對富集信號貢獻最大的基因,后續可以挑選核心基因進行進一步篩選、驗證。

SYMBOL/Name:基因名;

RANK IN GENE LIST:表示在排序好的基因集中所處的位置;

RANK METRIC SCORE:表示基因排序評分

RUNNING ES:表示分析過程中動態的ES值;

CORE ENRICHMENT:是對ES值有主要貢獻的基因,即Leading edge subset(核心基因),Yes代表核心基因,No代表非核心基因。

3.GSEA-多通路富集分析圖

除了單個通路的GSEA富集分析圖之外,在高級繪圖部分還有GSEA-多通路富集分析圖,不同顏色代表不同通路,可以在右側分析設置部分切換GO或KEGG,自定義展示關注通路(最多5條,檢索時通路名需大寫)。

三、GSEA的應用場景

1.捕捉微弱但一致的表達變化;

不需要設置差異基因閾值,避免遺漏雖未達到差異閾值但生物學一致性高的基因集。

2.發現通路水平的調控機制;

尤其適合癌癥、發育、免疫應答等涉及多基因協同調控的研究場景。

3.輔助表型分型與生物標志物挖掘;

通過對通路活性進行聚類,可識別樣本亞型或發現潛在治療靶點。

派森諾項目文章應用

GSEA富集分析圖

(//doi.org/10.1016/j.cej.2025.165421)

GSEA分析表明在TSPCs組中肌肉骨骼運動相關基因集和細胞粘附分子相關基因集顯著富集,證實了TSPCs通過細胞間相互作用在組織修復中的積極作用。

GSEA-多通路富集分析圖

(//doi.org/10.1186/s12864-022-09100-8)

GSEA多通路富集分析顯示,與斑點組相比,正常組中某些通路的表達水平較低,其中鈣信號轉導通路、神經活性配體-受體相互作用、黏著斑和MAPK信號通路顯著降低。