2019-05-29
很多(duo)老(lao)師有沒有一種感慨,辛辛苦苦做完實驗設計,測序工作(zuo),數(shu)據分析(xi)和文章撰寫(xie),在文章發(fa)表的前夕,還有一項磨人的工作(zuo)不(bu)得不(bu)做,那就是(shi)數(shu)據上傳。
為什么要進行數據上傳?
數據上傳到哪里?
怎么進行(xing)數據上傳??
突然之間的三連問是不是有點懵,不要(yao)怕,本篇軟文(wen)就來帶領大家梳(shu)理這些(xie)問題,數據上傳So easy~
為什么(me)要進行數據上(shang)傳(chuan)?
簡單來說,為了(le)發表文章,但根(gen)本原因是為了(le)幫助大家(jia)管(guan)理這些動輒幾十(shi)個G或者幾T的數(shu)據,同時(shi)實現科研共(gong)享。
數據上(shang)傳到哪里?
這里建議將數(shu)據(ju)(ju)上(shang)傳(chuan)到NCBI的(de)(de)SRA數(shu)據(ju)(ju)庫(ku)。NCBI SRA(Sequence Read Archive)數(shu)據(ju)(ju)庫(ku)是(shi)最常用的(de)(de)存放測(ce)序Raw Reads的(de)(de)數(shu)據(ju)(ju)庫(ku)(當然還有GEO等(deng)其他大的(de)(de)相關的(de)(de)上(shang)傳(chuan)數(shu)據(ju)(ju)的(de)(de)數(shu)據(ju)(ju)庫(ku),大家感興趣的(de)(de)可(ke)以自行檢索)。
將測序數據(ju)上傳至該(gai)數據(ju)庫(ku),可分為(wei)4大步(bu):
? 注冊并登錄NCBI賬號;
? 申請(qing)BioProject號(hao);
? 申請BioSample號;
? 創建SRA提交任務。?
搞(gao)清(qing)楚這4大(da)步,上傳過程不復雜(za)!
一 注(zhu)冊并登(deng)錄NCBI賬號(hao)
網(wang)址://www.ncbi.nlm.nih.gov/
1
打開網址,點(dian)擊右(you)上(shang)角(jiao) Sign in to NCBI;

2
點擊注(zhu)冊賬號 Register for an NCBI account;

3
填寫賬號(hao)郵箱(xiang)等信息(xi),點擊 Create accout 完成(cheng)注冊。

二 申請BioProject號
登錄賬號后,打(da)開網址//submit.ncbi.nlm.nih.gov/subs/,并進(jin)入,界面(mian)如下。

1
點擊 BioProject,再點擊 New submission。BioProject:主要描述測序項目(mu)的(de)(de)(de)研究目(mu)的(de)(de)(de),不同類型的(de)(de)(de)數據(如基因(yin)組和轉(zhuan)錄組)可以(yi)(yi)都放到(dao)一個BioProject下(xia)。申請成功(gong)后,NCBI會給(gei)一個類似PRJNA544896這(zhe)樣(yang)的(de)(de)(de)號(hao),申請過程任何遇到(dao)問(wen)題(ti),可以(yi)(yi)寫信給(gei)他(ta)們的(de)(de)(de)工作人員(yuan)(genomeprj@ncbi.nlm.nih.gov),很快就能收到(dao)回復;

2
SUBMITTER,填寫信息,完(wan)成后點擊continue。
注(zhu):Submitting organization:提交組(zu)織、機構或者學(xue)校等研究單位。Department:實驗室或課題組(zu)或科(ke)室名稱(cheng)。

3
SAMPLE TYPE,選擇數據類型。轉(zhuan)錄組數據選擇第(di)二個,其它數據視實際情況(kuang)選擇。Sample scope選擇Multiisolate。點擊continue;


4
輸入測序數據的(de)物種拉丁名(必填),如果是微生物細菌,還需要填寫菌株的(de)名稱(cheng)。分離提(ti)取或培養組織名稱(cheng)等,簡單描(miao)述,此處(chu)可省略(lve)。點擊continue;

5
填寫(xie)project釋放時間(jian),如沒(mei)有(you)特(te)殊要求,一般為(wei)立即釋放,Public description,主要寫(xie)數(shu)據測(ce)(ce)序目的,測(ce)(ce)序組織等(deng)。此(ci)處必(bi)須填寫(xie)。點(dian)擊continue;

6
填寫Biosample。此處省略,直接continue。因為上傳步驟一般(ban)先申(shen)請Bioproject號,再申(shen)請Biosample號。點(dian)擊continue;

7
如果文章(zhang)已經發出,可(ke)以填寫Pubmed ID或(huo)者文章(zhang)的DOI。點擊(ji)continue;如果文章(zhang)還(huan)未發出,可(ke)以不填。

8
確認填寫的信息(xi),點擊submit后提交完(wan)成。

至此Bioproject號申請完成(cheng),會立即收到郵件(jian)。

三 申(shen)請BioSample號(hao)
打開網(wang)址//submit.ncbi.nlm.nih.gov/subs/。這與BioProject號(hao)不同(tong),這里要求(qiu)每個樣品申請一個biosample號(hao)。
1
點擊(ji)BioSample后,在新的界面點擊(ji)New submission;


2
SUBMITTER,填(tian)寫信息(xi)。同BioProject。點擊continue;
3
GENERAL INFO,同BioProject,多個樣品(pin)選擇Batch/Multiple Bio Samples。點(dian)擊continue;

4
SAMPLE TYPE,選(xuan)(xuan)擇(ze)樣(yang)品的類(lei)型,植物(wu)、動物(wu)、人等,選(xuan)(xuan)擇(ze)和自(zi)己樣(yang)品分(fen)類(lei)一(yi)致(zhi)的選(xuan)(xuan)項即可。點擊continue;
5
ATTRIBUTES,上傳(chuan)樣(yang)品(pin)(pin)(pin)信(xin)息(xi)表。點擊(ji)(ji)紅色(se)箭(jian)頭(tou)處,下(xia)載信(xin)息(xi)模(mo)(mo)板。點擊(ji)(ji)綠色(se)箭(jian)頭(tou)處,可以(yi)(yi)查看模(mo)(mo)板中每(mei)一(yi)項表頭(tou)的解釋,得(de)知如(ru)(ru)何填寫(xie)樣(yang)品(pin)(pin)(pin)信(xin)息(xi)表。excel可直接打開下(xia)載的模(mo)(mo)板,如(ru)(ru)圖:表格(ge)綠色(se)部分必填,黃色(se)部分選(xuan)填,藍色(se)表示這些字段中至少有(you)(you)一(yi)個(ge)是(shi)必需的,如(ru)(ru)果信(xin)息(xi)不可用(yong),請根據情況輸入“未收集”、“不適用(yong)”或(huo)“缺少”。。每(mei)個(ge)樣(yang)品(pin)(pin)(pin)生成一(yi)個(ge)文件(先填寫(xie)一(yi)個(ge)文件試著(zhu)上傳(chuan),如(ru)(ru)果有(you)(you)報錯(cuo)可以(yi)(yi)修改,之后只(zhi)需改動樣(yang)品(pin)(pin)(pin)名即(ji)可)。點擊(ji)(ji)continue;

6
確認填寫的信息,點擊submit后(hou)提交完成。幾分(fen)鐘內就(jiu)會收到(dao)郵(you)件,包(bao)含BioSample號。
四 創(chuang)建SRA提交任務
打開網址//submit.ncbi.nlm.nih.gov/subs/,并進入。
1
點擊SRA,New submission。文(wen)件(jian)可(ke)以用gzip或者bzip2壓縮,不能用zip壓縮。注:所有文(wen)件(jian)名(ming)必(bi)須唯一不可(ke)重名(ming);


2
SUBMITTER,填寫信息(xi),同BioProject號申請。點擊continue;
3
GENERAL,填寫(xie)申請好的(de)BioProject號及數據釋放時(shi)間(jian)。點擊(ji)continue;

4
METADATA,上傳文(wen)件信息表(biao)。點擊(ji)箭頭處(chu),下(xia)載表(biao)格(ge)模板,并按照(zhao)介紹(shao)填(tian)寫(每一列都(dou)必填(tian)),填(tian)寫完成(cheng)后在(zai)瀏覽處(chu)上傳表(biao)格(ge),點擊(ji)continue。

5
FILES,上傳(chuan)壓縮(suo)好的原(yuan)始數據(ju)(ju),如果(guo)文件大于10GB,或者(zhe)多于300個(ge)文件,不能用網頁(ye)(ye)上傳(chuan),可安裝Aspera插(cha)件后上傳(chuan)。點擊箭頭處下載插(cha)件,安裝后回到(dao)網頁(ye)(ye)繼(ji)續上傳(chuan)。由于測序(xu)數據(ju)(ju)較大,網速的限制等(deng)原(yuan)因,這個(ge)過(guo)程所需(xu)時間可能較長,還請(qing)大家耐(nai)心等(deng)待哦。

6
OVERVIEW,確認填(tian)寫的信(xin)息,提交。
完成了前(qian)面的(de)(de)四個步驟,所有的(de)(de)操(cao)作就(jiu)已(yi)經(jing)完成了,靜靜等待(dai)NCBI發送序列號郵件就(jiu)可(ke)以了。
歡迎大家學(xue)習和嘗試(shi)前往NCBI上傳原始(shi)數據(ju),測序文章的成功發表,離不開數據(ju)的成功上傳,大家加油~~