發(fā)布時(shí)間:2021-03-08
近日,中國(guó)科學(xué)院廣州生物醫(yī)藥與健康研究院陳捷凱課題組、南方科技大學(xué)Andrew Hutchins課題組合作開發(fā)了單細(xì)胞測(cè)序分析轉(zhuǎn)座元件表達(dá)的工具包scTE,相關(guān)研究成果于3月5日以“Identifying transposable element expression dynamics and heterogeneity during development at the single-cell level with a processing pipeline scTE”為題,發(fā)表在Nature Communications(《自然·通訊》)雜志上。
轉(zhuǎn)座元件(TEs)是人類基因組中含量最多的遺傳信息,是指一類能夠在基因組內(nèi)移動(dòng)的DNA序列。TEs的插入和跳躍可以改變基因組遺傳信息,是物種進(jìn)化的重要原動(dòng)力。盡管大部分TEs已經(jīng)喪失了“跳躍”的能力,成為了基因組中的“分子化石”。但近年來研究發(fā)現(xiàn),TEs可以通過影響染色質(zhì)表觀遺傳修飾、轉(zhuǎn)錄因子結(jié)合、RNA編輯以及染色質(zhì)構(gòu)象等,對(duì)基因表達(dá)起著非常重要的調(diào)控作用。單細(xì)胞轉(zhuǎn)錄組測(cè)序(scRNA-seq)是研究細(xì)胞命運(yùn)狀態(tài)的絕佳技術(shù),近年來,更多的單細(xì)胞測(cè)序技術(shù)以及相應(yīng)的生物信息學(xué)分析方法也在不斷改進(jìn),總體的目標(biāo)是擴(kuò)展能捕獲的信息及挖掘能代表生物學(xué)功能的潛在維度。然而,目前從scRNA-seq數(shù)據(jù)分析的工具包都只定量基因的表達(dá),分析TEs的表達(dá)還比較困難,缺乏相關(guān)研究需要的生物信息學(xué)分析的工具包,因而忽略了基因組中含量最多的TEs來源的遺傳信息。
為填補(bǔ)這一研究的空白,研究團(tuán)隊(duì)開發(fā)了能夠從scRNA-seq數(shù)據(jù)中同時(shí)定量基因和TEs的表達(dá)的生物信息學(xué)工具包——scTE。由于TEs為多拷貝重復(fù)序列,與常規(guī)基因不同,同一類TEs通常有成千上萬個(gè)不同的拷貝遍布在全基因組,并且每個(gè)拷貝間的序列高度相似,因此,針對(duì)TEs的分析通常難以做到單位點(diǎn)準(zhǔn)確定量。為解決這一問題,同時(shí)由于常規(guī)scRNA-seq只有較短的測(cè)序讀長(zhǎng)的因素,scTE采用了針對(duì)TEs家族層面的定量策略,這一策略忽略了基因組位置信息,提高了TEs的定量準(zhǔn)確性。研究團(tuán)隊(duì)利用scTE,通過分析小鼠胚胎發(fā)育和人類疾病scRNA-seq數(shù)據(jù),發(fā)現(xiàn)了一系列細(xì)胞命運(yùn)、疾病狀態(tài)特異性高表達(dá)的TEs,提示這些TEs的表達(dá)可能與胚胎發(fā)育或疾病的發(fā)生發(fā)展有關(guān),也證明了通過scRNA-seq分析TEs的表達(dá)很有必要。
相對(duì)scRNA-seq研究轉(zhuǎn)錄組而言,單細(xì)胞ATAC-seq(scATAC-seq)等單細(xì)胞基因組技術(shù)研究的對(duì)象是染色質(zhì),染色質(zhì)開放性與表觀遺傳修飾情況在很大程度上決定了基因表達(dá)豐度,以scATAC-seq為代表的單細(xì)胞基因組學(xué)技術(shù)的開發(fā),讓獲得“高分辨率”的單細(xì)胞精度的染色質(zhì)開放/修飾圖譜變?yōu)榭赡?,有利于?gòu)建從DNA到RNA再到表型的調(diào)控網(wǎng)絡(luò),尋找與表型強(qiáng)相關(guān)的核心調(diào)控因子。然而,以scATAC-seq為代表的單細(xì)胞基因組測(cè)序數(shù)據(jù)存在幾個(gè)特點(diǎn):一)高維度。每個(gè)細(xì)胞中可以檢測(cè)到可能開放的區(qū)域可以高達(dá)幾十萬個(gè);二)數(shù)據(jù)的稀疏性。由于技術(shù)原因,導(dǎo)致大量開放的區(qū)域沒有檢測(cè)到信號(hào)。由于以上原因,目前對(duì)scATAC-seq數(shù)據(jù)的生物信息學(xué)還存在比較大的挑戰(zhàn)。研究團(tuán)隊(duì)提出由于TEs多拷貝的特點(diǎn),通過累積TEs信號(hào)可以去除數(shù)據(jù)的稀疏性,降低數(shù)據(jù)的維度,或許能夠有效彌補(bǔ)scATAC-seq數(shù)據(jù)以上兩個(gè)挑戰(zhàn)。研究團(tuán)隊(duì)利用scTE,發(fā)現(xiàn)僅利用TEs信號(hào),能夠?qū)cATAC-seq數(shù)據(jù)中主要細(xì)胞類型區(qū)分開來,提示TEs信息對(duì)scATAC-seq等單細(xì)胞基因組數(shù)據(jù)的分析是很好的補(bǔ)充。
科學(xué)界普遍認(rèn)為,TEs被H3K9me3或DNA甲基化等機(jī)制沉默,只有在早期胚胎發(fā)育、神經(jīng)細(xì)胞等特定少數(shù)細(xì)胞類型或細(xì)胞受到表觀遺傳藥物干擾時(shí)才會(huì)被激活??蒲腥藛T通過scTE的研究,可以發(fā)現(xiàn)發(fā)育過程中存在大量與細(xì)胞命運(yùn)轉(zhuǎn)化過程高度相關(guān)的TEs家族,提示TEs參與發(fā)育相關(guān)的功能。病理情況下特定細(xì)胞TEs的表達(dá)也會(huì)發(fā)生變化,可能具有病理機(jī)制或標(biāo)志物的研究前景。TEs也被發(fā)現(xiàn)作為增強(qiáng)子參與胚胎發(fā)育和免疫應(yīng)答,如小鼠中轉(zhuǎn)座元件RLTR13D5作為增強(qiáng)子參與胎盤發(fā)育,靈長(zhǎng)類特有的轉(zhuǎn)座元件MER41可以作為增強(qiáng)子快速響應(yīng)干擾素誘導(dǎo)的免疫應(yīng)答,因此結(jié)合scATAC-seq對(duì)TEs區(qū)域的數(shù)據(jù)信息進(jìn)行挖掘是有必要的。綜上,scTE能夠幫助研究者將研究對(duì)象擴(kuò)展到基因之外的常規(guī)研究中大量被忽視的有用的遺傳信息。
生物島實(shí)驗(yàn)室何江平副研究員為本論文的第一作者,中科院廣州生物醫(yī)藥與健康研究院陳捷凱研究員、南方科技大學(xué)Andrew Hutchins研究員為本論文共同通訊作者。
scTE原理示意圖
附件下載: