發(fā)布時(shí)間:2022-01-15
1月6日,中國(guó)科學(xué)院廣州生物醫(yī)藥與健康研究院陳捷凱課題組開發(fā)的單細(xì)胞數(shù)據(jù)IO軟件“scDIOR”于BMC Bioinformatics雜志在線發(fā)表。該軟件統(tǒng)一了多種單細(xì)胞分析工具的數(shù)據(jù)結(jié)構(gòu),使單細(xì)胞數(shù)據(jù)能夠在不同平臺(tái)間快速轉(zhuǎn)換,減少存儲(chǔ)和內(nèi)存消耗,將顯著提升單細(xì)胞研究的效率。
單細(xì)胞測(cè)序應(yīng)用極廣,其數(shù)據(jù)具有樣本量大、信息量大、統(tǒng)計(jì)和挖掘極為復(fù)雜等特點(diǎn),科學(xué)家往往需要不斷切換不同軟件,不同平臺(tái)來(lái)滿足分析需求。然而,單細(xì)胞數(shù)據(jù)在不同平臺(tái)之間的傳輸存在技術(shù)障礙,導(dǎo)致科學(xué)家將大量的時(shí)間花費(fèi)在數(shù)據(jù)轉(zhuǎn)換上,嚴(yán)重影響研究效率。
為了解決上述問(wèn)題,陳捷凱課題組開發(fā)了軟件scDIOR,統(tǒng)一了R和python平臺(tái)的三種主流的數(shù)據(jù)結(jié)構(gòu),即Seurat,SingleCellExperiment和Scanpy。通過(guò)scDIOR,單細(xì)胞數(shù)據(jù)以統(tǒng)一的H5格式保存,無(wú)論從哪個(gè)平臺(tái)開始,只需兩行代碼就可實(shí)現(xiàn)單細(xì)胞數(shù)據(jù)在不同工具包之間的快速轉(zhuǎn)換,支持轉(zhuǎn)錄組和空間組等多種數(shù)據(jù)類型(可繼續(xù)迭代增加),最大程度地保留了原始信息。因此,scDIOR可以快速比較一項(xiàng)分析任務(wù)在不同工具包的差異;依托H5文件格式的“組”,提供部分?jǐn)?shù)據(jù)讀取功能,大幅度減少內(nèi)存消耗和時(shí)間消耗;設(shè)計(jì)了命令行指令,可實(shí)現(xiàn)批量數(shù)據(jù)轉(zhuǎn)化。綜上所述,scDIOR可以應(yīng)用建立一個(gè)標(biāo)準(zhǔn)的單細(xì)胞數(shù)據(jù)結(jié)構(gòu),將不同工具的優(yōu)勢(shì)連接起來(lái),幫助科學(xué)家更高效地完成單細(xì)胞的研究工作。
本研究在陳捷凱研究員和林立惠博士指導(dǎo)下,由生物島實(shí)驗(yàn)室實(shí)習(xí)研究員馮輝堅(jiān)完成。軟件已經(jīng)過(guò)大量用戶使用優(yōu)化,可在GitHub下載(鏈接 https://github.com/JiekaiLab/scDIOR),也歡迎提出寶貴意見(可發(fā)至feng_huijian@grmh-gdl.cn)。
單細(xì)胞數(shù)據(jù)IO軟件scDIOR
scDIOR很方便地實(shí)現(xiàn)數(shù)據(jù)在平臺(tái)間的轉(zhuǎn)換,將不同工具的優(yōu)勢(shì)連接起來(lái)
附件下載: