從而產生單個細胞類型的準確信息。然而,單細胞轉錄組結構的根本復雜性,對于弄懂這些數據提出了一個重大挑戰。
利用單細胞基因組學,我們能夠選取一個組織的細胞,根據它們的表達譜,把它們分成不同的類型,從而確定可能有一系列功能作用的細胞亞型。但是,為了正確地做到這一點,我們需要處理一些混雜因素,直到現在,我們還沒有可靠的方法解決這些混雜因素。
一種組織類型的樣本具有固有的復雜性:一些細胞將會是新的,一些則是舊的,在任何給定的時間點上它們將處于。大多數細胞類型也有隱藏的亞型,每一種可能具有不同的功能。該研究小組開發出一種新的單細胞潛變量模型(scLVM),可讓我們檢測和控制隱藏的亞結構,從而使相關的生物信號更容易識別。
已經明確了如何考慮細胞周期階段、測量噪聲或生物學過程這樣的因素,從而可能獲得不同細胞類型和亞型中基因表達的更準確信息。將單細胞分析與統計方法相結合,可讓我們確定細胞類型,否則它們仍然不被發現。
如果你所有的數據都來自于單細胞的基因表達,你就需要一種方法來識別和糾正可區分單個細胞的潛在因素,所以你可以了解其深層的生物學因素。我們的模型解釋了單細胞之間的關聯性,例如它們是否處于細胞周期的相同階段,識別可能混雜的變量,并去除它們。這也使我們更容易發現新的細胞亞型——你可能不知道已存在的變量,然后一并糾正它們。