Yuliang Zhang

Paper-sharing 2018 第一期

2018-01-03


本期分享一篇2017年11月5号《Cell》发表的利用单细胞测序得到的转录组数据对衰老进行研究的文章,题目是:Single-Cell Analysis of Human Pancreas Reveals Transcriptional Signatures of Aging and Somatic Mutation Patterns ,理解本文大致需要的知识有:

本文的主要结论有两点:

  1. 随着年龄的增加,同一类型细胞的同一转录本的差异变大,也就是作者定义的transcription noise变大,Transcription noise的可以简单理解为在年轻时都能稳定分泌胰岛素的细胞在衰老时,各个细胞之间胰岛素的分泌量的差异变大,本文是第一篇在全转录组水平上揭示了这一现象的报道。
  2. 衰老所引起的DNA的突变并不是影响transcription noise增加的原因。(与之前研究提出的假说是不符的)

接下来通过梳理这篇文章的为证明以上结论提供的证据,从我的角度简单的谈一下这篇文章的优缺点。

实验样品与流程

本文选取了年龄跨度为1个月到54岁的个体的胰腺组织,分别是1个月新生儿、5岁、6岁少年、21岁、22岁青年、38岁、44岁、54岁中老年人共计8个个体,具体的Donor信息可以在附表一中查到。主要的实验为单细胞分选测序,其他一些验证实验在出现时在进行讨论。首先通过流失细胞仪分选的方法把单细胞分选到96孔板上,每个孔中有一个细胞,之后再96孔板上原位裂解,建库,进行单细胞转录组测序(paired-end),总共得到2254个单细胞的转录组数据。

数据分析

对于第一个结论,作者提供了较为直接的证据,正文中的图一和图二是主要的证据,并且都是强证据,先来分析一下图一的证据:

Fig.1

Fig.1A是单细胞转录组分析的常见套路,即通过转录本的表达量进行分类,一般常用的分类方法为k-means,之后再通过主成分分析或者tSNE的方法提取两个主成分画成二维的图来展示分类结果,具体判断通过k-means分类后的细胞在生物学上究竟属于哪一种细胞,要通过这一类细胞特异表达的marker gene来判断,分类结果反映了这篇文章把细胞分为了7类,并且类之间分的还是比较开的。

Fig.1B中CDKN2A是衰老相关的一个marker gene,可以发现从年老个体取的胰腺组织表达此基因的细胞的占比明显要高,但这图的纵轴如果直接给出这个基因的表达量才是一般的展示方式,不知道是不是藏了一些什么东西。

Fig.1C是直接证据,其中mRNA/ERCC variation 即为Transcription noise1,可以发现,高年龄组的transcription noise要高于低年龄组。 Fig.DE略

Fig.2

图二的证据与图一有一定重复,但也提供了更多的信息量,但是图二中的Age的定义有些不太好,图二至少还可以再补一张小图。

Fig.2A中分别举了 α-cellsβ-cells 的例子,胰腺的α-cells主要行使分泌胰高血糖素的作用,因此其 GCG 基因的表达量也就是纵轴所表示的值应当较高,但是随着转录噪音(Transcription noise)的增加,其 GCG 基因的表达量逐渐降低,反而 INS 基因(胰岛素蛋白的基因)的表达量上调,其逐渐失去了作为 α-cells 细胞的特异性,同样的在负责分泌胰岛素的 β-cells 中也出现了类似的现象。

Fig.2B主要说明转录噪音随着年龄的增加而增加,此图中的Age不是选取样本的年龄(因为样本的年龄只有8个,因此只会有八个点,而图中的Age明显要多于8个点,推测是根据marker gene,如图一中提到的CDKN2A的表达量来估算的,也许直接用的这个基因的表达量,文章没有给出详细定义,略觉奇怪)。 根据Fig.2B提出的疑问,图二应该补一个样品实际年龄与单细胞表达数据估算的年龄值之间关系的图。

以上两个证据可以表明随着年龄的增加,同一组织行使同一功能的细胞的转录噪音增加,进而可能丧失了其功能特异性。

第二个结论的证据偏弱,主要结果集中在Fig.6。因此Fig3,Fig.4,Fig.5的结论就不详细说明,同好可私聊进一步探讨技术细节,简单地做一下说明: Fig.3、Fig.4、Fig.5是通过mRNA-seq的数据来推测细胞基因组上的突变以及发生在mRNA上的编辑事件,发现了在大脑中特异的 GRIA2 基因的mRNA editing现象。通过对单个细胞基因组突变的分析,发现胰腺细胞中一类主要的突变氧化的G:G->T,G->C,另一类是CpG岛中甲基化的C的突变C->T,之后通过荧光染色的方法证明了胰腺中胰岛细胞中普遍存在的氧化的G,证实了分析结果的正确。这一步分的分析是全文分析最出彩的地方,可以说是柳暗花明又一村,强行被作者捕捉到了这微乎其微的信号,并且后续实验图像结果的处理使用了Cellprofiler好ImageJ,感觉就是一个成熟实验室的手笔。

Fig.6

Fig.6A说明年龄的变化同时也影响了S1这种类型(突变氧化的G的突变:G->T,G->C),随着年龄的增加,氧化的G所导致的突变也逐渐增加,即图中横坐标S1 mutation load反映的值。

Fig.6C说明突变高的转录噪音不一定高,即左边红的(S1 mutation load)右边不一定红(transcription noise)。

总结

这篇文章主要描述了两个现象,即衰老可以影响基因的转录水平,使得转录噪音增加,也会使得细胞基因组的突变增加,但这两者之间没有相关关系,只不过都是由于衰老而引起的现象,提供的证据还算充分,全文出彩的地方我认为在于文章的写作与关于基因组突变的分析,按我自己的情况而言,应该可以做出Figure.1,之后的图应该就懵逼了T_T。


  1. ERCC为内参,即已经经过定量的96个RNA分子,分别加入到每一个单细胞制备好的RNA样品中,用来控制测序过程以及PCR过程中的技术误差