Paper-sharing 2018 第十一期

2018-04-11

这期分享一篇发表在 Plos Genetics 上的文章，文章的题目是 The impact of ribosomal interference, codon usage, and exit tunnel interactions on translation elongation rate variation. 文章使用了TASEP模型来对不同转录本上密码子的延伸速率进行估计，利用的是根据ribo-seq算出来的转录本的TE，这个算法的核心还是Gillespi，不展开讲了，虽然之前类似的研究已经有很多，作者也不是第一次使用这个模型，但本文的创新点在于意识到了同一密码子在不同转录本的延伸速率可能不同，并且用了一种简单有效的方法对转录本的起始效率和这个转录本上每一个密码子的对应的延伸速率进行了估计，之后利用估计得到的数据对为什么ribo-seq在起始密码子的5’端会有一个明显的峰进行了解释，这篇的图不一个一个说了，简单说说作者的算法步骤和最后的结论部分，大概两张图。

Fig1

图1大致描述了作者进行参数估计的算法，首先作者根据ribo-seq的结果给定了转录本上每一个密码子的延伸速率的估计值，利用这个初始值模拟核糖体在转录本上的翻译过程，估计得到翻译起始的速率，再进一步判断每一个密码子的延伸速率是否需要重新估计，在对错误估计的或与实际值估计差别较大的值进行进一步矫正。也就是图中展示的两个展示过程。

Fig5

这张图反应了每一个密码子在不同位置的转录位置可能可能不同，并且在转录本的前段，延伸速率相较于其他位置要偏低。

Fig7

图七是本文的主要结论，简单表述为由于在新合成蛋白质时，当合成到40个氨基酸时，此时新合成肽链中最早加入的氨基酸将开始从核糖体的exit tunnel 离开核糖体，这时最早合成的肽链的电性将影响核糖体延伸速率的快慢，作者发现带正电的氨基酸可能更容易离开，于是如Fig5.D中观察到的正电氨基酸在5’端的富集。

这篇文章总体来说事相当不错的，作者的结论基本已经可以自圆其说，并且我认为这是一个合理的解释，之前人们一直没有搞清楚为什么会出现转录本5’端核糖体密度高的问题，这篇文章仅仅通过计算并且富于联想，十分佩服，我看了code也学到了不少东西，不过也有一些美中不足的地方，首先是Gillespi算法的应用简化，与原始算法差别不小，准确性有待考量，并且发现许多用Gillespi算法的文章也存在类似问题，我觉得只要看了1977年那篇原始文献可能就会更注意了，不过估计像我这么闲的蛋疼细扣代码的人也是少数，其次看代码的过程中发现作者模拟的过程有一部分的代码写错了，不过不影响最后的结论。