关于蛋白质组学,你是不是已经听了太多公司的宣讲,介绍了一大堆的技术名词,反而越听越懵懂,脑袋一团乱麻?就和传话游戏一样,当我们接收了多手信息以后,得到的信息就越不准确。那么,何不自己看一看第一手信息呢?比如说DIA。
这里只推荐两篇综述。
第一篇是蛋白质组学泰山北斗的Ruedi Aebersold和Matthlas Mann合作发的,该文不止介绍DIA,是对整个目前蛋白质组的bottom-up得研究策略做的一个总结和展望。
整个bottom-up的蛋白质组学研究流程如下图所示:
第二篇也是Ruedi写的,特别针对DIA的综述,值得一读。虽然两篇文章都是三四年前发的,但整个领域这几年也没什么太大的进步,依旧可以当成新的看。
个人厘清:
- 大佬们把当前bottom-up的蛋白质组学研究分为三种类型:DDA、靶向和DIA,DDA研究的蛋白覆盖广,靶向研究准确性高,而DIA研究结合了两者的优点(实际上是有争议的,尤其在谱图解析的速度和准确性上)。
- DDA(Data Dependent Acquisition)和DIA(Data Independent Acquisition)只是两种数据采集模式,即离子全采集还是部分采集,而非某种具体的蛋白质定量方法(如DDA labelfree、iTRAQ等)。其方法是:将整个质谱扫描质量范围分为若干小窗口,依次对每个窗口的所有离子进行碎裂,使其能够对扫描区间内的所有肽段离子进行高速一级MS扫描,再进行二级MS/MS分析。
- SWATH(Sequential Window Acquisition of all Theoretical Mass Spectra)只是若干DIA技术中的一种,由ETH Zürich的Ruedi Aebersold团队与AB SCIEX公司合作开发。同时期还有Waters公司也开发了一种叫全信息串联质谱(MSE)的DIA技术,不过现在没怎么听说了。因为Ruedi是和AB公司合作的,所以质谱仪用的QTOF,专门开发出这样一种SWATH采集模式,相应的Ruedi团队开发了一个叫openSWATH的软件用来解析谱图(我们从上面综述可以看出)。所以人们就把DIA和SWATH这两个名词混用了。
- Thermo Fisher公司不甘示弱,利用自己分辨率强大的Orbitrap质谱仪也开发出这样一种全扫模式,并且干脆不起名字,就叫DIA,后来还搞了个升级版本,将多重累积技术与 DIA 相结合,称之msxDIA,当然为了凸显自己的优势,总是不忘和QTOF做对比,提提SWATH的缺点。这样一来,名称上就显得更加混乱了,现在大家默认为新技术是DIA,旧的是SWATH,其实就只是仪器不同而已。但Thermo可没有Ruedi的加持,只有自己主要做DDA数据的配套软件Proteome Discoverer来解析当然不行,于是引入Skyline 软件(华盛顿大学 MacCoss 教授开发,主要是做靶向蛋白质组学),通常做法就是用PD建库,用Skyline解析。当然openSWATH也是可做Orbitrap数据的。
DIA数据解析需要用到的工具现如今也是越来越多的,但好用的也没几个,不完全统计如下。
1.建库软件
主要是平时用的蛋白搜库软件,如:
- MaxQuant
- pFind
- Comet
- Mascot
- X!Tandem
- Proteome Discoverer
- Sequest
- MS GF+
- OMSSA
- MSFragger
- DeepMass
- Prosit
- pDeep
- SpectraST
- iSwathX
- specL
- DeepRT
2. 依赖库的DIA软件
- OpenSWATH(用的较多,免费开源,Linux)
- EncyclopeDIA
- Scaffold DIA
- Skyline(用的较多,免费,Win)
- Spector
- Percolator
- PyProphet
3. 用不用库都可以的DIA软件
- DIA-NN(去年新发NM,深度学习方法,有潜力)
- Spectronaut(用的较多,准确性高,速度慢,收费,Win)
- PEAKS(收费,可做denovo,Linux或云服务器)
4. 无需库的DIA软件
- DIA-Umpire
- PECAN
- Group-DIA
5. 做统计验证的软件
- mProphet
- pyProphet
- Percolator
以上工具部分参考了西湖大学郭天南老师的课件,祝文章早日见刊!