「SCIEX质谱档案」同位素丰度信息和MS/MS数据(乐高盲盒活动)
现在质谱分析是一种确认已知化合物和未知化合物的成熟技术,事实上,分析物质量测量得越准确,测定结果就越精准。精确质量质谱系统能够在低浓度的范围内进行精确测量,这与其高分辨率能力有关,因为较窄的峰型可以提高测量的精度。对于相当干净的样品,简单的直接进样或液相色谱质谱(LC-MS)实验就足以通过高分辨率、精确的质谱扫描就可确认可疑或已知化合物,然而,许多应用需要鉴别样品中的未知化合物,如杀虫剂、抗生素、天然产物或药物代谢物。当未知化合物的的分子量很大时,与测量质量相匹配的可能元素组成数量也会增加;虽然更高的质量精度可以减少元素组成的可能数量,即使获得最高的质量精度和分辨率,但仍会有很多可能的元素组成不能排除。如图1所示,获得质量精度在1 ppm以内的化合物质谱数据,并且只考虑含有C、H、N和O四种元素,仍然会产生多种可能的元素组成,特别是当分子量很大时,无论分辨率多大,都会给出多种可能的元素组成。图1、3个不同分子量的可能元素组成的数目。即使质量误差小于1 ppm,并且仅考虑元素C、H、N和O,仍给出多种可能的元素组成;获得更高的质量精度质谱数据能降低可能的元素组成数据,但随着分子量的增加(和考虑其它元素的因素),仅使用质量精度并不能确定唯一的元素组成(确证)。[1]因此,仅靠高分辨率和高质量精度这两维质谱数据,往往并不能确定一个唯一的元素组成,如果考虑到更多的元素时,更是如此。此外,高分辨率准确质量数据结合相应的同位素比率数据以及限定分子元素组成的智能规则可以缩小可能的范围。Kind和Fiehn在2006年证明,同位素比率数据结合精确质量数据在减少可能的元素组成方面比单纯依靠更高的分辨率和质量精度更占优势 [2];当考虑元素C、H、N、S、O和P时,即使0.1 ppm的质量精度也不能对分子量超过185.9760 Da的化合物给出唯一的元素组成。只有理论误差极低的正交同位素丰度数据(RMS 1-5%)才能极大减少候选分子式的数量。如图2所示,无论分析物的浓度如何改变,四极杆飞行时间(QTOF)质谱系统在保持准确的同位素丰度方面非常出色;实际情况是,分析物的浓度是影响其它质谱平台性能的一个重要因素。在更高的扫描动态范围内,或存在高丰度离子条件下,检测低丰度离子时,能获得的精确同位素丰度比数据是至关重要的指标。使用QTOF仪器,分析物在同一次扫描过程中,离子丰度比的测定几乎不受分析物高浓度和低浓度的影响,当分析复杂样品时,此种情况经常会碰到。图2. 宽的扫描动态范围。SCIEX高分辨质谱TripleTOF™ 系统和X500系统有超过四个数据级的动态范围,更宽的动态范围确保了的同一次扫描分析中,高丰度离子不会造成低浓度化合物中低丰度离子的同位素比变形。相反,捕获阱类型质谱系统,如傅里叶变换离子回旋共振(FT-ICR)质谱和轨道阱捕获质谱,在同一次扫描分析时,当高丰度离子存在的情况下很难看到低丰度离子,这会使离子的同位素比率受到干扰,并导致假阳性或假阴性结果。考夫曼和沃尔克的一篇论文对此进行了举例说明 [3],在他们的论文中,他们分析了用纯溶剂溶解的磺胺嘧啶和肾提取物中的磺胺嘧啶。在纯溶剂中,可以清楚地观察到所有离子的同位素,而在肾提取物中,由于在同一扫描中有大量的生物基质干扰,一些目标物的同位素丢失了;为了避免这种情况,只能将采集范围缩小,以消除干扰,才能准确地观察到相关的同位素。虽然这样处理解决了该样品的问题,但当大范围筛选分析物时,这一策略是不切实际的,特别是从复杂的生物基质中提取的样品,因为获得尽可能多的分析物质谱信息,需要较宽的质荷比(m/z)扫描动态范围。在Kind和Fiehn发表的另一篇论文中,他们指出,对于药物——坎格雷洛(Cangrelor),它含有8种不同的元素,其分子式为C17H25Cl2F3N5O12P3S2,精确分子量为774.94831 Da(CAS号:163706-06-7),即使在正负0.1 ppm的质量精度误差范围内,也可能有超过449种不同的元素组合。当使用更符合实际情况的1 ppm质量精度时,可能会给出4,465不同的分子式;以±5% 的精度加上相应的同位素比信息时,可排除掉4330种分子式,给出的可能分子式结果比单纯依赖高分辨率和质量精度的要少很多 [4]。因此,精确质量质谱数据和精确的同位素丰度数据组合策略是缩小可能的分子式和确定未知化合物的最有效的方法;然而,许多化合物往往可以匹配相同的化学分子式,那下一步如何做?更高的分辨率、更高的质量精确度、更精确的同位素丰度比数据以及更智能的元素组合规则,都无法确定这个分子式与哪一种化合物匹配。显然,还需要更多的质谱数据,更多的质谱数据就是串联质谱(MS/MS)。真相1:QTOF质谱系统,无论样品基质复杂程度和扫描条件如何,其一级分辨率均大于40000,质量精度小于1 ppm,不同的扫描方式下其动态范围宽(4-5级),准确的同位素丰度误差值范围都在2%以内。准确质量数据与相应的同位素丰度数据结合是缩小未知化合物化学分子式的有效方法,再结合智能过滤规则的元素组成,在某些应用领域,通常可以给出一个特定的化学分子式,但这仍然会带来另一个问题——多个化合物完全可以匹配相同的这个化学分子式,并且随着化合物分子量的增加,这种情况变得更加突出。更复杂的问题是,许多样品往往来自复杂的环境或生物基质,如血液、组织、土壤或食物,这些样品中有成百上千的分析物和杂质,在液相色谱质谱联用(LC-MS)分析中,共流出物背景干扰和其它分析物使样品中的质谱数据分析更加复杂化。不幸的是,没有任何高分辨率质谱可以鉴定2个共洗脱质量相同的化合物,这种情况下,只用质谱数据鉴定是不可能的。而改善样品前处理步骤,或采用不同的色谱方法来改变保留时间等策略也是一种解决方案,但现在更好的策略是简单地使用串联质谱(MS/MS)。图3显示,用准确质量和同位素丰度数据可以将给定的已知化合物的分子式给出—— C7H15NO。然而,有超过2000种化合物匹配这个分子式。图3. 高分辨准确质量二级质谱鉴定未知化合物。上图显示的是理论质量为129.2001的C7H15NO的ChemSpider质谱数据库结果。超过2000种化合物与此分子式相匹配,因此仅凭这一信息无法确定确切的化合物。典型的LC-MS/MS工作流程是用数据依赖策略(IDA-- information dependent acquisition)采集MS数据和MS/MS数据,或用数据非依赖DIA-- data independent acquisition)策略采集(如SWATH®采集);高分辨率准确质量MS/MS数据提供了新的和独特的信息,这些信息能更明确的鉴定化合物。如图4所示,实验中得到的MS/MS数据与高分辨数据库进行检索匹配,这种策略更加准确鉴定,因为获得的MS/MS质谱碎片离子具有高分辨率和高质量精度,能提高检测检索的置信度[5]。根据不同的应用,LC-MS/MS数据可以在数据库中检索或在谱库中匹配,大量蛋白质序列数据库存在于蛋白质组学研究中,且有高度自动化的蛋白质鉴定工作流程。也有包含数千种化合物的二级质谱数据库,这些质谱数据库涵盖了许多种类化合物[6],还有各种专门领域的数据库库(如杀虫剂或天然产物数据库)。典型的工作流程是将准确质量、同位素丰度和相应的二级碎片离子质谱这些信息与化合物数据库存进行匹配,并根据检索标准评分规则进行反馈匹配项的分数。但是如果谱库中没有化合物的信息,或者匹配不好,该如何处理?对于这些化合物,根据质谱数据的准确质量和同位素丰度数据推断出的化学分子式,将此分子式引入ChemSpider质谱数据库中检索,可给出化合物的结构信息。所有这些工作流程(数据库检索、数据库匹配,ChemSpider策略)都可用于对不同化学分子和种类进行高通量筛查和鉴定,包括农药、天然产物、多肽、蛋白质、代谢物、脂质、聚糖、生物标记、塑料、真菌毒素、抗生素、兽药、侵出物、染料、合成药物等等不同种类的有机物;为这些应用开发的丰富数据充分说明了四极杆飞行时间(QTOF) LC-MS/MS策略的广泛用途。所提供的这些丰富数据是鉴别和确认未知化合物的理想工具。但如何进行定量分析?QTOF质谱系统的灵敏度是否能足以准确地定量极低含量的分析物?答案是肯定的。QTOF质谱系统可以为多种应用提供高准度和全面的定量分析。真相2:QTOF质谱系统的二级分辨率也超过30000,质量准度小于2 ppm,同位素丰度误差在2%之内,此这些与样品的复杂性无关。将高分辨率、准确质量和准确同位素丰度的质谱数据与高分辨率、准确质量和准确同位素丰度的质谱/质谱数据相结合是识别未知化合物最有效的方法。
2021-05-31