在没有蛋白氨基酸序列的前提下进行蛋白的氨基酸 序列和翻译后修饰分析称为蛋白从头测序(de novo sequencing)。实现蛋白从头测序主要有两种方法: edman 降解法和质谱分析法。edman 降解法一般适合 15-20 个氨基酸组成的肽段,不能超过 30 个氨基酸,且对 于样品纯度要求也比较高,至少 97% 纯度以上;同时还 要进行蛋白酶解、肽段分离纯化和肽段逐一上机测试,另 外,对于一个单抗进行 edman 降解测序的时间成本和经 济成本也比较高。而与传统的 edman 降解法相比,基于 质谱的方法更加高通量、率和低成本,即使在已知蛋 白氨基酸序列的情况下,从头测序的方法也可以发现一些 新的蛋白变体,这些蛋白变体可能来自未知的突变、剪切 拼接和各种翻译后修饰,从而为单抗序列提供更加全面的 信息,因此基于质谱的蛋白 de novo 测序法已经逐渐进入 生物制药产品的研发阶段。
质谱从头测序的方法简单、快速并且直接,但是也存在很 多挑战:为了得到尽可能丰富的碎片信息,我们需要采用
多种酶酶切和多种质谱碎裂方式组合的高分辨、高质量精 度质谱进行数据采集,然后通过蛋白 de novo 测序软件的 分析和拼接,得到终的单抗氨基酸序列信息,分析流程 如图 1 所示。在此,我们使用了 trypsin,chymotrypsin, lysc,gluc 和 aspn 5 种酶进行多酶酶切,同时使用我们新的三合一超高分辨质谱 fusion lumos 进行高质量的 高能碰撞解离(hcd)和电子转移解离(etd)数据采集。 目前,在质谱数据采集过程中,常用的碎裂方式为:碰撞 诱导激活解离(cid)和高能碰撞解离(hcd)两种解离方式, 由于 hcd 碎裂产生的二级原始谱图的质量更好,与理论 的匹配度更高,因此我们更多的采用 hcd 来进行二级碎 裂,产生相应的 b,y 碎片离子。而电子转移解离(etd) 作为一种补充碎裂方式,可以产生与 b,y 离子互补的 c, z 离子,从而更加准确的确定氨基酸序列;另外 etd 可以 保留侧链易于丢失的一些翻译后修饰基团,比如磷酸化基 团,因此可以准确的确定蛋白质翻译后修饰的位点;同时由于电子转移的特征,etd 偏向于碎裂带电荷数目比较高、 质核比相对比较低的肽段,从而可以实现一些大肽段的有 效鉴定。综合考虑,etd 与 hcd 相互结合,可以准确确 定完整的氨基酸序列以及翻译后修饰位点的信息。
2 实验部分 2.1 仪器和试剂
质谱仪器:赛默飞fusion lumos(赛默飞世尔科技,美国);
色谱仪器:easy nano1000 液相色谱系统(赛默飞世尔科技, 美国); 色谱柱:home made nano column(c18,2 µm, 75×150 µm,100 å);
试剂:色谱级甲酸、二次去离子水、色谱级乙腈;
2.2 仪器方法
色谱分析条件:具体见表 1;
质谱分析条件:具体见表 2;
2.3 数据分析方法
使用 p novo 软件对原始谱图进行 de novo 分析,得到终 的肽段列表,然后再结合单克隆抗体的氨基酸结构特征进行 蛋白水平上的数据整合。
3. 结果与讨论 在 这 里, 我 们 使 用 了 trypsin,chymotrypsin,lysc, gluc 和 aspn 5 种酶进行多酶酶切,同时使用我们新的 三合一超高分辨质谱 fusion lumos 进行高质量的高能碰 撞解离(hcd)和电子转移解离(etd)数据采集,并且 通过 p novo 软件数据分析和数据整合,得到终的氨基 酸序列信息。
为了得到丰富的肽段和碎片离子的信息,我们使用了 5 种 不同的酶进行酶解,相应的一级色谱质谱流出图如图 2 所 示,可以看到使用不同的酶所产生的肽段数目和丰度不 同:lysc 和 trypsin 主要产生碱性氨基酸结尾的肽段, chymotrypsin 主要产生疏水性氨基酸结尾的肽段,gluc 主要产生酸性氨基酸结尾的肽段,aspn 主要产生天冬氨 酸开头的肽段,因此肽段的带电荷数目和长度不同,也 就造成有些肽段适合进行 hcd 分析,有些肽段适合进行 etd 分析,所以我们在后续的质谱分析中,分别对同一母 离子进行了这两种碎裂方式的解离,从而得到完整的 b, y,c,z 离子的信息,更加有利于后续的氨基酸序列的确 定和整合。以其中的一个母离子( m/z =796.3997,z=3) 为例,如图 3 所示,可以看到在不同的碎裂方式下,产生 的碎片离子的质核比和强度也是不同的,因此可以得到更 加全面的肽段氨基酸序列的信息。
基于高质量精度、高分辨率和高灵敏度兼具的原始质谱数 据,我们通过 p novo 软件搜库和人工整合后,得到了抗 体的完整序列信息。本文中以 herceptin 抗体的 de novo 测序为例,终通过 5 种不同酶切和 2 种不同的碎裂方式, 得到了如图 4 所示的氨基酸序列信息,并且与理论氨基酸 序列*一致,因此我们可以证明该分析流程可以直接应 用到常规抗体的 de novo 分析中。
针对单抗重要的 cdr 区域,我们对来源于该区域肽段 的 hcd 和 etd 原始谱图分别进行了确认。以轻链区域的 rasqdvntavawyqqkpgk 为例,该肽段对应的 hcd 和 etd 碎片离子匹配谱图如图 5 所示,hcd 碎裂谱图中碎片 离子的覆盖度为 78%,etd 碎裂谱图中碎片离子的覆盖度 为 86%,两者结合可以实现碎片离子的 100% 覆盖,由此 我们可以确定该 cdr 区域的氨基酸序列信息。同理,其它 的 cdr 区域也都分别进行了 hcd 和 etd 谱图的确认,另 外对于 fab 和 fc 区域,也都进行了谱图确认。由此可见 该分析流程可以准确、快速的应用到其它的蛋白药物的 de vovo 分析中。
4. 结论 本文基于新的三合一超高分辨质谱平台 fusion lumos, 通 过 trypsin,lysc,chymotrypsin,gluc 和 aspn 5 种酶进 行多酶酶切,采用 hcd 和 etd 两种互补碎裂方式,以及后 续的软件分析和人工确认,建立了单抗药物简单、快速的 de novo 质谱测序分析流程,为未知氨基酸序列蛋白药物的 分析和确认提供了质谱方法,有望大规模应用于生物制药企 业的早期研发中。
