模型给出假设,
实验给出真相
前四篇我们用 AI 生成了候选分子。这一篇回到现实:怎么逐级验证它真的有效、在体内为何会反直觉、有哪些分子胶独有的致命风险、肿瘤如何逃逸,以及报批时哪几件事真正与传统小分子不同。每一课都给到可直接照做的判断框架与真实案例数据。
从分子到细胞,逐级证伪假设
进入体内,PK 与药效为何解耦
脱靶降解:分子胶的生死线
失效机制与抗耐药设计
真正不同的少数关键点
实验验证级联(并反哺 AI)
把验证想成一座金字塔:从分子层一路向上证伪到细胞层,最后由蛋白组做"终审"——而每一层产出的数据都要回流到飞轮。
- 为任意一个 AI 预测的候选分子,从下到上排出一条完整的三层验证级联,并说出每层回答哪个科学问题。
- 区分"招募"与"降解",并解释为什么生物物理阳性不能推断细胞内有效。
- 读懂 SPR/ITC、TR-FRET、HiBiT 等关键读数(KD、DC50、Dmax)各自报告什么、各自的盲区在哪。
- 说清每一层实验该把"什么标签"回流进数据飞轮,从而让下一轮模型更准。
第四篇结束时,你手里拿着一个 AI 预测的候选:模型说它能和靶蛋白、E3 形成三元复合物,还预测它有不错的选择性。但请记住第〇篇那条贯穿全课的律令——AI 是假设生成器,不是真相机器。验证级联,就是把这些假设一条条拉到实验台上证伪的过程。本课不是要你记住一串仪器缩写,而是要你建立一套能落地照做的判断顺序:先做什么、用它回答什么问题、阳性/阴性各意味着什么、哪些数据要喂回模型。
这条级联有两个你必须先建立的直觉。第一,它是分层递进的:从最微观的"两个分子有没有结合"开始,一路向上走到"整个细胞里只有目标蛋白被降解了吗"。每往上一层,逼近真实生理的程度就高一点,但实验也更贵、更慢、通量更低——所以级联的工程意义是用便宜的实验先淘汰大批候选,把昂贵的实验留给少数幸存者。第二,也是本课最看重的一点——这条级联是双向的:它不仅向上验证 AI 的预测对不对,每一层产出的数据还要向回流,喂进 M3.3 讲过的"实验→标签"映射,让下一轮模型更聪明。验证不是流水线的终点,而是数据飞轮的进料口。
无细胞体系,纯蛋白 + 化合物。回答"分子之间是否产生真实物理接触、三元复合物是否成立、界面在哪"。通量较高、相对便宜,是第一道淘汰关。
活细胞体系。回答"靶蛋白是否真的被清除、降多少、多快、是否依赖泛素-蛋白酶体通路"。这一层把"招募 ≠ 降解"这道坎兜住。
定量质谱一次测全细胞数千个蛋白。回答唯一真正要命的问题:"是只有目标蛋白下降,还是有一串旁观者也跟着掉?"这是选择性的最高法院,直接通向 M5.3 的安全性。
FIG 5.1 — 验证金字塔:自下而上逼近真实,自上而下传递否决;每层数据同时回流飞轮。
▣第一层 · 生物物理:它们真的结合了吗?
最底层回答一个最朴素的问题:分子之间真的产生了物理接触吗?这里的工具各看一个侧面,组合起来才完整。关键是理解每个工具报告的物理量不同,不能互相替代:
- SPR(表面等离子共振)——测亲和力与动力学。把一方固定在芯片上,另一方流过,实时读出结合速率 kon、解离速率 koff,进而算出平衡解离常数 KD。它能告诉你"贴得多紧、贴得多快、松得多快"。对分子胶尤其要看 koff:复合物停留得够久,泛素化才来得及发生。
- ITC(等温滴定量热)——同样测亲和,但直接测结合放出/吸收的热,能把自由能拆成焓(ΔH)与熵(ΔS)的贡献。这对理解"是疏水驱动还是氢键驱动"很有用,但耗样大、通量低,通常用于少数关键分子的机制刻画,而非筛选。
- TR-FRET(时间分辨荧光共振能量转移)——直接测三元复合物本身。给靶蛋白和 E3 分别标上一对供体/受体荧光基团,只有当两者被胶拉到足够近(约 <10 nm)才出现能量转移信号。这正是验证 M4.2 那个"粘起来长什么样"假设的最直接、最适合做剂量曲线的手段——也是观察 hook 效应(钟形曲线)的经典工具。
- 天然质谱(native MS)——在接近天然状态下看复合物的真实组成与化学计量,确认到底是二元还是三元、比例是 1:1:1 还是别的。
- HDX-MS(氢氘交换质谱)——定位界面。结合会保护界面上的酰胺氢不被氘交换,于是能反推出哪段序列参与了接触,用来核对模型预测的界面位置对不对。
- X-ray / cryo-EM——拿到原子级三元结构,是界面的"金标准"。能直接看到胶如何同时接触两个蛋白、形成了哪些新接触。代价是结晶/解析难、慢,通常用于关键里程碑而非常规筛选。
初学者最常犯的错,是把亲和力(KD)当成降解力。两者不是一回事。一个分子可能与靶蛋白结合很紧(KD 很小),却几乎不诱导降解——因为降解还要求三元复合物的几何朝向正确、停留时间够长、把可被泛素化的赖氨酸送到 E2 酶能够到的位置。这就是为什么生物物理层之外,必须有细胞降解层。换句话说:生物物理告诉你"门铃按响了",细胞层才告诉你"门真的开了"。
这一层验证的是 Q2 的三元假设:模型画的那个三元结构,在真实分子上站得住吗?阳性意味着"值得往上送";阴性(不结合 / 不形成三元)意味着立即淘汰,省下后面所有昂贵实验。
▣第二层 · 细胞降解:结合之后,真的被降解了吗?
这里要接上第一篇 M1.1 那条最关键的洞见——招募 ≠ 降解。两个分子在试管里贴得很牢,不代表在活细胞里靶蛋白就会被清除:还要泛素链够得着、链型对(K48 链才高效引向蛋白酶体)、复合物停留得够久、靶蛋白上有合适的赖氨酸暴露。所以必须在细胞里直接量降解:
- WB(蛋白质免疫印迹)——最经典的"降解前后对比",直接看靶蛋白条带变淡。简单可靠,但是终点法、半定量、通量低。
- HiBiT——给靶蛋白挂一个 11 氨基酸的小荧光标签,用发光强度实时、定量、活细胞追踪它被降解的动力学,能直接读出 DC50(半数降解浓度)和 Dmax(最大降解程度)。这是现代降解剂筛选的主力读数。
- 流式——在单细胞水平看降解,还能区分不同细胞群、看群体异质性。
- dTAG——一套关键的"对照系统":人为给靶蛋白装上可被特定降解剂识别的标签,作为机制对照,用来确认你观察到的降解确实经由降解通路、而非别的脱靶效应造成。配合蛋白酶体抑制剂(如 MG132)回救实验、E1/泛素化抑制、CRBN 敲除等阴性对照,才能坐实"这是真正的、机制依赖的降解"。
DC50 回答"多低的浓度就开始有效"——衡量效力(potency)。Dmax 回答"最多能降到多低"——衡量深度(completeness)。一个分子可能 DC50 很漂亮(很低浓度就起效),但 Dmax 只有 50%(再加量也降不下去),意味着总有一半靶蛋白逃过——对很多疾病这是不够的。反过来,Dmax 接近 100% 但 DC50 偏高,则可能面临剂量/安全窗压力。两个数一起看,才能判断这个分子值不值得继续。
这一层验证的是 Q4 的功能假设:它不只是结合,而是真的把靶蛋白降下去了,且这降解是机制依赖的。
▣第三层 · 全局蛋白组学:终审裁判
这是整座金字塔的塔尖,也是最容易被初学者忽视的一层。前两层只盯着目标那一个蛋白看——但分子胶的危险恰恰在于它可能顺手降解了别的蛋白。全局蛋白组学(定量质谱,常用 TMT 多标记或无标记 LFQ)一次测量细胞里成千上万个蛋白的丰度变化,于是能回答那个真正要命的问题:是只有目标蛋白下降了,还是有一串"无辜旁观者"也跟着掉了?
典型读法是一张火山图:横轴是各蛋白丰度的变化倍数,纵轴是统计显著性。理想结果里,只有目标蛋白这一个点孤零零地落在"显著下降"区,其余几千个点都聚在中间不动。如果有别的点也掉进下降区——那就是脱靶降解的红旗,必须追查它是什么蛋白、是否危险(这正是 M5.3 的主题)。
这就是为什么它是选择性的"终审裁判",也是为什么 M5.3 的安全性问题离不开它。它验证的是 Q4 里脱靶预测那部分——而脱靶,正是下一课的主题。
| 层级 | 核心问题 | 主力方法 | 关键读数 | 盲区 / 注意 |
|---|---|---|---|---|
| L1 生物物理 | 结合吗?三元成立吗?界面在哪? | SPR、ITC、TR-FRET、native MS、HDX、cryo-EM | KD、koff、三元信号、界面位点 | 亲和≠降解;无细胞环境,缺通透性/代谢 |
| L2 细胞降解 | 真被降了吗?多深?多快?机制对吗? | HiBiT、WB、流式 + dTAG/MG132/CRBN-KO 对照 | DC50、Dmax、降解动力学 | 只看目标蛋白,发现不了脱靶 |
| L3 全局蛋白组 | 是否只降了目标蛋白? | TMT / LFQ 定量蛋白组(火山图) | 选择性谱、脱靶蛋白清单 | 丰度低/难测蛋白可能漏检;需多时点 |
每一层实验跑完,你得到的不只是"对/错"的结论,更是一批带标签的真实数据:这个分子的真实亲和力是多少、真实 DC50 是多少、真实脱靶谱长什么样。这些数据回流进 M3.3 的训练集,就是 M0.4 反复强调的那句话——拥有数据飞轮的人赢,而不是拥有最大模型的人赢。所以验证级联在本课里有双重身份:它既是 AI 的裁判,又是 AI 的食粮。尤其是阴性数据(结合了却不降解、降了目标也降了脱靶)——这些恰恰是公开数据里最稀缺、对模型最宝贵的样本。
「模型预测对了就不用全跑实验」——错。预测对了只是值得去验证,不是已经验证。
「亲和力高 = 降解力强」——错。KD 漂亮但 Dmax 低的分子大量存在;降解还取决于三元几何与停留时间。
「细胞降解阳性 = 选择性好」——错。细胞里把目标蛋白降下去了,完全可能同时还降了一堆别的;只有全局蛋白组能给选择性下结论。
回忆1验证三元复合物可以用哪些生物物理手段?它们各看什么侧面?▶
参考核心是 TR-FRET(直接报告三元接近信号,最适合做剂量/hook 曲线)与天然质谱(确认是三元而非二元、看化学计量比)。HDX-MS 用来核对界面位置,SPR/ITC 提供亲和与热力学背景(KD、koff、焓熵),X-ray/cryo-EM 给原子级界面金标准。它们看的是不同物理量,组合使用才能拼出完整的三元图景。
回忆2DC50 和 Dmax 分别衡量什么?为什么要一起看?▶
参考DC50 是半数降解浓度,衡量效力(多低浓度起效);Dmax 是最大降解程度,衡量深度(最多降到多低)。只看 DC50 漂亮但 Dmax 仅 50% 的分子会让一半靶蛋白逃逸;只看 Dmax 高但 DC50 大则可能撑不起安全窗。两数合看才能判断分子价值。
回忆3为什么全局蛋白组学是选择性的"终审"?▶
参考因为前两层只观察目标蛋白本身,无法发现"顺手降解的旁观者"。全局蛋白组一次测全部蛋白的丰度变化(火山图),是唯一能回答"是不是只有目标蛋白下降"的方法。脱靶降解是分子胶独有的安全性风险,所以这一层不可省略。
应用4一个候选 SPR 显示 KD=8 nM、结合很紧,但 HiBiT 测得 Dmax 只有 30%。怎么解释?下一步做什么?▶
解释典型的"结合紧但降解差"。可能原因:① 三元复合物几何朝向不利,靶蛋白上的赖氨酸够不到 E2 酶活性位点;② 复合物 koff 太快、停留时间短,泛素化来不及完成;③ 靶蛋白缺少合适暴露的赖氨酸。
下一步用 TR-FRET 测三元几何与稳定性、必要时拿 cryo-EM/X-ray 看界面朝向;回到 M4.3/M4.4 在结构指导下优化朝向与停留时间(而非单纯加强亲和)。把"高亲和+低降解"这条阴性样本回流飞轮,它对模型区分"结合 vs 降解"极有价值。
综合5给一个 AI 预测的候选,排出你的完整验证级联,并说明每步要回流什么数据。▶
参考顺序自下而上,每步先用便宜实验淘汰:
- 生物物理(L1):SPR/ITC→真实亲和与热力学;TR-FRET/native MS→三元是否形成与化学计量;HDX/cryo-EM→界面位置核对。回流"真实 KD/koff + 三元成立与否 + 界面坐标"。
- 细胞降解(L2):HiBiT 出 DC50/Dmax 与动力学;WB/流式佐证;dTAG/MG132/CRBN-KO 确认机制依赖。回流"真实 DC50/Dmax 与降解动力学曲线"。
- 全局蛋白组(L3):TMT/LFQ 出火山图。回流"真实脱靶谱 / 选择性标签"。
每一批数据都进 M3.3 的训练集,让下一轮模型在亲和、三元几何、降解效力、选择性四个维度都更准。阴性数据尤其要保留回流。
体内转化:当浓度不再等于药效
传统小分子有一条铁律——血里药越多、效果越强。降解剂把这条铁律打破了,原因藏在"催化"两个字里。
- 用"催化机制"解释为什么降解剂的 PK 与药效会解耦,并能向非专业同事讲清这个反直觉现象。
- 区分占据型抑制剂与降解剂在 PK/PD 关系上的根本不同,并据此判断给药策略。
- 说明为什么应当用"靶蛋白降解程度"而非"血药浓度"来定剂量与给药频率(生物标志物驱动给药)。
- 理解体内 hook 效应与组织分布如何共同决定起效部位与毒性部位。
验证过候选在细胞里真的有效之后,下一步是进入体内(动物),做 PK/PD 研究。PK(药代动力学)讲药物在体内的浓度随时间怎么变化——吸收、分布、代谢、清除;PD(药效动力学)讲这个浓度产生了多大效果。对绝大多数传统小分子,两者是绑在一起的:血药浓度高,药效就强;药被清除了,效果就消失。整个临床给药逻辑(剂量、频次)都建立在这条假设上。
▣核心反直觉:PK 与药效"解耦"
降解剂在这里给你当头一棒。它的血药浓度和药效会解耦——脱钩——而根源是第一篇讲过的催化特性。回忆一下:降解是事件驱动的,一个降解剂分子能像催化剂一样,循环驱动很多份靶蛋白被清除,然后自己被释放、再去拉下一个。它在化学计量上是"亚化学计量"的——不需要一直占着靶点。
把这个机制摊开看后果就清楚了:
- 药物进入体内,开始催化性地降解靶蛋白。
- 很快靶蛋白被压到很低的水平。
- 此时药物本身可能已经被代谢清除了——血里几乎没药了。
- 但靶蛋白要重新合成、回到正常水平需要时间(取决于该蛋白的再合成速率)。在这段"空窗期"里,药没了、效果还在。
这就是解耦:药效滞后于 PK。一个降解剂完全可能血浆半衰期很短,药效却持续很久。传统"浓度=药效"的 PK/PD 框架在这里直接失效。
占据型抑制剂像用手一直按住门——手一松(药一走),门立刻弹回(靶点恢复活性)。降解剂更像请人把门拆了——拆门的工人(药)干完活就走了,但门不会自己长回来,得重新装一扇。所以"工人在不在现场"和"门通不通"这两件事,时间上是错开的。药效的恢复速度,由"装一扇新门要多久"(靶蛋白再合成速率)决定,而不是由"工人何时离开"(药物清除)决定。
| 维度 | 占据型抑制剂 | 降解剂(分子胶 / PROTAC) |
|---|---|---|
| 化学计量 | 需持续占据靶点(化学计量) | 催化、亚化学计量,一个分子驱动多次降解 |
| PK 与药效关系 | 紧密耦合,浓度↑→药效↑ | 解耦,药效滞后于浓度 |
| 药效恢复由谁决定 | 药物清除(药一走效就没) | 靶蛋白再合成(门重装要时间) |
| 剂量论证依据 | 暴露量 / 血药浓度 | 靶蛋白降解程度(PD 生标) |
| 理想给药 | 维持血药浓度在窗内 | 可能低频 / 脉冲式即可维持药效 |
| 剂量-效应曲线 | 多为单调饱和 | 可能钟形(hook 效应),过高反而降效 |
▣体内的 hook 效应与组织分布
第四篇见过的 hook 效应(钟形曲线:浓度过高时,竞争性二元复合物增多,三元反而减少、降解下降)在体内同样存在,意味着剂量并非越高越好。在体内这件事更棘手:不同组织药物浓度不同,于是同一个全身剂量,可能让某些高暴露组织正好踩在 hook 的下坡段(降效),而另一些组织还在上坡段。这让"加大剂量提高疗效"的直觉变得危险。
此外,药物在不同组织的分布会直接影响疗效与毒性——药物富集在哪里、靶蛋白和负责降解的 E3 在哪些组织表达,三者叠加,共同决定了它在哪起效、在哪可能伤人。降解只发生在"药物 + 靶蛋白 + 合适 E3"三者同时充足的组织,这是分子胶组织选择性的一个天然来源,也可能是组织特异毒性的来源(见 M5.3)。
传统 PK/PD 建模有成熟的"暴露-效应"数学框架(如 Emax 模型),核心变量是浓度。降解剂的解耦意味着要引入额外的状态变量——靶蛋白的合成/降解动力学(常用间接响应模型 IDR 的变体来刻画"药物催化清除靶蛋白、靶蛋白零级再合成")。建模对象从"一条浓度曲线"变成"浓度曲线 + 靶蛋白丰度曲线"两条耦合曲线。这也是为什么单纯的 AI PK 预测在这里只能给趋势、给不了精确动力学——它缺少对"催化解耦"这类非经典机制的机理约束和体内真值。
▣结论:用降解程度定剂量,而不是用浓度
既然浓度不再等于药效,那靠血药浓度来定剂量就站不住脚了。正确的思路是生物标志物驱动给药:用靶蛋白被降解了多少(这是真正的药效读数,一种 PD 生物标志物)来决定给多少、多久给一次,而不是盯着血里的药物浓度。实践上,你需要在体内同时建立两类读数——血药浓度(PK)与组织/外周中靶蛋白丰度(PD),把给药方案锚定在后者上。这一点会在 M5.5 的监管讨论里再次出现,因为它直接关系到报批时的剂量论证。
「血药浓度降下去,药效就没了」——错。这正是催化解耦:药走了,被拆掉的靶蛋白还没长回来,药效仍在。
「按血药浓度定剂量」——错。应当用靶蛋白降解程度这个直接药效读数来定剂量。
「剂量越高越有效」——错。体内 hook 效应可能让过高剂量在某些组织反而降效。
回忆1为什么降解剂的 PK 与药效会解耦?▶
参考因为降解是催化、事件驱动的:药物清除后,被降掉的靶蛋白需要时间重新合成才能恢复,于是药效会滞后于血药浓度。占据型抑制剂"手一松门就弹回",降解剂"门拆了得重装"——药效恢复由靶蛋白再合成速率决定,而非药物清除速率。
回忆2"生物标志物驱动给药"指什么?▶
参考用靶蛋白被降解的程度(真正的药效读数,是一种 PD 生物标志物)来决定剂量与给药频率,而不是用血药浓度。因为浓度已经不能代表药效了。实践上需同时建立 PK 与 PD 两类读数,把方案锚定在 PD 上。
综合3体内 hook 效应为什么比体外更麻烦?▶
参考因为体内各组织药物浓度不同。同一个全身剂量下,高暴露组织可能正好落在钟形曲线的下坡段(降效),而其他组织还在上坡段。于是"加量提效"的直觉失灵,甚至可能在关键组织里减效。剂量优化必须结合组织分布与 PD 读数来判断。
应用4某降解剂血浆半衰期很短,药效却持久,如何解释、如何定给药方案?▶
解释典型的催化解耦:少量药物在短暂暴露窗口内催化性地把靶蛋白降到很低,之后即使药物清除,靶蛋白尚未重新合成,药效维持。
方案不要为了"维持血药浓度"而频繁高剂量给药(还可能踩 hook 效应、放大毒性暴露)。应监测靶蛋白降解/恢复曲线,按靶蛋白回升到阈值的时间来安排间歇给药——可能是低频、脉冲式给药即可维持药效,同时降低毒性暴露与脱靶累积。
综合5你要为一个新降解剂设计首个体内 PK/PD 实验,应同时采集哪两类数据?为什么?▶
参考两类必须同时采:① PK——血浆(必要时组织)药物浓度随时间曲线,了解吸收/清除;② PD——靶蛋白丰度随时间曲线(在可及组织或外周细胞中测降解程度与恢复)。把两条曲线叠在一起,才能直接看到解耦幅度(药效滞后多久)、确定靶蛋白恢复到阈值的时间,从而把给药间隔锚定在 PD 恢复时间上,而不是 PK 半衰期上。这套数据也是 M5.5 报批时论证剂量的核心证据。
安全性与选择性去风险
分子胶有一种传统药物没有的危险:它可能把你没打算碰的蛋白也降解掉。历史上最惨痛的教训,藏在一个叫 SALL4 的名字里。
- 解释为什么"脱靶降解"对分子胶是安全性生死线,而对传统抑制剂往往只是疗效问题。
- 完整复述沙利度胺-SALL4 致畸机制,并说明它为何是"脱靶降解→不可逆灾难"的范本。
- 识别风险清单上的其他条目:功能性 neo-substrate、物种/遗传特异性、组织特异毒性。
- 当 AI 脱靶筛查标出一个发育相关蛋白时,给出一套结构化的去风险流程。
M5.1 我们已经埋了伏笔:全局蛋白组学是为了抓"脱靶降解"。这一课就把它正式提到安全性的高度——因为脱靶降解是分子胶独有的毒性源。这不是"再优化一下选择性"的工程细节,而是一条能决定整个项目生死、甚至关乎患者安危的红线。
▣为什么"脱靶"对分子胶格外致命
传统抑制剂脱靶,通常只是"多按住了一个别的蛋白",停药后那个蛋白功能就恢复了——多半是个疗效或副作用问题,可逆。分子胶不一样:它脱靶意味着把一个本不该消失的蛋白彻底降解掉了。回到 M1.4 的"语法"——CRBN 靠识别 G-loop 这类结构降解子来抓底物。问题是,不止你的目标蛋白长着这种降解子。你以为只降 A,结果同一套 G-loop 模板把同样长相的 B、C 也一并降了。后果不再是"暂时压制",而是"直接清除"——而清除一个关键蛋白可能触发细胞死亡、发育畸形等不可逆后果。
分子胶安全性最沉重的一课,来自沙利度胺(thalidomide)。上世纪 50 年代末它曾作为镇静/止吐药给孕妇使用,结果在全球造成大量新生儿严重肢体畸形(海豹肢,phocomelia)——这是药物史上最著名的灾难之一,并直接推动了现代药物监管体系的建立。
几十年后,机制才被揭开,而它恰恰是一个"脱靶降解→灾难"的完美范本:沙利度胺结合 CRBN 后,诱导降解了一个叫 SALL4 的转录因子。SALL4 是胚胎发育(尤其肢体发育)的关键调控因子——把它降解掉,发育程序就被打乱。决定性的佐证是:使 SALL4 失活的遗传突变(人类 SALL4 相关综合征),本身就会造成与沙利度胺极其相似的肢体缺陷。遗传学与药理学在此交汇,强力锁定"降解 SALL4"正是致畸的核心机制。
▣其他要一并放进风险清单的
- 免疫调节型 neo-substrate 效应:IMiD 类降解 IKZF1/3 会带来免疫调节——这既可能是疗效(治疗多发性骨髓瘤、某些淋巴瘤)也可能是毒性,取决于场景。同一个降解事件,福祸两面。这告诉你脱靶谱不能只看"有没有脱靶",还要看"脱的是什么、在这个适应症里是好是坏"。
- 遗传 / 物种特异性:SALL4 的故事还有一层杀伤力极大的细节——小鼠对沙利度胺致畸不敏感,因为啮齿类的 CRBN 与 SALL4 序列与人不同,结合界面有差异。这意味着标准动物模型可能完全漏报这类毒性,给临床前评估埋下巨大隐患。"动物没事"绝不等于"人没事"。
- 组织特异性毒性:靶蛋白或被脱靶的蛋白在哪些组织表达、E3 在哪些组织活跃,决定了毒性会落在哪里(呼应 M5.2 的组织分布)。同一个脱靶,在不表达该蛋白的组织里无害,在依赖它的组织里可能致命。
一个分子在常规细胞系(比如某肿瘤系)的全蛋白组里看起来很干净,可能只是因为那条细胞系恰好不高表达危险的脱靶蛋白,或者那是个成体细胞、根本不跑发育程序。SALL4 这种发育灾难,在标准成体肿瘤细胞实验里测不出来。所以现代去风险越来越依赖:① 在多种、含人源的细胞/组织背景下做选择性谱;② 用人 iPSC 分化 / 类器官 / 发育模型专门拷问发育毒性;③ 警惕物种差异,必要时用人源化模型。选择性是一个跨背景、跨发育阶段的命题,不是单条细胞系一张火山图能结案的。
| 维度 | 传统抑制剂脱靶 | 分子胶脱靶降解 |
|---|---|---|
| 后果性质 | 暂时抑制功能 | 彻底清除蛋白 |
| 可逆性 | 停药多可逆 | 可能不可逆(如发育畸形) |
| 严重度上限 | 多为副作用 | 可致畸 / 致死级 |
| 动物模型可靠性 | 一般可参考 | 可能因物种差异漏报 |
| 检出手段 | 脱靶活性 panel | 全局蛋白组 + 发育模型 |
| 在项目中的地位 | 可后期优化 | 立项期生死线 |
核心原则:发育 / 不可逆毒性必须在立项与设计期排除,而不是留到临床去发现。
「细胞里选择性好就安全」——错。体内毒性、尤其发育毒性是另一回事;标准成体肿瘤细胞实验测不出 SALL4 这种发育灾难。
「脱靶只是疗效问题」——错。对分子胶,脱靶是安全性生死线,因为它造成的是彻底清除而非暂时抑制。
「动物没毒就放心」——错。物种差异(CRBN/底物序列不同)可能让动物完全漏报人体毒性。
回忆1沙利度胺致畸的分子机制是什么?有什么决定性佐证?▶
参考沙利度胺结合 CRBN,诱导降解了发育关键转录因子 SALL4。SALL4 被清除导致(尤其肢体)发育程序紊乱,造成海豹肢畸形。决定性佐证:人类中使 SALL4 失活的遗传突变本身就产生极相似的肢体缺陷——遗传学与药理学交汇,锁定降解 SALL4 为致畸核心机制。
回忆2脱靶降解为什么是分子胶独有的、格外致命的风险?▶
参考因为分子胶靠识别结构降解子(如 G-loop)来选底物,而多个蛋白可能共享相似降解子,于是同一分子会"顺手"降解非目标蛋白。更关键的是后果性质——抑制剂脱靶是暂时压制、可逆,降解剂脱靶是彻底清除,可能造成发育畸形等不可逆灾难。
回忆3为什么小鼠没出现致畸不能让你放心?▶
参考因为致畸是物种特异的:啮齿类 CRBN 与 SALL4 序列与人不同,结合界面有差异,所以小鼠对沙利度胺致畸不敏感。这意味着标准动物模型可能完全漏报人体发育毒性,必须用人源细胞/iPSC 发育模型/类器官来评估。
综合4"功能性脱靶"为什么不能一刀切当成坏事?▶
参考因为同一个脱靶降解事件可能因适应症而福祸不同。例如 IMiD 降解 IKZF1/3 带来免疫调节:在多发性骨髓瘤等场景是疗效来源,但在另一些场景可能是免疫相关毒性。所以评估脱靶谱不能只问"有没有脱靶",要问"脱的是什么蛋白、在当前适应症与组织背景下是利是弊"。
应用5AI 脱靶筛查标出一个发育相关蛋白被降解,你如何去风险?▶
参考把它当成 SALL4 级别的红旗,按结构化流程:
- 实测确认:用全局蛋白组实验确认该脱靶是否真实、剂量依赖如何、Dmax 多深。
- 结构分离:回到 M4.3/M4.4 理解共享了哪段降解子界面,重设计分子只与目标互补、避开该蛋白界面。
- 跨物种/背景核验:用人源细胞、人 iPSC 发育模型、类器官评估,不被"小鼠没毒"误导。
- 换路线兜底:若无法分离,考虑换 E3 或换结合位点,从根上回避共享界面。
核心原则:发育/不可逆毒性的风险要在立项与设计期就排除,而不是留到临床。
耐药与联合用药
就算分子胶起效了,肿瘤也会想办法逃。理解它怎么逃,是为了在立项时就把"抗逃跑"设计进去。
- 把分子胶的工作链条拆成环节,并定位耐药发生在哪一环。
- 区分两类主要耐药机制(E3 机器失效 vs 靶蛋白界面突变),并说明它们的破解方式为何完全不同。
- 用 RBM39 G268V 这一真实案例解释"一个残基变化即可废掉一个药"。
- 说明 AI 如何把抗耐药从"事后补救"前移为"立项期设计变量"。
一个分子胶在临床上有效,并不代表永远有效。肿瘤细胞会演化出耐药——这几乎是所有靶向治疗的宿命。这一课讲清两件事:分子胶会从哪些地方"失效",以及为什么应对耐药不该是事后补救、而要在立项时就纳入设计。
▣先把工作链条拆开
分子胶的工作链条很清楚,耐药本质上就是这条链条上的某一环被破坏:
药结合靶蛋白 + 招募 E3 → 形成三元复合物 → E3 给靶蛋白贴泛素链 → 蛋白酶体降解
耐药可以打在任何一环上,但临床最常见、也最值得你先记住的是两类。
▣两类耐药机制
① E3 机器本身坏了(降解机器侧)
负责干活的 E3(如 CRBN)发生突变或丢失(甚至是 CRBN 调控通路、neddylation 机器的改变)。机器没了,胶就算把靶蛋白拉过来也没人贴标签——降解发生不了。这是"工具坏了"型耐药。它的特点是:同一把 E3 招募的所有分子胶可能一起失效(交叉耐药),但换一把不同的 E3 往往能绕过。
② neo-substrate(靶蛋白)改了界面(靶点侧)
靶蛋白发生突变,使它和 E3 之间那个由胶诱导的界面不再互补,于是无法被招募。最经典的例子是 indisulam → RBM39 体系里的 RBM39 G268V 突变:只把一个甘氨酸(G)换成缬氨酸(V),位于 RBM39 与 DCAF15 接触的界面上,体积更大的缬氨酸破坏了胶诱导的界面互补,就足以让 RBM39 不再被招募到 E3 复合物、逃脱降解——而它作为剪接因子的本职功能却几乎不受影响(所以细胞既存活又耐药)。改一个残基,药就废了。这类耐药通常对特定分子高度特异,换一个能容忍该突变的新分子可能就绕过。
这个案例值得反复体会,因为它把分子胶耐药的本质讲透了:耐药不是靶蛋白"功能变了",而是它与降解机器的"可招募性"变了。G268V 既不破坏 RBM39 的剪接功能(细胞照常存活),也不影响药物本身——它只精准地破坏了那个由药物临时诱导出来的蛋白-蛋白界面。这正是分子胶不同于抑制剂之处:抑制剂耐药常因结合口袋突变(药结合不上),而分子胶耐药可以发生在第三方界面(药还结合、E3 还在,但两者拉不到一起)。理解这一点,你才知道破解它不能靠"加强药与靶的结合",而要靠"重建被破坏的界面互补"。
| 维度 | ① E3 机器失效 | ② 靶蛋白界面突变 |
|---|---|---|
| 坏在哪一环 | 贴泛素的"机器"(E3/CRBN)突变或丢失 | 三元界面的"靶点侧"突变(如 G268V) |
| 药还结合靶吗 | 是(但没机器干活) | 多数仍结合 |
| 交叉耐药范围 | 同一 E3 的多种胶可能一起失效 | 常对特定分子高度特异 |
| 破解思路 | 换一把 E3(换降解机器) | 重设计能容忍突变的新分子或换界面 |
| AI 能做什么 | 预测哪些 E3 通路脆弱,准备备份 E3 路线 | 预判热点界面突变,设计抗突变分子 |
因为它们的破解方式完全不同。E3 坏了,换一把 E3(打不同的连接酶)可能就绕过去了;靶蛋白界面变了,则要重新设计能容忍那个突变、或从别的界面下手的分子。先判断对手是哪一类,才知道该出哪张牌。临床上拿到耐药样本,第一件事就是测序定位:是 E3 侧还是靶点侧坏了。
▣AI 的用武之地:把耐药提前到设计期
耐药的传统处理方式是"出现了再说"。但既然这两类机制本质上都是结构/序列层面的变化,AI 正好能在事前出手:
- 预判热点突变:用结构与序列建模,提前算出靶蛋白界面上哪些位点一旦突变就会导致逃脱降解——把 G268V 这类"未来的耐药点"在临床发生前就标出来。
- 设计能容忍突变的下一代分子:针对预判到的脆弱点,设计对那些突变不敏感的新一代胶(例如让分子的结合不那么依赖那个易突变残基)。
- 理性设计联用方案:比如同时打不同的 E3、或联合作用于不同通路的药物,让肿瘤难以靠单点突变同时逃脱所有压力。这也呼应 M3.5 的系统/多组学视角。
一句话概括这个转变:把"耐药"从事后补救,变成立项时就纳入设计的变量。
单点突变能让细胞逃过一个选择压力。但如果你同时施加两个机制不同的压力(比如:打靶点 X 的胶 + 打通路 Y 的药;或两把作用于不同 E3 的胶),细胞要存活就得同时获得两个互不相关的逃逸突变——这在概率上远难发生。这就是联用抗耐药的数学本质:把"逃逸只需一步"变成"逃逸需要同时两步"。AI 在这里的价值是从系统/多组学层面,找出哪些组合能形成真正正交(彼此独立、最好协同)的压力,而不是两个会被同一突变一起逃过的冗余压力。
「耐药是临床后期才该管的事」——错。既然耐药多源于可预测的结构/序列变化,就应在设计期主动预判并布防,而不是等失效了再回头补救。
「靶蛋白突变 = 它功能变了」——错。G268V 不改剪接功能,只破坏与 E3 的可招募界面。耐药关乎"可招募性",不一定关乎"功能"。
回忆1RBM39 G268V 为什么会导致耐药?属于哪一类?▶
参考G268V 位于 RBM39 与 DCAF15 的接触界面,把甘氨酸换成体积更大的缬氨酸破坏了胶诱导的界面互补,使 RBM39 无法被招募到 E3 复合物,因而不被泛素化、逃脱降解;同时它的剪接功能基本不受影响,所以细胞既存活又耐药。属于第②类(靶蛋白界面改变)耐药。
回忆2两类主要耐药机制是什么?破解方式有何不同?▶
参考① E3/CRBN 本身突变或丢失(降解机器坏了);② neo-substrate 突变破坏界面互补(如 RBM39 G268V,靶蛋白逃脱招募)。破解:前者靠换一把 E3(换机器),后者靠重设计能容忍突变的分子或换界面。第一步永远是测序定位坏在哪一侧。
综合3为什么联用能在数学上压制耐药?▶
参考单点突变可让细胞逃过一个压力。若同时施加两个机制正交的压力,细胞需同时获得两个互不相关的逃逸突变才能存活——概率远低于单步逃逸。本质是把"逃逸只需一步"变成"需要同时两步"。关键是组合要真正正交(不被同一突变一起逃过),AI 可从系统层面帮助挑选这样的组合。
应用4临床拿到一份耐药肿瘤样本,你的排查与应对顺序是什么?▶
参考
- 测序定位机制:看是 E3/CRBN 侧突变或丢失(第①类),还是靶蛋白界面突变(第②类)。
- 若第①类(E3 失效):改走另一把 E3(如从 CRBN 转 DCAF 或组织特异 E3),用不同机器降解同一靶点。
- 若第②类(界面突变):用结构建模理解突变如何改变界面,重设计能与突变后界面重建互补、或从蛋白另一面/另一降解子结合的分子。
- 通用加固:上正交联用(不同通路或不同 E3),让肿瘤无法靠单点突变同时逃脱。
把这些耐药样本与机制标签回流飞轮——它们正是模型最缺的真实耐药数据。
综合5给一个已知热点突变,设计抗耐药的下一代分子或联用策略。▶
参考先判断类型。若是靶蛋白界面突变(如类 G268V):用结构建模理解突变如何改变界面,重新设计一个能与突变后界面重建互补、或从蛋白另一面/另一降解子结合的分子;或并行准备多个作用于不同位点的胶轮换/联用。若是 E3 丢失/突变:改走另一把 E3,用不同机器降解同一靶点。通用加固:正交联用打击不同通路或不同 E3,使肿瘤无法靠单点突变同时逃脱所有压力。关键是这些都在立项设计期就规划,而非等耐药出现。
监管与 IND 要点(适度)
这一课刻意克制:不背注册流程,只抓住分子胶报批时真正与传统小分子不同的少数几件事。
- 说出降解剂 IND 与传统小分子真正不同的两条核心差异,并把每条追溯到本篇前面的概念。
- 解释为什么生物分析必须"双重检测"(PK + PD),以及为什么剂量论证不能只靠暴露量。
- 识别 FDA / EMA / NMPA-CDE 对降解剂共同的关注点(选择性/脱靶)及其历史由来。
- 为一个降解剂 IND 预判监管最可能追问的两点,并准备好对应证据。
本篇收尾要建立的,不是对监管流程的全面记忆,而是一种直觉——拿一个分子胶去做 IND(新药临床试验申请)时,监管机构会在哪几个地方特别较真。本课故意只讲"与传统小分子不同的少数关键点",避免堆砌条款。核心差异其实就两条,而且它们都直接长在前几课的概念上——这正是本课的价值:不是让你记法规,而是让你看懂这些法规要求为什么必然从分子胶的科学特性里长出来。
▣差异一:生物分析的"双重检测"
传统小分子做生物分析,主要测一件事:原型药的血药浓度(即 PK)。分子胶不够——监管期望看到两条数据:
- ① 原型药浓度(PK):药物本身在体内怎么变化,和传统药一样要测。
- ② 靶蛋白降解程度(PD 生物标志物):靶蛋白到底被降了多少。
为什么必须两条?因为 M5.2 那个解耦——对降解剂,浓度不能代表药效,必须额外用一个直接反映降解的药效生物标志物来证明药真的起作用了。这就是"双重检测"。注意它直接继承自 M5.2:解耦是科学事实,双重生物分析是这个事实在报批层面的必然要求。
▣差异二:剂量论证不能只靠暴露量
紧接着第一条:既然 PK 与药效解耦,那用传统的"暴露量(药物总暴露)→剂量"逻辑来论证给药方案就站不住。监管会期望你用靶蛋白降解这个药效终点来支撑剂量选择——这正是 M5.2"生物标志物驱动给药"在报批层面的体现。你得能回答:"凭什么是这个剂量?"而答案应当落在降解程度(以及降解的持续时间)上,而非血药浓度上。换言之,监管想看到你的剂量是由 PD 锚定的,并辅以对 hook 效应、组织分布的考量。
▣各局共同的关注点:选择性 / 脱靶
无论 FDA(美国)、EMA(欧盟)还是 NMPA-CDE(中国),对降解剂都会格外关注选择性与脱靶降解——这正是 M5.3 的安全性主题。SALL4 的历史让监管对"是否会降解非目标蛋白、尤其发育相关蛋白"高度敏感。所以你的全蛋白组选择性数据,在报批时是被重点审视的对象;而且鉴于物种差异,监管也会关注你是否用了合适的(含人源的)模型来评估发育与不可逆毒性。
| 报批关注点 | 监管期望看到 | 科学根源 |
|---|---|---|
| 双重生物分析 | PK(原型药浓度)+ PD(靶蛋白降解程度)两条数据 | M5.2 PK/药效解耦 |
| 剂量论证依据 | 剂量由靶蛋白降解(及持续时间)锚定,而非仅暴露量 | M5.2 生标驱动给药 |
| 选择性 / 脱靶 | 全蛋白组选择性数据 + 合适(人源)模型评估发育/不可逆毒性 | M5.3 SALL4 教训 |
「降解剂注册和普通小分子完全一样」——错。生物分析的双重性、剂量论证的特殊性,是实打实的不同。
「堆监管条款 = 讲清差异」——错。关键不是背全流程,而是抓住那少数几个真正不同的点,并理解它们为何从科学特性必然长出。
「AI 预测能写进 IND 顶替实验」——错。AI 只能作支持性材料,实测数据才是主证。
回忆1降解剂生物分析的"双重检测"指什么?根在哪一课?▶
参考同时测两条数据:原型药浓度(PK) 与 靶蛋白降解程度(PD 生物标志物)。因为对降解剂浓度不能代表药效,必须用直接的降解读数来证明药效。根源是 M5.2 的 PK/药效解耦。
回忆2为什么剂量论证不能只靠暴露量?▶
参考因为 PK 与药效解耦(M5.2)——血药暴露不再线性对应药效。剂量必须用靶蛋白降解程度(及其持续时间)这个真实药效终点来支撑,否则"为什么用这个剂量"无法自圆其说。这是"生标驱动给药"在报批层面的体现。
回忆3为什么各国监管都对降解剂的选择性格外敏感?▶
参考因为 SALL4 历史(M5.3)证明了脱靶降解可造成不可逆的发育灾难。所以 FDA/EMA/NMPA-CDE 都重点审视全蛋白组选择性数据,并关注是否用了合适的(含人源的)模型评估发育/不可逆毒性——因为物种差异可能让动物模型漏报。
应用4你要为一个降解剂准备 IND,列出监管最可能追问的两点并备好证据。▶
参考
- 选择性/脱靶证据:"有没有全蛋白组数据证明它不降解非目标蛋白,尤其发育相关蛋白?是否在含人源的模型里评估过发育/不可逆毒性?"(SALL4 阴影)—— 备好多背景全蛋白组火山图 + 人 iPSC/类器官评估。
- 剂量的药效学依据:"剂量是基于靶蛋白降解程度(及持续时间)而非仅暴露量来确定的吗?双重生物分析数据在哪?"—— 备好 PK+PD 双曲线、PD 锚定的剂量论证、以及对 hook/组织分布的说明。
这两点正对应本课两条核心差异,且分别溯源到 M5.3 与 M5.2。
综合5把本篇五课串成一条线:从拿到 AI 候选到准备 IND,验证与去风险的主线是什么?▶
参考① M5.1 用三层级联把 AI 假设逐级证伪(生物物理→细胞降解→全蛋白组),并把每层真值回流飞轮;② M5.2 进入体内发现 PK/药效解耦,改用降解程度定剂量;③ M5.3 把脱靶降解当成生死线,用全蛋白组+人源发育模型去风险;④ M5.4 在立项期预判耐药、设计抗耐药与正交联用;⑤ M5.5 报批时抓住双重生物分析与降解锚定的剂量论证两条核心差异。贯穿全程的是同一句话:AI 造假设,现实做裁判;实测是 AI 的真值与食粮。