← 课程门户
第 1 讲 · 生物学与机制根基
0 / 5 模块
第一篇 · 生物学与机制根基 · M1.1 – M1.5

让 AI 尊重生物学

从泛素—蛋白酶体系统到 neo-substrate 识别规则——没有这一篇,第四篇的模型输出就是无意义的数字。

本篇目标

计算背景补生物、化学/生物背景补深度。学完本讲,你能讲清分子胶为什么起效、为什么会失效,以及 AI 在哪些环节帮得上、哪些环节还无能为力。

DAY 1 · 第一讲(本讲)
生物学与机制根基
DAY 2 · 设计与资源 DAY 3 · AI 建模与实战
5 个模块 视频 ≈ 170 min 阅读 ≈ 220 min 关键洞见 · 招募 ≠ 降解 前置 · M0 导论
◆ 本讲地图

五个模块,一条主线:从"细胞怎么降解蛋白"到"什么样的蛋白能被粘"

这五个模块层层递进。先理解细胞自带的降解机器(UPS),再把 E3 连接酶当成可调用的"设计资源库",然后从结构与动力学讲清分子胶的作用机制,接着学习"什么蛋白长得像可被粘的底物"这套识别语法,最后收口到立项时如何在分子胶与 PROTAC 之间做选择。贯穿全篇的关键洞见只有一句:招募 ≠ 降解。

贯穿全篇的一句话把一个底物拉到 E3 旁边只是第一步——能不能真被降解,还取决于泛素链拓扑、E2 配对、链延伸处理性、复合物几何与停留时间。这就是第四篇为什么难、为什么"建好了三元结构也不代表能降解"的根。
M1.1 Q4 的生物学根基 前置 · M0.2 视频 35min阅读 45min检查 15min

泛素—蛋白酶体系统(UPS)深解

一句话能解释为什么"建好三元复合物"离"真降解"还差一大步。
学习目标
理解

画出 E1→E2→E3 三级级联与 CRL4 机器,说明 neddylation 的调控作用。

分析

解释为什么招募 ≠ 降解:泛素链拓扑、E2 配对、链延伸处理性、复合物几何与停留时间共同决定结果。

理解

对比降解的亚化学计量催化特性与占据型抑制的化学计量特性。

先建立直觉 · 为什么要懂这个

细胞里每时每刻都有蛋白被合成、被销毁。蛋白酶体就是细胞的"碎纸机"——但它不会乱碎,只销毁被打上标记的蛋白。这个标记就是一种叫泛素(ubiquitin,一种 76 个氨基酸的小蛋白)的"小旗子",串成链贴在目标蛋白上。

分子胶能起效,本质上就是劫持了这套天然的"贴标签—销毁"系统:它不直接破坏致病蛋白,而是骗细胞自己给致病蛋白贴上"销毁"标签。所以想懂分子胶,必须先懂细胞是怎么贴标签、怎么销毁的——这就是 UPS。

类比:把致病蛋白想成一个你想清走的人。传统抑制剂是"派人一直按住他"(占据),他随时可能挣脱;降解剂则是"给他贴个快递面单,让细胞的物流系统把他打包送走"(事件驱动),送走一个还能去贴下一个。

学习脉络:细胞的"垃圾分类 + 回收"系统

先把 UPS 当成细胞的"垃圾分类 + 回收"系统讲清三步:E1 活化泛素、E2 转运E3 给底物"贴标签"——连接酶决定特异性,是整个系统里"认人"的那一环。

重点放在 CRL4CRBN:Cullin4 骨架 + DDB1 接头 + CRBN 底物受体。neddylation(接上 NEDD8)像"打开开关"——它激活整台机器,没有它 CRL 就转不起来。

深入一层为什么是"三级"级联?E1/E2/E3 各自管什么

细胞用三级而不是一步,是为了兼顾效率与特异性——把"激活"和"认人"这两件事分开管。

  • E1(活化酶,~2 种):消耗 ATP,把泛素的尾巴"点火"成高能态。数量极少,因为它只负责"上游供能",不需要挑底物。
  • E2(结合酶,~40 种):从 E1 手里接过活化的泛素,像快递中转站。不同 E2 还会影响链连成什么类型(K48 还是 K63)。
  • E3(连接酶,~600+ 种):数量最多,因为特异性全靠它——每种 E3 认一组特定底物。CRBN 就是其中一种 E3 的底物受体。

记一个比例就够直观:极少 E1 → 中等 E2 → 海量 E3。越往下游,越是"认人"的活儿,种类越多。分子胶的全部魔法都发生在最下游那一环——它改写 E3 "认谁"的标准。

必做可视化 · UPS 级联 + CRL4 机器
E1
活化酶

消耗 ATP,把泛素"点火"激活,转交给 E2。

E2
结合酶

携带活化的泛素,作为"快递员"转运。

E3
连接酶

识别底物、决定特异性,把泛素"贴"到底物赖氨酸上。

26S
蛋白酶体

识别 K48 多泛素链,把标记的蛋白整条酶解。

CRL4CRBN = Cullin4 骨架 + DDB1 接头 + CRBN 受体 + neddylation 开关。分子胶坐进 CRBN,改写它"认人"的标准。

全课最关键的洞见:招募 ≠ 降解

把一个底物拉到 E3 旁边只是第一步。能不能真被降解,还取决于一连串"成功之后"的条件:

赖氨酸可达性

底物的赖氨酸是否被泛素链"够得着"?几何不对,链就接不上。

链的类型与延伸

链是 K48(送去酶解)还是 K63(信号)?链延伸够不够"处理性"(processivity)?

几何与停留时间

三元复合物的几何与停留时间,决定泛素化窗口够不够长。

链拓扑对比 · K48 vs K63
K48 链 → 降解信号
UbUbUbUb

通过泛素第 48 位赖氨酸连接的多聚链,是蛋白酶体识别的"送去酶解"标签。降解走这条。

K63 链 → 信号 / 非降解
UbUbUb

通过第 63 位赖氨酸连接,多用于 DNA 修复、信号转导等,不直接送蛋白酶体。同样是"泛素化",结局完全不同。

深入一层"链延伸处理性"到底卡在哪?这是 AI 算不准降解的关键

蛋白酶体有个硬门槛:泛素链通常要够长(一般 ≥4 个泛素),它才认得出"这是该销毁的"。只贴一两个泛素(单泛素化)往往不触发降解。

处理性(processivity)指的就是 E3 能不能一鼓作气把链接到足够长,而不是接一个就掉链子。它取决于:

  • 三元复合物的停留时间——复合物散得太快,链还没接长就结束了;
  • 底物赖氨酸相对 E2 的几何位置——够不够得着,角度对不对;
  • E2 的种类——有的 E2 擅长起头,有的擅长延伸。

关键就在这里:三元复合物的结构(几何)可以用 AlphaFold 类工具预测,但"接链够不够快够不够长"是动力学问题,几乎没有可训练的数据。所以模型能告诉你"它们能贴在一起",却答不出"贴上之后会不会真被销毁"。记住这条,第四篇 M4.4 的难点你就有了根。

这就是第四篇为什么难、为什么"建好了三元结构也不代表能降解"的根。最后点出催化性:一个降解剂分子能驱动很多份靶蛋白被清除(事件驱动),这是降解优于抑制的核心红利——也是它与化学计量、一对一的占据型抑制最本质的区别。

能 | 不能 | 瓶颈(AI 依赖点)当前模型擅长预测"会不会形成三元复合物(几何)",但对"形成后会不会高效降解"预测很弱——因为后者依赖链拓扑、处理性这些缺数据的动力学量。这是 M4.4 的难点之源。
两个常见误区
"拉到 E3 旁边就会被降解" —— 错。招募只是第一步。
"泛素化 = 降解" —— 错,取决于链类型(K48 vs K63)与下游
自测
  1. neddylation 在 CRL 激活里起什么作用?
  2. 为什么"招募成功"不等于"降解成功"?举两个决定因素。
  3. 应用某胶能形成稳定三元复合物却几乎不降解靶点,列出三个可能原因。
本节带走 · 三句话
  • UPS = 细胞的"贴标签—销毁"系统:E1 活化 → E2 转运 → E3 认人 → 蛋白酶体销毁,分子胶劫持的就是 E3 这一环。
  • 招募 ≠ 降解:拉到 E3 旁边只是第一步,还要看赖氨酸够不够得着、链是不是 K48、接链够不够长(处理性)。
  • 降解是催化、亚化学计量、一对多——一个胶能送走很多份靶蛋白,这是它优于"一对一占据"抑制剂的根本红利。
必读
UPS / CRL 机制综述一篇。建议带着"招募之后还有哪些关卡"的问题去读。
M1.2 Q1 的资源面 前置 · M1.1 视频 35min阅读 45min检查 15min

E3 连接酶版图:作为"设计资源"来看

一句话面对新靶点能选出合理的 E3 路线并讲出理由。
学习目标
理解

说明 CRBN/CRL4 为何是分子胶主战场(IMiD/CELMoD 的靶标)。

分析

对比两种主导识别策略:非共价界面延伸 vs 共价稳定

评价

面对新靶点能判断走哪条 E3 路线,并说明组织/肿瘤特异性 E3 的战略价值。

先建立直觉 · 为什么要懂这个

人体大约有 600 多种 E3 连接酶,每种认一组不同的底物。做分子胶,本质是挑一种 E3 当"招募者",再把致病蛋白介绍给它。所以 E3 不是背景知识,而是你手上的原材料清单——选哪种 E3,直接决定这个项目能不能成、毒性大不大。

但这 600 多种里,绝大多数还没人找到能"抓住"它的小分子(配体),等于有原料却没有把手,暂时用不上。真正配齐了把手、能拿来设计药的,目前还集中在少数几种——其中 CRBN 是绝对主力。

类比:E3 宇宙像一个有 600 名员工的快递公司,但只有十几个人你有他们的电话(可配体化)。CRBN 是其中最熟、合作最久的那个——所以大多数项目先找他。

学习脉络:把 E3 当成"设计资源库"

换一个视角看 E3——它不是生物学背景板,而是可调用的"设计资源库"。主线还是 CRBN/CRL4:IMiD/CELMoD 的舞台,G-loop 识别的范式(细节留给 M1.4)。

然后讲非 CRBN 路线,并按"识别机制"二分讲清——这是本模块的骨架:

非共价界面延伸

DCAF15 + indisulam / E7820 → RBM39。芳基磺酰胺把底物"延伸贴"到连接酶界面,靠的是非共价互补,不形成共价键。

共价稳定

DCAF16 / DCAF11 + 共价弹头 → BRD4 等。弹头与连接酶(或底物)形成共价键,把三元复合物"锁死",靠化学键稳定界面。

深入一层非共价 vs 共价:两条路各有什么得失?

这两种策略不是谁更先进,而是用"贴得牢不牢"换"可不可逆"

  • 非共价界面延伸:胶靠形状、电荷、疏水互补"贴"在界面上,结合可逆。优点是选择性可调、脱靶风险相对可控;缺点是界面亲和力弱时,三元复合物可能存在得太短,降解效率上不去。
  • 共价稳定:胶带一个"弹头"(反应性基团)与蛋白上的半胱氨酸等残基形成化学键,把复合物锁死。优点是结合极强、停留时间长,容易触发高效降解;缺点是共价键不可逆,一旦脱靶后果更严重,需要更谨慎评估选择性。

立项时的直觉:要更安全可控、可滴定剂量,倾向非共价;靶点界面浅、非共价抓不牢、需要强力锁定时,考虑共价。这也呼应 M1.3 会讲的"三元复合物寿命决定降解效率"。

可用的 E3 宇宙

再扫一遍可用的 E3 宇宙——VHL、KEAP1、β-TrCP、SIAH1… 以及"可成药 / PROTAC-able E3 universe"这个概念:人体上百种 E3,真正配上了配体、能拿来设计降解剂的还是少数。

E3 版图地图 · CRBN 居中
CRBN / CRL4分子胶主战场

IMiD / CELMoD 的靶标,数据最全、建模最可靠。G-loop 识别范式的舞台。

DCAF15 非共价

indisulam / E7820 招募 RBM39,界面延伸的经典范例。

DCAF16 共价

共价弹头稳定三元复合物,降解 BRD4 等。

DCAF11 共价

共价稳定路线的另一成员,DCAF 家族正在扩张。

VHL

PROTAC 主力 E3 之一;分子胶应用有限但配体成熟。

KEAP1 / β-TrCP

各有底物识别偏好,逐步被纳入降解剂工具箱。

SIAH1 …

更广的"可配体化 E3"候选,多数仍缺三元结构数据。

战略牌 · 组织/肿瘤特异性 E3组织/肿瘤特异性 E3 能拓宽治疗窗口——在肿瘤高表达的 E3 上做胶,正常组织少表达,毒性更小。这是选 E3 路线时的关键战略维度,不只是"能不能成胶",还要看"在哪儿成胶"。
能 | 不能 | 瓶颈(AI 依赖点)AI 能帮挖"可配体化 E3"和口袋可成药性;但绝大多数 E3 缺三元结构数据,非 CRBN 体系的建模可靠性远低于 CRBN(呼应 M0.4 的"新型 E3 基本失灵")。
两个常见误区
"分子胶只能用 CRBN" —— 错,DCAF 家族等正在扩张
"E3 越多越好" —— 错,缺乏数据与配体的 E3 没法立刻用
自测
  1. indisulam–DCAF15–RBM39 属于哪种识别策略?
  2. 组织特异性 E3 为什么能拓宽治疗窗口?
  3. 应用给一个在肝高表达、需避免中枢毒性的靶点,你会优先考察哪类 E3?
本节带走 · 三句话
  • 把 E3 当成原材料清单:选哪种 E3 = 选哪个"招募者",直接决定项目可行性与毒性。
  • 非 CRBN 路线按识别机制二分:非共价界面延伸(DCAF15→RBM39)vs 共价稳定(DCAF16/11)——前者安全可控,后者结合更强。
  • 组织/肿瘤特异性 E3 是战略牌:在肿瘤高表达、正常组织低表达的 E3 上做胶,治疗窗口更宽
必读
非 CRBN 分子胶 / DCAF 体系综述一篇。重点看"非共价 vs 共价"两条路线的代表分子。
M1.3 Q2 的机制根基 前置 · M1.1、M0.2 视频 35min阅读 45min检查 15min

分子胶作用机制深解

一句话能从结构与动力学两面讲清"胶为什么起效、为什么会失效"。
学习目标
理解

从结构层面说明单价结合、neo-PPI 形成、协同性的来源。

理解

区分降解型分子胶(MGD)非降解型(稳定/抑制型)。

分析

用动力学视角解释三元复合物寿命、hook 效应、催化循环

先建立直觉 · 为什么要懂这个

"胶"这个名字很形象:它本身可能同时只抓得住 E3 或只抓得住底物,两边都抓不牢——但当三者凑在一起时,1 + 1 > 2,整个复合物突然变得很稳。这个"凑在一起反而更牢"的现象就是协同性(cooperativity),是分子胶区别于普通小分子的灵魂。

为什么协同这么重要?因为它意味着胶可以做得很小、亲和力很弱,却照样高效工作——这正是它能保持"小分子成药性"(口服、入脑)的根本原因。理解了协同,你就理解了胶为什么是"圣杯"。

类比:两块磁性很弱的磁铁,单独都吸不住冰箱;但中间垫一张特制贴纸后,三者一叠突然牢牢贴住。贴纸(胶)自己没多大磁力,却让整体稳了——这就是协同。

结构来源:neosurface 与协同性

把 M0.2 的"协同"落到结构与动力学上。先讲结构来源:胶坐进 E3 口袋后,改造出一个"新表面(neosurface)",这个新表面与底物形成互补——活性来自小分子–蛋白 + 蛋白–蛋白的协同接触,两段亲和力叠加,单看任何一段都不够强。

概念边界:不是只有"降解型"

然后拓宽"分子胶"的概念边界:除了降解型(MGD),还有非降解型——它们都是"用小分子制造/稳定一个界面",只是下游不是降解,而是抑制 / 稳定 / 功能改变。

类型代表体系下游效应
降解型 MGDIMiD–CRBN–IKZF1/3、CK1α、GSPT1…泛素化 → 蛋白酶体降解
非降解 · 抑制FK506–FKBP–钙调磷酸酶、sanglifehrin稳定界面 → 抑制酶活
非降解 · 抑制rapamycin–FKBP–mTOR稳定界面 → 抑制信号
协同抑制MTA 协同型 PRMT5(如 AMG-193)MTAP 缺失肿瘤"合成致死式"协同

分子胶 ≠ 降解剂。它的统一定义是"用小分子制造或稳定一个本不存在的界面"。

动力学三件事:寿命、hook、催化循环

① 三元复合物寿命决定泛素化窗口——复合物存在得越久,E3 越有机会把链接长、接到位。

② hook 效应(钩状效应):浓度过高时,胶分别与 E3、底物形成竞争性二元复合物,反而压低活性,呈钟形曲线(PROTAC 更典型,胶因单价相对缓和但仍存在)。

③ 催化循环让一个胶反复工作——降解完一个靶点,胶被释放,去促成下一次相遇。

hook 效应 · 剂量—降解钟形曲线
最佳活性 二元竞争 ↓ 分子胶浓度 → 降解效率 →
为什么回落?浓度过高时,胶更可能分别占住 E3 或底物,形成"胶–E3"或"胶–底物"的二元复合物,反而挤掉了三元复合物的形成机会。

实验规避:做完整剂量梯度,找到钟形曲线峰值,不要只测高浓度点就下结论。
新教学样例 · MRT-31619一个让 CRBN 自身二聚并被降解的"化学敲除"工具,展示了三元复合物的非常规几何——胶不一定要拉来一个外部底物,也可以让连接酶降解自己。
能 | 不能 | 瓶颈(AI 依赖点)模型能估界面与埋藏面积;但对寿命、hook、催化效率这些动力学量基本无能为力(无数据)。结构指标算得出来,动力学指标算不出来——这是建模的系统性盲区。
两个常见误区
"分子胶 = 降解剂" —— 错,还有稳定/抑制型
"浓度越高降解越强" —— 错,hook 效应会让高浓度端回落
自测
  1. 协同性的两类结构来源是什么?
  2. hook 效应为什么发生?
  3. 应用一条剂量—降解曲线在高浓度端回落,如何解释、如何在实验里规避?
本节带走 · 三句话
  • 胶起效靠协同性:自己亲和力弱,凑成三元复合物却很稳——这是它能保持小分子成药性的根本。
  • 分子胶 ≠ 降解剂:还有稳定/抑制型(rapamycin–FKBP–mTOR、FK506、14-3-3),统一定义是"用小分子造/稳定一个界面"。
  • 三个动力学关键词:三元复合物寿命(决定泛素化窗口)、hook 效应(高浓度反而失效)、催化循环(一个胶反复工作)——而这些恰恰是 AI 算不准的。
必读
分子胶机制综述;非降解型胶(rapamycin / 14-3-3)一篇。
M1.4 Q1 的核心规则 前置 · M1.3 视频 35min阅读 50min实操 30min检查 15min

neo-substrate 识别规则(分子胶的"语法")

一句话拿到蛋白结构,能初判它"长得像不像可被粘的底物"。
学习目标
应用

CK1α / lenalidomide / CRBN(PDB 5FQD)为范式,讲清 β-发夹 G-loop 的几何与 CRBN 界面互补性。

分析

超越经典 G-loop:识别螺旋型 G-loop、表面模拟型非经典降解子。

评价

拿到一个蛋白结构,初步判断它"长得像不像可被粘的底物"(可成胶性结构判据)。

先建立直觉 · 为什么要懂这个

这是整个第一篇里最接近"AI 实战"的一节。前面讲了机器(UPS)、原料(E3)、原理(协同),但有个最现实的问题没答:给我一个致病蛋白,它到底能不能被粘?

答案藏在蛋白的形状里。CRBN + 胶会形成一个特定的"新表面(neosurface)",只有当底物身上某块区域的形状恰好和这个新表面互补(像拼图能拼上),才粘得住。这块标志性的区域最经典的形态叫 G-loop——一个含甘氨酸的小发夹。

类比:CRBN+胶 = 一把特制的锁孔,G-loop = 钥匙上的齿形。IMiD 能降解一堆看起来八竿子打不着的蛋白(IKZF1、CK1α、GSPT1…),不是因为它们功能相似,而是因为它们钥匙齿形碰巧都能插进这把锁。这就是"认形状不认身份"。

立范式:G-loop 与 5FQD

这是 Q1 的"语法书"。先立范式:打开 5FQD,重点看 CK1α 那个含甘氨酸的 β-发夹 G-loop 如何精确卡进 CRBN + lenalidomide 形成的 neosurface——G-loop 定义了一组表面特征,与 CRBN/胶界面整体互补。

这就是 IMiD 能降解 IKZF1/3、CK1α、GSPT1、SALL4 等一大票看似无关蛋白的统一解释:它们彼此序列、功能毫不相干,却共享一个几何相容的 G-loop 表面。

深入一层为什么偏偏是"甘氨酸"?G-loop 的化学逻辑

甘氨酸(Glycine, G)是 20 种氨基酸里最小的一个——它的侧链只有一个氢原子,几乎没有体积。这带来两个关键后果:

  • 空间不挡路:要紧紧贴进 CRBN+胶那个浅而紧的口袋,任何大侧链都会"顶住"贴不进去。甘氨酸小到可以让底物的骨架贴到最近。
  • 骨架更灵活:甘氨酸让肽链能拐出 β-发夹那个急转弯的几何,正好卡进 neosurface。

所以"含甘氨酸的 β-发夹"不是巧合,而是几何与化学共同筛出来的最优解。这也解释了为什么 G-loop 是一组"表面特征"而非一段固定序列——序列可以变,只要那个位置是甘氨酸、整体形状能互补就行。理解这点,你就明白 M1.4 末尾"可成胶性判据"为什么第一条就查甘氨酸。

核心锚句不是认序列,是认"形状"——一组与 CRBN/胶界面互补的表面特征。

语法在扩张:非经典降解子

经典 β-发夹之外,识别语法正在扩张。结论很重要:CRBN 的底物谱比想象大得多,但"非经典"正是 AI 预测最弱的地方(埋下 M4.1 的边界)。

经典 β-发夹 G-loop

含甘氨酸的 β-发夹,CK1α 是范式。模板最清晰,AI 模板匹配最可靠。

α

螺旋型 G-loop

不是 β-发夹,而是螺旋结构承载识别特征;最新的 mTOR 甘氨酸 HLH motif(helix-loop-helix)也属此类。

表面模拟型

VAV1 通过分子表面模拟接触 CRBN;G3BP2、KDM4B、VCL 等不含经典 G-loop,却同样能被识别。

语法的边界正在外推从经典 β-发夹,到螺旋型 G-loop,再到表面模拟与 mTOR 的 HLH motif——把"非 β-发夹"蛋白也纳入了 neosubstrate 名单。识别规则越来越像"表面互补"这一更普适的原则,而非某个固定序列模体。

"可成胶性"结构判据清单

最后给"可成胶性"的结构判据清单,为 Q1 蛋白组挖掘铺路。拿到一个蛋白结构时,依次检查:

初判清单
  1. 是否存在暴露在表面、几何上可接触 CRBN/胶界面的环或发夹?
  2. 该区域是否含关键甘氨酸(G-loop 的标志性残基)?
  3. 表面的形状、电荷、疏水性是否与已知 neosurface 互补?
  4. 若无经典 G-loop,是否有螺旋型 / 表面模拟 / HLH 等非经典特征?
  5. 邻近是否有可被泛素链够到的赖氨酸(呼应 M1.1:几何相容 ≠ 一定降解)?
能 | 不能 | 瓶颈(AI 依赖点)G-loop 模板匹配是 QuEEN 类全蛋白组挖掘的技术核心(M4.1);但非经典降解子缺模板、缺数据,预测可靠性显著下降。模板越清晰 AI 越强,越"非经典"AI 越弱。
两个常见误区
"只有 β-发夹 G-loop 才能被 CRBN 粘" —— 错,螺旋型、表面模拟、HLH 都行
"有 G-loop 就一定会被降解" —— 错,只是几何相容的必要非充分条件
自测
  1. G-loop 为什么能解释 IMiD 降解一大批不相关蛋白?
  2. 举两类非经典降解子。
  3. 应用 / 实操给一个蛋白结构,列出你会检查哪些表面特征来初判可成胶性。
本节带走 · 三句话
  • 识别认形状不认身份:G-loop(含甘氨酸的 β-发夹)与 CRBN+胶的 neosurface 互补,统一解释了 IMiD 降解一堆无关蛋白。
  • 语法在扩张:除经典 β-发夹,还有螺旋型 G-loop、表面模拟型、mTOR 的 HLH motif——底物谱远比想象大。
  • 有 G-loop 只是必要非充分条件(呼应 M1.1);且越"非经典",AI 越缺模板、预测越不可靠。
必读
CK1α–lenalidomide–CRBN 结构(5FQD)原始文献;G-loop 规则 / QuEEN(Science 2025)。实操:在一个结构上亲手找一次 G-loop。
M1.5 立项决策 前置 · M1.2、M1.4 视频 30min阅读 35min检查 15min

分子胶 vs PROTAC vs 其他模态:设计权衡

一句话立项阶段能为一个项目选对模态并说出理由。
学习目标
评价

在成药性、合成可及性、IP、剂量、组织分布等维度上权衡何时选胶、何时选 PROTAC

理解

解释杂合概念:分子胶式 PROTAC、分子内胶、IMiD 弹头的双重角色

先建立直觉 · 为什么要懂这个

分子胶和 PROTAC 是降解剂的两大主力,常被拿来比。最关键的区别是"价数"分子胶是单价(一个小分子,靠协同同时贴住 E3 和底物);PROTAC 是双价(一头连 E3 配体、一头连靶点弹头,中间一根连接子,像哑铃)。

这个结构差异决定了一切权衡:PROTAC 像乐高,可拼装、好设计,但分子大、难口服、难入脑;分子胶小巧、成药性好,但非模块化、极难理性设计,过去多靠偶然发现。立项时不是选"更先进的",而是看靶点和开发目标更需要哪一面

类比:PROTAC 是"用绳子把两个人拴在一起"——好操作但绳子笨重;分子胶是"用一句话让两个陌生人自然凑近聊起来"——优雅高效,但那句话极难想出来。AI 的价值,恰恰在帮你想出后者那句"话"。

多维权衡表:没有银弹

把前四个模块收口成"立项时怎么选模态"。做一张权衡表逐维对比——强调没有银弹

维度分子胶(MG)PROTAC
成药性 · 小、口服、可过 BBB分子量大,口服/入脑更难
理性设计难 · 非模块化、多靠偶然发现 · 可拼装、连接子可枚举
IP 空间结构紧凑,专利空间相对窄模块组合多,IP 空间大
合成可及性单体小分子,合成相对简单双价 + 连接子,合成更复杂
剂量/分布类传统小分子,组织分布好受分子量与理化性质限制

没有银弹:模态选择看靶点本身与开发目标。

什么时候选胶

靶点本身有可成胶表面、且需要传统小分子成药性(口服、长期给药、入脑)的场景。

什么时候选 PROTAC

需要快速理性设计、靶点已有现成配体可作弹头的场景。

杂合地带:破除非此即彼

再讲杂合地带,破除"非胶即 PROTAC"的二分——真实世界是连续谱:

分子胶式 PROTAC

把连接子缩短到接近胶,介于两者之间,兼具部分协同与部分模块化。

分子内胶

同一蛋白内部稳定一个构象或界面,而非桥接两个蛋白。

IMiD 弹头的双重角色

同一个 IMiD 弹头,既能当胶(直接招募底物),又能当 PROTAC 的 E3 招募端

能 | 不能 | 瓶颈(AI 依赖点) · 全课立论收口AI 在 PROTAC 上更成熟(模块化、可枚举连接子);正因为胶非模块化、更难,AI 的杠杆反而更大——这是全课"以胶为圆心"的立论收口。难,才是机会所在。
常见误区
"降解剂里 PROTAC 更先进所以更好" —— 错,模态选择看靶点与开发目标,不是看谁"先进"
自测
  1. 何种靶点 / 开发目标更适合分子胶?
  2. IMiD 弹头的"双重角色"指什么?
  3. 应用给一个需口服、长期给药、有浅口袋的肿瘤靶点,你选哪种模态,理由?
本节带走 · 三句话
  • 核心区别是价数:胶单价(成药性好、难设计),PROTAC 双价(可拼装、好设计但分子大)。
  • 没有银弹:选模态看靶点与开发目标——要口服/入脑/浅口袋倾向胶,要快速理性设计且有现成配体倾向 PROTAC。
  • 真实世界是连续谱:分子胶式 PROTAC、分子内胶、IMiD 弹头双重角色都是杂合地带;正因胶最难,AI 杠杆最大——这是全课立论收口。
必读
模态选择 / 降解剂设计权衡综述一篇。
自检 学完本讲

学完自检:你掌握了分子胶必备的生物学了吗?

用法能用自己的话回答下面每一条,就说明这一讲真的学透了。点开看参考要点。
自检 1细胞是怎么"选择性销毁"一个蛋白的?整条链路说一遍

参考要点:E1 用 ATP 活化泛素 → E2 转运 → E3(如 CRBN)识别特定底物并把泛素贴上去 → 链接长成 K48 多聚链(≥4 个)→ 26S 蛋白酶体识别该链 → 把蛋白整条酶解。特异性全靠 E3"认人"。

自检 2"招募 ≠ 降解"——拉到 E3 旁边后,还有哪些关卡可能卡住?

参考要点:① 底物赖氨酸是否被泛素链够得着(几何);② 链是不是 K48(K63 不降解);③ 链延伸的处理性够不够、能否接到 ≥4 个;④ 三元复合物停留时间够不够长。任意一关不过,建好结构也不降解。

自检 3分子胶为什么能又小又有效?用"协同性"解释

参考要点:胶单独对 E3 或底物亲和力都弱,但三者凑成复合物时两段接触(小分子–蛋白 + 蛋白–蛋白)协同叠加,整体很稳。这让胶可以做得很小、弱亲和却高效——从而保住口服、入脑等小分子成药性。

自检 4为什么 IMiD 能降解一堆毫不相关的蛋白?

参考要点:因为识别"认形状不认身份"。CRBN+胶形成一个固定 neosurface,凡是底物表面有与之互补的特征(经典:含甘氨酸的 β-发夹 G-loop;也有螺旋型、表面模拟、HLH 等非经典形态)就能被粘。IKZF1、CK1α、GSPT1 功能无关,却共享几何相容的表面。

自检 5给你一个需口服、长期给药、靶点只有浅口袋的项目,选胶还是 PROTAC?

参考要点:倾向分子胶——口服 + 长期给药需要小分子成药性,PROTAC 分子大、口服/入脑差;浅口袋意味着传统占据型抑制剂难做,正适合"诱导邻近 + 降解"。但需先评估该靶点是否有可成胶表面(M1.4 判据),以及选哪种 E3(M1.2,最好组织特异以拓宽治疗窗口)。没有可成胶表面时再退而考虑 PROTAC 等。

自检 6哪些环节 AI 现在帮得上、哪些还无能为力?

参考要点:帮得上——三元复合物几何/界面/埋藏面积预测、CRBN 上经典 G-loop 模板匹配(全蛋白组挖掘)、可配体化 E3 与口袋可成药性。无能为力——三元复合物寿命、hook 效应、处理性/催化效率等动力学量(缺数据),以及非经典降解子、非 CRBN 体系(缺模板缺结构)。一句话:结构算得出,动力学算不出。

速查 本讲术语

术语速查

用法点开任意词条查看一句话定义;读模块遇到生词随时回来查。
机制与系统
UPS泛素—蛋白酶体系统
细胞降解蛋白的主通路:E1 活化 → E2 转运 → E3 贴标签 → 26S 蛋白酶体酶解。
E1/2/3E1 / E2 / E3 级联
E1 活化泛素(耗 ATP),E2 转运,E3 连接并决定底物特异性。E3 是"认人"的那一环。
CRL4CRL4CRBN
分子胶主战场 E3:Cullin4-RING 连接酶 + DDB1 接头 + CRBN 底物受体。
NEDneddylation
给 Cullin 接上 NEDD8,像"打开开关"激活整台 CRL 机器。
K48K48 / K63 链
泛素链拓扑:K48 链是降解信号(送蛋白酶体);K63 链多为信号转导/DNA 修复,不直接降解
PROC处理性 processivity
E3 一次性把泛素链延伸到足够长的能力;处理性不足,链太短也不会被高效降解。
分子胶机制
neoneosurface / neo-PPI
胶坐进 E3 后改造出的"新表面",与底物形成自然界本不存在的蛋白—蛋白界面。
协同协同性 cooperativity
活性来自小分子–蛋白 + 蛋白–蛋白两段接触的协同叠加,单看任一段都不够强。
寿命三元复合物寿命
E3–胶–底物三元复合物的停留时间,决定泛素化窗口长短。
hookhook 效应
浓度过高时形成竞争性二元复合物、反压低活性,呈钟形曲线。
催化催化型降解
一个胶分子循环驱动多份靶蛋白被清除(亚化学计量、事件驱动)。
MGDMGD vs 非降解胶
MGD = 降解型分子胶;非降解型(rapamycin–FKBP–mTOR、FK506、14-3-3)只稳定/抑制界面而不降解。
识别规则与底物
deg降解子 degron
蛋白上能被 E3 / 降解机器识别的结构或序列标记。
GloopG-loop
含甘氨酸的 β-发夹(经典)等表面特征,与 CRBN/胶界面互补;CK1α 是范式。
5FQD5FQD
CK1α–lenalidomide–CRBN 三元复合物结构(PDB),G-loop 识别的范式结构。
HLHmTOR 甘氨酸 HLH motif
最新发现的螺旋型非经典 degron(helix-loop-helix),把非 β-发夹蛋白纳入 neosubstrate 名单。
IMiD / CELMoD
CRBN 调节剂:第一代 IMiD(thalidomide / lenalidomide / pomalidomide)与下一代 CELMoD。
模态与杂合
MG分子胶 MG
单价小分子,诱导 neo-PPI;最像传统小分子、最难理性设计——本课圆心。
PROPROTAC
双价:E3 配体 + 连接子 + 弹头,可模块化拼装招募 E3 降解胞内蛋白。
分子胶式 PROTAC
把连接子缩短到接近胶的杂合分子,介于胶与 PROTAC 之间。