五个模块,一条主线:从"细胞怎么降解蛋白"到"什么样的蛋白能被粘"
这五个模块层层递进。先理解细胞自带的降解机器(UPS),再把 E3 连接酶当成可调用的"设计资源库",然后从结构与动力学讲清分子胶的作用机制,接着学习"什么蛋白长得像可被粘的底物"这套识别语法,最后收口到立项时如何在分子胶与 PROTAC 之间做选择。贯穿全篇的关键洞见只有一句:招募 ≠ 降解。
UPS 深解
E1→E2→E3 级联与 CRL4 机器;为什么"招募"不等于"降解"。
M1.2E3 版图
把 E3 当设计资源;CRBN 主战场之外的非共价 vs 共价两条路线。
M1.3机制深解
neosurface、协同性、三元复合物寿命、hook 效应、催化循环。
M1.4识别规则
G-loop 范式(5FQD);经典与非经典降解子;"可成胶性"判据。
M1.5模态权衡
分子胶 vs PROTAC 多维对比;杂合模态;立项怎么选。
泛素—蛋白酶体系统(UPS)深解
画出 E1→E2→E3 三级级联与 CRL4 机器,说明 neddylation 的调控作用。
解释为什么招募 ≠ 降解:泛素链拓扑、E2 配对、链延伸处理性、复合物几何与停留时间共同决定结果。
对比降解的亚化学计量催化特性与占据型抑制的化学计量特性。
细胞里每时每刻都有蛋白被合成、被销毁。蛋白酶体就是细胞的"碎纸机"——但它不会乱碎,只销毁被打上标记的蛋白。这个标记就是一种叫泛素(ubiquitin,一种 76 个氨基酸的小蛋白)的"小旗子",串成链贴在目标蛋白上。
分子胶能起效,本质上就是劫持了这套天然的"贴标签—销毁"系统:它不直接破坏致病蛋白,而是骗细胞自己给致病蛋白贴上"销毁"标签。所以想懂分子胶,必须先懂细胞是怎么贴标签、怎么销毁的——这就是 UPS。
学习脉络:细胞的"垃圾分类 + 回收"系统
先把 UPS 当成细胞的"垃圾分类 + 回收"系统讲清三步:E1 活化泛素、E2 转运、E3 给底物"贴标签"——连接酶决定特异性,是整个系统里"认人"的那一环。
重点放在 CRL4CRBN:Cullin4 骨架 + DDB1 接头 + CRBN 底物受体。neddylation(接上 NEDD8)像"打开开关"——它激活整台机器,没有它 CRL 就转不起来。
深入一层为什么是"三级"级联?E1/E2/E3 各自管什么
细胞用三级而不是一步,是为了兼顾效率与特异性——把"激活"和"认人"这两件事分开管。
- E1(活化酶,~2 种):消耗 ATP,把泛素的尾巴"点火"成高能态。数量极少,因为它只负责"上游供能",不需要挑底物。
- E2(结合酶,~40 种):从 E1 手里接过活化的泛素,像快递中转站。不同 E2 还会影响链连成什么类型(K48 还是 K63)。
- E3(连接酶,~600+ 种):数量最多,因为特异性全靠它——每种 E3 认一组特定底物。CRBN 就是其中一种 E3 的底物受体。
记一个比例就够直观:极少 E1 → 中等 E2 → 海量 E3。越往下游,越是"认人"的活儿,种类越多。分子胶的全部魔法都发生在最下游那一环——它改写 E3 "认谁"的标准。
活化酶
消耗 ATP,把泛素"点火"激活,转交给 E2。
结合酶
携带活化的泛素,作为"快递员"转运。
连接酶
识别底物、决定特异性,把泛素"贴"到底物赖氨酸上。
蛋白酶体
识别 K48 多泛素链,把标记的蛋白整条酶解。
CRL4CRBN = Cullin4 骨架 + DDB1 接头 + CRBN 受体 + neddylation 开关。分子胶坐进 CRBN,改写它"认人"的标准。
全课最关键的洞见:招募 ≠ 降解
把一个底物拉到 E3 旁边只是第一步。能不能真被降解,还取决于一连串"成功之后"的条件:
赖氨酸可达性
底物的赖氨酸是否被泛素链"够得着"?几何不对,链就接不上。
链的类型与延伸
链是 K48(送去酶解)还是 K63(信号)?链延伸够不够"处理性"(processivity)?
几何与停留时间
三元复合物的几何与停留时间,决定泛素化窗口够不够长。
通过泛素第 48 位赖氨酸连接的多聚链,是蛋白酶体识别的"送去酶解"标签。降解走这条。
通过第 63 位赖氨酸连接,多用于 DNA 修复、信号转导等,不直接送蛋白酶体。同样是"泛素化",结局完全不同。
深入一层"链延伸处理性"到底卡在哪?这是 AI 算不准降解的关键
蛋白酶体有个硬门槛:泛素链通常要够长(一般 ≥4 个泛素),它才认得出"这是该销毁的"。只贴一两个泛素(单泛素化)往往不触发降解。
处理性(processivity)指的就是 E3 能不能一鼓作气把链接到足够长,而不是接一个就掉链子。它取决于:
- 三元复合物的停留时间——复合物散得太快,链还没接长就结束了;
- 底物赖氨酸相对 E2 的几何位置——够不够得着,角度对不对;
- E2 的种类——有的 E2 擅长起头,有的擅长延伸。
关键就在这里:三元复合物的结构(几何)可以用 AlphaFold 类工具预测,但"接链够不够快够不够长"是动力学问题,几乎没有可训练的数据。所以模型能告诉你"它们能贴在一起",却答不出"贴上之后会不会真被销毁"。记住这条,第四篇 M4.4 的难点你就有了根。
这就是第四篇为什么难、为什么"建好了三元结构也不代表能降解"的根。最后点出催化性:一个降解剂分子能驱动很多份靶蛋白被清除(事件驱动),这是降解优于抑制的核心红利——也是它与化学计量、一对一的占据型抑制最本质的区别。
- neddylation 在 CRL 激活里起什么作用?
- 为什么"招募成功"不等于"降解成功"?举两个决定因素。
- 应用某胶能形成稳定三元复合物却几乎不降解靶点,列出三个可能原因。
- UPS = 细胞的"贴标签—销毁"系统:E1 活化 → E2 转运 → E3 认人 → 蛋白酶体销毁,分子胶劫持的就是 E3 这一环。
- 招募 ≠ 降解:拉到 E3 旁边只是第一步,还要看赖氨酸够不够得着、链是不是 K48、接链够不够长(处理性)。
- 降解是催化、亚化学计量、一对多——一个胶能送走很多份靶蛋白,这是它优于"一对一占据"抑制剂的根本红利。
E3 连接酶版图:作为"设计资源"来看
说明 CRBN/CRL4 为何是分子胶主战场(IMiD/CELMoD 的靶标)。
对比两种主导识别策略:非共价界面延伸 vs 共价稳定。
面对新靶点能判断走哪条 E3 路线,并说明组织/肿瘤特异性 E3 的战略价值。
人体大约有 600 多种 E3 连接酶,每种认一组不同的底物。做分子胶,本质是挑一种 E3 当"招募者",再把致病蛋白介绍给它。所以 E3 不是背景知识,而是你手上的原材料清单——选哪种 E3,直接决定这个项目能不能成、毒性大不大。
但这 600 多种里,绝大多数还没人找到能"抓住"它的小分子(配体),等于有原料却没有把手,暂时用不上。真正配齐了把手、能拿来设计药的,目前还集中在少数几种——其中 CRBN 是绝对主力。
学习脉络:把 E3 当成"设计资源库"
换一个视角看 E3——它不是生物学背景板,而是可调用的"设计资源库"。主线还是 CRBN/CRL4:IMiD/CELMoD 的舞台,G-loop 识别的范式(细节留给 M1.4)。
然后讲非 CRBN 路线,并按"识别机制"二分讲清——这是本模块的骨架:
非共价界面延伸
DCAF15 + indisulam / E7820 → RBM39。芳基磺酰胺把底物"延伸贴"到连接酶界面,靠的是非共价互补,不形成共价键。
共价稳定
DCAF16 / DCAF11 + 共价弹头 → BRD4 等。弹头与连接酶(或底物)形成共价键,把三元复合物"锁死",靠化学键稳定界面。
深入一层非共价 vs 共价:两条路各有什么得失?
这两种策略不是谁更先进,而是用"贴得牢不牢"换"可不可逆":
- 非共价界面延伸:胶靠形状、电荷、疏水互补"贴"在界面上,结合可逆。优点是选择性可调、脱靶风险相对可控;缺点是界面亲和力弱时,三元复合物可能存在得太短,降解效率上不去。
- 共价稳定:胶带一个"弹头"(反应性基团)与蛋白上的半胱氨酸等残基形成化学键,把复合物锁死。优点是结合极强、停留时间长,容易触发高效降解;缺点是共价键不可逆,一旦脱靶后果更严重,需要更谨慎评估选择性。
立项时的直觉:要更安全可控、可滴定剂量,倾向非共价;靶点界面浅、非共价抓不牢、需要强力锁定时,考虑共价。这也呼应 M1.3 会讲的"三元复合物寿命决定降解效率"。
可用的 E3 宇宙
再扫一遍可用的 E3 宇宙——VHL、KEAP1、β-TrCP、SIAH1… 以及"可成药 / PROTAC-able E3 universe"这个概念:人体上百种 E3,真正配上了配体、能拿来设计降解剂的还是少数。
CRBN / CRL4分子胶主战场
IMiD / CELMoD 的靶标,数据最全、建模最可靠。G-loop 识别范式的舞台。
indisulam / E7820 招募 RBM39,界面延伸的经典范例。
共价弹头稳定三元复合物,降解 BRD4 等。
共价稳定路线的另一成员,DCAF 家族正在扩张。
PROTAC 主力 E3 之一;分子胶应用有限但配体成熟。
各有底物识别偏好,逐步被纳入降解剂工具箱。
更广的"可配体化 E3"候选,多数仍缺三元结构数据。
- indisulam–DCAF15–RBM39 属于哪种识别策略?
- 组织特异性 E3 为什么能拓宽治疗窗口?
- 应用给一个在肝高表达、需避免中枢毒性的靶点,你会优先考察哪类 E3?
- 把 E3 当成原材料清单:选哪种 E3 = 选哪个"招募者",直接决定项目可行性与毒性。
- 非 CRBN 路线按识别机制二分:非共价界面延伸(DCAF15→RBM39)vs 共价稳定(DCAF16/11)——前者安全可控,后者结合更强。
- 组织/肿瘤特异性 E3 是战略牌:在肿瘤高表达、正常组织低表达的 E3 上做胶,治疗窗口更宽。
分子胶作用机制深解
从结构层面说明单价结合、neo-PPI 形成、协同性的来源。
区分降解型分子胶(MGD)与非降解型(稳定/抑制型)。
用动力学视角解释三元复合物寿命、hook 效应、催化循环。
"胶"这个名字很形象:它本身可能同时只抓得住 E3 或只抓得住底物,两边都抓不牢——但当三者凑在一起时,1 + 1 > 2,整个复合物突然变得很稳。这个"凑在一起反而更牢"的现象就是协同性(cooperativity),是分子胶区别于普通小分子的灵魂。
为什么协同这么重要?因为它意味着胶可以做得很小、亲和力很弱,却照样高效工作——这正是它能保持"小分子成药性"(口服、入脑)的根本原因。理解了协同,你就理解了胶为什么是"圣杯"。
结构来源:neosurface 与协同性
把 M0.2 的"协同"落到结构与动力学上。先讲结构来源:胶坐进 E3 口袋后,改造出一个"新表面(neosurface)",这个新表面与底物形成互补——活性来自小分子–蛋白 + 蛋白–蛋白的协同接触,两段亲和力叠加,单看任何一段都不够强。
概念边界:不是只有"降解型"
然后拓宽"分子胶"的概念边界:除了降解型(MGD),还有非降解型——它们都是"用小分子制造/稳定一个界面",只是下游不是降解,而是抑制 / 稳定 / 功能改变。
| 类型 | 代表体系 | 下游效应 |
|---|---|---|
| 降解型 MGD | IMiD–CRBN–IKZF1/3、CK1α、GSPT1… | 泛素化 → 蛋白酶体降解 |
| 非降解 · 抑制 | FK506–FKBP–钙调磷酸酶、sanglifehrin | 稳定界面 → 抑制酶活 |
| 非降解 · 抑制 | rapamycin–FKBP–mTOR | 稳定界面 → 抑制信号 |
| 协同抑制 | MTA 协同型 PRMT5(如 AMG-193) | MTAP 缺失肿瘤"合成致死式"协同 |
分子胶 ≠ 降解剂。它的统一定义是"用小分子制造或稳定一个本不存在的界面"。
动力学三件事:寿命、hook、催化循环
① 三元复合物寿命决定泛素化窗口——复合物存在得越久,E3 越有机会把链接长、接到位。
② hook 效应(钩状效应):浓度过高时,胶分别与 E3、底物形成竞争性二元复合物,反而压低活性,呈钟形曲线(PROTAC 更典型,胶因单价相对缓和但仍存在)。
③ 催化循环让一个胶反复工作——降解完一个靶点,胶被释放,去促成下一次相遇。
实验规避:做完整剂量梯度,找到钟形曲线峰值,不要只测高浓度点就下结论。
- 协同性的两类结构来源是什么?
- hook 效应为什么发生?
- 应用一条剂量—降解曲线在高浓度端回落,如何解释、如何在实验里规避?
- 胶起效靠协同性:自己亲和力弱,凑成三元复合物却很稳——这是它能保持小分子成药性的根本。
- 分子胶 ≠ 降解剂:还有稳定/抑制型(rapamycin–FKBP–mTOR、FK506、14-3-3),统一定义是"用小分子造/稳定一个界面"。
- 三个动力学关键词:三元复合物寿命(决定泛素化窗口)、hook 效应(高浓度反而失效)、催化循环(一个胶反复工作)——而这些恰恰是 AI 算不准的。
neo-substrate 识别规则(分子胶的"语法")
以 CK1α / lenalidomide / CRBN(PDB 5FQD)为范式,讲清 β-发夹 G-loop 的几何与 CRBN 界面互补性。
超越经典 G-loop:识别螺旋型 G-loop、表面模拟型非经典降解子。
拿到一个蛋白结构,初步判断它"长得像不像可被粘的底物"(可成胶性结构判据)。
这是整个第一篇里最接近"AI 实战"的一节。前面讲了机器(UPS)、原料(E3)、原理(协同),但有个最现实的问题没答:给我一个致病蛋白,它到底能不能被粘?
答案藏在蛋白的形状里。CRBN + 胶会形成一个特定的"新表面(neosurface)",只有当底物身上某块区域的形状恰好和这个新表面互补(像拼图能拼上),才粘得住。这块标志性的区域最经典的形态叫 G-loop——一个含甘氨酸的小发夹。
立范式:G-loop 与 5FQD
这是 Q1 的"语法书"。先立范式:打开 5FQD,重点看 CK1α 那个含甘氨酸的 β-发夹 G-loop 如何精确卡进 CRBN + lenalidomide 形成的 neosurface——G-loop 定义了一组表面特征,与 CRBN/胶界面整体互补。
这就是 IMiD 能降解 IKZF1/3、CK1α、GSPT1、SALL4 等一大票看似无关蛋白的统一解释:它们彼此序列、功能毫不相干,却共享一个几何相容的 G-loop 表面。
深入一层为什么偏偏是"甘氨酸"?G-loop 的化学逻辑
甘氨酸(Glycine, G)是 20 种氨基酸里最小的一个——它的侧链只有一个氢原子,几乎没有体积。这带来两个关键后果:
- 空间不挡路:要紧紧贴进 CRBN+胶那个浅而紧的口袋,任何大侧链都会"顶住"贴不进去。甘氨酸小到可以让底物的骨架贴到最近。
- 骨架更灵活:甘氨酸让肽链能拐出 β-发夹那个急转弯的几何,正好卡进 neosurface。
所以"含甘氨酸的 β-发夹"不是巧合,而是几何与化学共同筛出来的最优解。这也解释了为什么 G-loop 是一组"表面特征"而非一段固定序列——序列可以变,只要那个位置是甘氨酸、整体形状能互补就行。理解这点,你就明白 M1.4 末尾"可成胶性判据"为什么第一条就查甘氨酸。
语法在扩张:非经典降解子
经典 β-发夹之外,识别语法正在扩张。结论很重要:CRBN 的底物谱比想象大得多,但"非经典"正是 AI 预测最弱的地方(埋下 M4.1 的边界)。
经典 β-发夹 G-loop
含甘氨酸的 β-发夹,CK1α 是范式。模板最清晰,AI 模板匹配最可靠。
螺旋型 G-loop
不是 β-发夹,而是螺旋结构承载识别特征;最新的 mTOR 甘氨酸 HLH motif(helix-loop-helix)也属此类。
表面模拟型
VAV1 通过分子表面模拟接触 CRBN;G3BP2、KDM4B、VCL 等不含经典 G-loop,却同样能被识别。
"可成胶性"结构判据清单
最后给"可成胶性"的结构判据清单,为 Q1 蛋白组挖掘铺路。拿到一个蛋白结构时,依次检查:
- 是否存在暴露在表面、几何上可接触 CRBN/胶界面的环或发夹?
- 该区域是否含关键甘氨酸(G-loop 的标志性残基)?
- 表面的形状、电荷、疏水性是否与已知 neosurface 互补?
- 若无经典 G-loop,是否有螺旋型 / 表面模拟 / HLH 等非经典特征?
- 邻近是否有可被泛素链够到的赖氨酸(呼应 M1.1:几何相容 ≠ 一定降解)?
- G-loop 为什么能解释 IMiD 降解一大批不相关蛋白?
- 举两类非经典降解子。
- 应用 / 实操给一个蛋白结构,列出你会检查哪些表面特征来初判可成胶性。
- 识别认形状不认身份:G-loop(含甘氨酸的 β-发夹)与 CRBN+胶的 neosurface 互补,统一解释了 IMiD 降解一堆无关蛋白。
- 语法在扩张:除经典 β-发夹,还有螺旋型 G-loop、表面模拟型、mTOR 的 HLH motif——底物谱远比想象大。
- 有 G-loop 只是必要非充分条件(呼应 M1.1);且越"非经典",AI 越缺模板、预测越不可靠。
分子胶 vs PROTAC vs 其他模态:设计权衡
在成药性、合成可及性、IP、剂量、组织分布等维度上权衡何时选胶、何时选 PROTAC。
解释杂合概念:分子胶式 PROTAC、分子内胶、IMiD 弹头的双重角色。
分子胶和 PROTAC 是降解剂的两大主力,常被拿来比。最关键的区别是"价数":分子胶是单价(一个小分子,靠协同同时贴住 E3 和底物);PROTAC 是双价(一头连 E3 配体、一头连靶点弹头,中间一根连接子,像哑铃)。
这个结构差异决定了一切权衡:PROTAC 像乐高,可拼装、好设计,但分子大、难口服、难入脑;分子胶小巧、成药性好,但非模块化、极难理性设计,过去多靠偶然发现。立项时不是选"更先进的",而是看靶点和开发目标更需要哪一面。
多维权衡表:没有银弹
把前四个模块收口成"立项时怎么选模态"。做一张权衡表逐维对比——强调没有银弹:
| 维度 | 分子胶(MG) | PROTAC |
|---|---|---|
| 成药性 | 胜 · 小、口服、可过 BBB | 分子量大,口服/入脑更难 |
| 理性设计 | 难 · 非模块化、多靠偶然发现 | 胜 · 可拼装、连接子可枚举 |
| IP 空间 | 结构紧凑,专利空间相对窄 | 模块组合多,IP 空间大 |
| 合成可及性 | 单体小分子,合成相对简单 | 双价 + 连接子,合成更复杂 |
| 剂量/分布 | 类传统小分子,组织分布好 | 受分子量与理化性质限制 |
没有银弹:模态选择看靶点本身与开发目标。
什么时候选胶
靶点本身有可成胶表面、且需要传统小分子成药性(口服、长期给药、入脑)的场景。
什么时候选 PROTAC
需要快速理性设计、靶点已有现成配体可作弹头的场景。
杂合地带:破除非此即彼
再讲杂合地带,破除"非胶即 PROTAC"的二分——真实世界是连续谱:
分子胶式 PROTAC
把连接子缩短到接近胶,介于两者之间,兼具部分协同与部分模块化。
分子内胶
在同一蛋白内部稳定一个构象或界面,而非桥接两个蛋白。
IMiD 弹头的双重角色
同一个 IMiD 弹头,既能当胶(直接招募底物),又能当 PROTAC 的 E3 招募端。
- 何种靶点 / 开发目标更适合分子胶?
- IMiD 弹头的"双重角色"指什么?
- 应用给一个需口服、长期给药、有浅口袋的肿瘤靶点,你选哪种模态,理由?
- 核心区别是价数:胶单价(成药性好、难设计),PROTAC 双价(可拼装、好设计但分子大)。
- 没有银弹:选模态看靶点与开发目标——要口服/入脑/浅口袋倾向胶,要快速理性设计且有现成配体倾向 PROTAC。
- 真实世界是连续谱:分子胶式 PROTAC、分子内胶、IMiD 弹头双重角色都是杂合地带;正因胶最难,AI 杠杆最大——这是全课立论收口。
学完自检:你掌握了分子胶必备的生物学了吗?
自检 1细胞是怎么"选择性销毁"一个蛋白的?整条链路说一遍
参考要点:E1 用 ATP 活化泛素 → E2 转运 → E3(如 CRBN)识别特定底物并把泛素贴上去 → 链接长成 K48 多聚链(≥4 个)→ 26S 蛋白酶体识别该链 → 把蛋白整条酶解。特异性全靠 E3"认人"。
自检 2"招募 ≠ 降解"——拉到 E3 旁边后,还有哪些关卡可能卡住?
参考要点:① 底物赖氨酸是否被泛素链够得着(几何);② 链是不是 K48(K63 不降解);③ 链延伸的处理性够不够、能否接到 ≥4 个;④ 三元复合物停留时间够不够长。任意一关不过,建好结构也不降解。
自检 3分子胶为什么能又小又有效?用"协同性"解释
参考要点:胶单独对 E3 或底物亲和力都弱,但三者凑成复合物时两段接触(小分子–蛋白 + 蛋白–蛋白)协同叠加,整体很稳。这让胶可以做得很小、弱亲和却高效——从而保住口服、入脑等小分子成药性。
自检 4为什么 IMiD 能降解一堆毫不相关的蛋白?
参考要点:因为识别"认形状不认身份"。CRBN+胶形成一个固定 neosurface,凡是底物表面有与之互补的特征(经典:含甘氨酸的 β-发夹 G-loop;也有螺旋型、表面模拟、HLH 等非经典形态)就能被粘。IKZF1、CK1α、GSPT1 功能无关,却共享几何相容的表面。
自检 5给你一个需口服、长期给药、靶点只有浅口袋的项目,选胶还是 PROTAC?
参考要点:倾向分子胶——口服 + 长期给药需要小分子成药性,PROTAC 分子大、口服/入脑差;浅口袋意味着传统占据型抑制剂难做,正适合"诱导邻近 + 降解"。但需先评估该靶点是否有可成胶表面(M1.4 判据),以及选哪种 E3(M1.2,最好组织特异以拓宽治疗窗口)。没有可成胶表面时再退而考虑 PROTAC 等。
自检 6哪些环节 AI 现在帮得上、哪些还无能为力?
参考要点:帮得上——三元复合物几何/界面/埋藏面积预测、CRBN 上经典 G-loop 模板匹配(全蛋白组挖掘)、可配体化 E3 与口袋可成药性。无能为力——三元复合物寿命、hook 效应、处理性/催化效率等动力学量(缺数据),以及非经典降解子、非 CRBN 体系(缺模板缺结构)。一句话:结构算得出,动力学算不出。