毕业项目:写一份分子胶立项判断报告
这门课的全部知识,最后要落到一件事上:拿一个真实靶点,沿五问从头跑一遍,产出一份你敢签字的《分子胶立项判断报告》——它不预测"一定成",而是诚实地告诉决策者:这个靶点值不值得立项、风险在哪、AI 在每一步到底帮上了多少忙。
为什么是"判断报告",不是"设计出一个胶"
回扣导论三律令 · 诚实优先于炒作整门课从导论起就把丑话说在前面:今天没有人能"一键设计出一个分子胶"。所以你的毕业项目不会以"我设计出了一个能成药的分子"收尾——那既不诚实,也不是真实工业界要的东西。真实场景里,一个团队要做的判断是:面对一个候选靶点,到底该不该把钱、人和时间投进去?这份报告就是回答这个问题。
它的价值,正是这门课反复打磨的那样东西——判断力。你要沿五问把这个靶点走一遍,每一步都做两件事:① 用 AI / 计算工具产出一个最好的当前估计;② 诚实标注这个估计有多可信、AI 在这里是真有杠杆还是在讲故事。
↻ 这个项目用到全课哪些模块
导论:五问框架、α 协同直觉、反炒作判据——整份报告的骨架与立场。
第一篇:UPS / E3 版图、neo-substrate 语法——判断"这个靶点结构上接不接得住胶"。
第二篇:表示方法、共折叠模型、生成式设计、ML 思维(尤其 time-split 与不确定性)。
第三篇:数据从哪来、为什么稀缺——决定你每个预测的天花板。
第四篇(主战场):Q1–Q5 的方法与失败模式,本项目逐问对应。
第五篇:实验验证级联、体内转化、选择性去风险——报告里"下一步该做什么实验"的依据。
第六篇:平台/IP/批判工具箱——报告的战略与 FTO 视角。
交付什么:报告的结构
一份文档 · 6 个部分 · 每个结论都带"置信度"报告本身建议控制在 8–15 页(不含附录),结构如下。每一节的核心都不是"我跑了什么",而是"我据此得出什么判断、可信度多少"。
- 执行摘要(1 页)。一句话结论 + 三条关键理由 + 一句最大风险。让决策者只读这一页也能拍板。
- 靶点与疾病论证(Q1 的一半)。这个蛋白与什么疾病相关、降解它为什么有治疗意义、为什么"不可成药"使它适合做胶。
- 可成胶性与五问全流程(Q1–Q5)。本报告主体,逐问展开(见下一节)。
- 诚实置信度小结。把每问的"该信几分"汇成一张表,标出整条链上最弱的一环。
- 立项结论与风险。建议 / 暂缓 / 否定,三选一并写明依据;列出 top 3 风险。
- 实验路线图(接第五篇)。若建议推进,先做哪 2–3 个实验、各要证伪什么、预期读出。
沿五问跑一遍
每一问 = 一个计算任务 + 一次诚实判断下面把五问翻译成你在毕业项目里要逐一完成的五个阶段。每个阶段都给出"做什么""用什么工具""交付物""最该警惕什么"。这正是第四篇 M4.1–M4.5 的实操串联,M4.6 的端到端复盘就是它的样板。
从一个你选定的靶点出发(或从一个家族里挑),用可成胶性打分 + 三轴交叉(可成胶性 × 疾病生物学 × E3 相容性)论证它进入候选的理由。两条挖掘路线——G-loop 结构模板匹配、surface matchmaking——至少说清你依据哪一条、为什么。
用共折叠模型(AF3 / Boltz / Chai 等)把"靶 + E3 + 候选胶"折成三元结构,读界面、估埋藏面积与协同/ΔΔG,必要时 MD 精修。这是全项目最考验诚实的一步:你必须读懂 PAE / ipTM 信号,并牢记 AF3 在分子胶界面上的恢复率只有约三成、且很大程度是"记忆而非泛化"。
围绕选定的 E3 口袋 / 界面,用生成式或类似物扩展给出若干候选骨架,并讨论可合成性。重点不在"生成得多炫",而在你能否对生成结果做可合成性与协同潜力的筛选。
预测降解功能与脱靶选择性,并明确指出预测的终审一定是全局蛋白组学,不是任何打分。打分高 ≠ 可降解;这一步你要把"可计算的部分"和"必须靠湿实验裁决的部分"清楚分开。
说明若推进,你会怎么设计 DMTA 闭环:哪一轮湿实验数据回喂哪个模型、如何让数据"干净地流动、复利地回喂"。这一步把项目从"一次预测"升级成"一条会越跑越准的飞轮"——也呼应第六篇平台护城河的核心。
诚实层:给每一步的 AI 作用打分
本项目的灵魂 · 区分"真本事 / 半真 / 话术"这是把你和"只会跑模型的人"区分开来的一节。沿五问每一步,用一句话回答:AI 在这里到底帮了多少?用第六篇 M6.4 那套三色标注——真本事(有据可验)/ 半真(有用但有重大未知)/ 话术(偷换口径或无实证)。把它做成一张随报告附上的表。
一个诚实的项目,很可能在 Q2(三元置信度只有三成)或 Q4(选择性必须等蛋白组学)处发现"最弱的一环"。找到并明说这一环,就是这份报告最有价值的部分——它告诉决策者钱该先花在哪、风险该先去验证哪个。
评分量规(自评 / 互评)
100 分 · 诚实度与判断力权重最高用下表给自己的报告打分。注意权重:把模型跑通只是基础分,真正拉开差距的是诚实标注与结论的可辩护性。
| 维度 | 分值 | 什么样算满分 |
|---|---|---|
| 五问完整性 | 20 | 五问每一步都有交付物,工具选择合理、与课程方法对得上。 |
| 诚实置信度 | 25 | 每步都标了"该信几分"且理由站得住;明确指出全链最弱的一环。这是最高权重项。 |
| 结论可辩护性 | 20 | 立项 / 暂缓 / 否定三选一,依据清楚、敢于给否定结论;top 3 风险具体。 |
| AI 作用判断 | 15 | 三色标注表完整,能区分真本事 / 半真 / 话术,三问都问到了。 |
| 实验路线图 | 10 | 给出 2–3 个先做的湿实验,每个都说清"要证伪什么假设"。 |
| 表达与可读性 | 10 | 执行摘要一页能让人拍板;图表清楚,篇幅克制。 |
建议节奏与产出
~10 小时 · 云端 notebook · 可分四次完成项目可以拆成四段来做,每段产出一块报告。所有计算都能在云端 notebook 上跑,无需本地 GPU。
提示:M4.6(端到端案例复盘)与 M5.1(实验验证级联的四个实验)就是本项目的脚手架与样板——动手前先回看这两处,会让你少走很多弯路。
毕业自测
交报告前,对自己问这几题- 如果只让你保留报告里的一页,你会留哪一页?它能让决策者独立拍板吗?
- 你这条五问链上"最弱的一环"是哪一步?你在报告里明说了吗?
- 有人质疑你 Q2 的三元结构"看起来很准",你用哪两个证据回应"该信几分"?
- 你的立项结论如果是"建议推进",最可能在哪个湿实验上被推翻?你把它列进路线图了吗?
- 把你报告里关于 AI 作用最"乐观"的一句话拎出来——它经得起"数据 / 分母 / 湿实验"三问吗?
展开参考答案 · 自评要点
1. 应是执行摘要:一句话结论 + 三条理由 + 一句最大风险。若它离开后文就无法拍板,说明摘要没写到位。
2. 多数真实项目的最弱环在 Q2(三元置信度仅约三成且多为记忆)或 Q4(选择性终审必须靠全局蛋白组学)。明确指出它,是报告最有价值之处。
3. 合格的回应会引用置信度读数(PAE / ipTM)与界面特征(是否大界面、诱导成型口袋、新型 E3),而不是"模型说准就准"。
4. 通常是细胞降解读出(HiBiT/WB)或全局蛋白组学选择性——计算给的是假设,这两个实验才是裁决。没列进路线图就是漏了关键一步。
5. 若那句话没有数据来源、没有基线/样本量、没有湿实验支撑,就应在三色表里被标成半真或话术,并在结论里相应降权。