biosolveit::cli
组件 02 · 打分 Scoring · v2.5

HYDE — 去溶剂化感知打分

HYDE 是 BioSolveIT 屡获殊荣的打分函数,在命令行下对蛋白-配体复合物打分。它不针对特定靶标训练或校准,完全基于物理原理——结合的两大驱动力:去溶剂化(desolvation)与相互作用(interactions)——因此能给出真实的结合自由能,并可把亲和力分解到每个原子。可执行文件名为 hydescorer

可执行文件
hydescorer
配体输入
.sdf .mol .mol2
输出
.sdf(优化姿势)
亲和力单位
nM(上/下界)

01 它能做什么

  • 对蛋白结合态配体打分并优化姿势。
  • 计算估计结合亲和力(给出一个上界与下界范围)。
  • 计算并优化氢键网络。
  • 把药效团约束作为后过滤(post filter)。
  • 处理配体数量不限。
典型用法
HYDE 最常见的用途是给 FlexX 的对接结果重打分、改善排序。输入分子需已位于蛋白口袋内并带 3D 坐标(对接结果或晶体天然配体)。

02 前提与授权

需要 HYDE 程序包(产品名 hydescorer)、命令行环境与有效许可证。有效的 SeeSAR 许可证也会被 hydescorer 接受。许可证放置方式与其他工具相同:测试许可证直接放在可执行文件旁。

检查 license
./hydescorer --license-info
配合 SeeSAR 更顺手
建议同时装 SeeSAR:在 SeeSAR 里完成受体准备后写出 .hydescorer 文件,再到命令行用 HYDE 调用;在 SeeSAR 中还能看到绿/红"光晕"形式的逐原子贡献,便于理解结果。

03 Jump Start:快速打分

最少需要:含 3D 坐标、位于蛋白口袋中的配体输入文件,加上位点定义(两种方式)。

方式 A — 蛋白 + 参考配体

hydescorer — 蛋白 + 参考配体
./hydescorer -i MyDockingResults.sdf -o MyHYDEoutput.sdf \
          -p MyProtein.pdb -r My3DReferenceLigand.sdf

方式 B — 位点定义文件

从 SeeSAR 的 Docking / Binding Site / Analyzer Mode 导出 .hydescorer 文件,内含蛋白、预定义结合位点与保守水。

hydescorer — 定义文件
./hydescorer -i MyDockingResults.sdf -o MyHYDEoutput.sdf \
          --binding-site-definition MyDefinitionFile.hydescorer

输出 .sdf 包含每个配体的 HYDE 优化姿势,以及亲和力上下界字段 ..._AFFINITY_LOWER_BOUNDARY..._AFFINITY_UPPER_BOUNDARY(单位 nM),真实亲和力预计落在两者之间。

04 程序选项

-i / --input

配体输入(.sdf .mol .mol2)。所有分子须含 3D 坐标且位于口袋内,否则无法处理。

-o / --output

输出文件(仅 .sdf),含优化并打分后的姿势及亲和力范围、质量信息。

-p / --protein

蛋白文件(.pdb .ent .cif .mcif .mmcif),须配合 -r。与 --binding-site-definition 互斥。

-r / --refligand

参考配体(含 3D),用于界定结合位点(6.5 Å 球规则,同 FlexX)。与定义文件互斥。

--binding-site-definition

从 SeeSAR 导出的 .hydescorer 文件,可含药效团约束作后过滤(只输出满足约束的结果)。与 -p/-r 互斥。

配置与开关

选项说明
--keep-input-sd-tags把输入 SD 标签带到输出姿势。
--hbond-only只做氢键网络计算与优化,做 HYDE 打分(输出无打分)。
--write-protein额外写出"配体+蛋白"复合物(.pdb/.cif),每个分子一个文件。
--write-atom-scores在输出中包含逐原子打分(字段 HYDE_ATOM_SCORES [kJ/mol])。

05 读懂 HYDE 输出

输出 .sdf 里有一组 BIOSOLVEIT.* 字段,关键几个:

SD 字段含义
..._AFFINITY_LOWER / UPPER_BOUNDARY估计结合亲和力的下界 / 上界(nM),真实值预计落在区间内。
HYDE_LIGAND_EFFICIENCY配体效率 LE。>0.513 很高,<0.205 很差。
HYDE_LIGAND_LIPOPHILIC_EFFICIENCY亲脂配体效率 LLE。>6.5 很高,<2.0 很差。
INTER_CLASH / INTRA_CLASH配体-蛋白 / 配体内部冲突评级:0 绿(无)/ 1 黄(≤2 个可容忍)/ 2 红(有严重冲突)。
TORSION_QUALITY扭转质量:0 绿 / 1 黄 / 2 红(>1 个不可容忍扭转)。
NUMBER_OF_H_BONDS配体-受体氢键数。
LOGP / TPSA / MOLECULAR_WEIGHTCrippen clogP、拓扑极性表面积(Ų)、分子量(g/mol)。
HYDE_ATOM_SCORES [kJ/mol]逐原子贡献(总贡献、受体/配体去溶剂化与相互作用),仅在 --write-atom-scores 时输出。
绿色 = 好,红色 = 注意
用 INTER/INTRA_CLASH 和 TORSION_QUALITY 这三个"红绿灯"快速筛掉几何上不合理的姿势,再看亲和力区间与 LE/LLE 排序。