biosolveit::cli
组件 05 · 构象生成 Conformers · v2.5

Conformator — 3D 构象集合生成

Conformator 从输入分子生成单个 3D 构象或构象集合(ensemble)。它是一个基于知识的方法:先按 VSEPR 模型给无环键赋予理想键长键角、为非大环环生成坐标,再离散地调整无环键扭转角(选用偏好扭转角并最小化分子内冲突)。若请求多个构象,会进一步采样并用基于 RMSD 的自适应球排除聚类算法,产出多样化的构象集合。

可执行文件
conformator
输入
.smi .sdf .mol .mol2 或 SMILES 串
输出
.sdf .mol2
默认构象数
1

01 它能做什么

  • 为输入分子快速生成单个 3D 构象(常用于给对接/叠合准备 3D 坐标)。
  • 生成多构象集合
限制
目前不支持为含超过 9 个原子的环(大环,macrocycle)的分子生成构象。
在工作流中的位置
FlexXFlexS 都要求输入含 3D 坐标。对大于 5 万分子的库,官方推荐用 Conformator 来批量生成 3D。

02 前提与授权

需要 Conformator 程序包、命令行环境与有效许可证。SeeSAR 许可证也会被接受。测试许可证直接放在 conformator 旁。

检查 license
./conformator --license-info

03 Jump Start

从文件生成 3D 构象,最典型的一条命令:

conformator — 从 2D 文件生成 3D
./conformator -i my_2D_molecules.sdf -o my_3D_molecules.sdf

输入可以是 SD / SMILES 文件(.smi/.smiles,逐行 SMILES)/ MOL / MOL2,也可以直接是一个用引号括起的 SMILES 串:

直接用 SMILES 串
./conformator -i "CC(C)C(=O)N" -o isobutyramide.sdf

默认每个分子生成 1 个构象。要生成集合,用 --max-nof-conf 指定数量:

生成 20 个构象的集合
./conformator -i "CC(C)C(=O)N" -o isobutyramide.sdf --max-nof-conf 20

04 所有选项

-i / --input 必填

输入分子文件或单个 SMILES 串。支持 .smi .smiles .mol2 .mol .sdf

-o / --output 必填

输出文件,支持 .sdf.mol2

配置选项

选项默认说明
--max-nof-conf1每个分子生成的最大构象数。
--keep-input-sd-tags把输入 SD 标签带到每个构象(需 SD 输入与 SD 输出)。
--rmsd-ensemble计算集合内构象间的最小对称校正重原子 RMSD。仅当 --max-nof-conf > 1 时可用,隐含开启日志。
--rmsd-input计算最接近输入构象的成员的 RMSD(输入需有 3D 坐标),隐含开启日志。
--write-log-file写出 CSV 日志(与输出同名、扩展名 .log),含每分子构象数、立体化学、状态等。

05 读懂日志文件

--write-log-file 生成的 CSV 含这些列:

含义
Entry / Molecule分子在输入中的序号(从 1 起)/ 分子名。
NofConfs实际生成的构象数。
Stereo立体化学:NONE 无手性 / INPUT 与输入一致 / PURE 输入未完全定义但所有构象立体化学一致。
RMSD_Input最接近输入构象的成员 RMSD(需 --rmsd-input;无 3D 输入时为 inf)。
RMSD_Ensemble集合内两构象间最小 RMSD(需 --rmsd-ensemble)。
StatusOK 成功 / WARNING 可旋转键过多、部分采样、可能未覆盖完整构象空间 / ERROR 坐标生成出错、无构象。
建库 + 集合 RMSD + 日志
./conformator -i my_molecules.smi -o my_conformers.sdf \
             --max-nof-conf 50 --rmsd-ensemble --write-log-file