01 它能做什么
- 为输入分子快速生成单个 3D 构象(常用于给对接/叠合准备 3D 坐标)。
- 生成多构象集合。
限制
目前不支持为含超过 9 个原子的环(大环,macrocycle)的分子生成构象。
02 前提与授权
需要 Conformator 程序包、命令行环境与有效许可证。SeeSAR 许可证也会被接受。测试许可证直接放在 conformator 旁。
./conformator --license-info
03 Jump Start
从文件生成 3D 构象,最典型的一条命令:
./conformator -i my_2D_molecules.sdf -o my_3D_molecules.sdf
输入可以是 SD / SMILES 文件(.smi/.smiles,逐行 SMILES)/ MOL / MOL2,也可以直接是一个用引号括起的 SMILES 串:
./conformator -i "CC(C)C(=O)N" -o isobutyramide.sdf
默认每个分子生成 1 个构象。要生成集合,用 --max-nof-conf 指定数量:
./conformator -i "CC(C)C(=O)N" -o isobutyramide.sdf --max-nof-conf 20
04 所有选项
-i / --input 必填
输入分子文件或单个 SMILES 串。支持 .smi .smiles .mol2 .mol .sdf。
-o / --output 必填
输出文件,支持 .sdf 与 .mol2。
配置选项
| 选项 | 默认 | 说明 |
|---|---|---|
--max-nof-conf | 1 | 每个分子生成的最大构象数。 |
--keep-input-sd-tags | — | 把输入 SD 标签带到每个构象(需 SD 输入与 SD 输出)。 |
--rmsd-ensemble | — | 计算集合内构象间的最小对称校正重原子 RMSD。仅当 --max-nof-conf > 1 时可用,隐含开启日志。 |
--rmsd-input | — | 计算最接近输入构象的成员的 RMSD(输入需有 3D 坐标),隐含开启日志。 |
--write-log-file | — | 写出 CSV 日志(与输出同名、扩展名 .log),含每分子构象数、立体化学、状态等。 |
05 读懂日志文件
--write-log-file 生成的 CSV 含这些列:
| 列 | 含义 |
|---|---|
Entry / Molecule | 分子在输入中的序号(从 1 起)/ 分子名。 |
NofConfs | 实际生成的构象数。 |
Stereo | 立体化学:NONE 无手性 / INPUT 与输入一致 / PURE 输入未完全定义但所有构象立体化学一致。 |
RMSD_Input | 最接近输入构象的成员 RMSD(需 --rmsd-input;无 3D 输入时为 inf)。 |
RMSD_Ensemble | 集合内两构象间最小 RMSD(需 --rmsd-ensemble)。 |
Status | OK 成功 / WARNING 可旋转键过多、部分采样、可能未覆盖完整构象空间 / ERROR 坐标生成出错、无构象。 |
./conformator -i my_molecules.smi -o my_conformers.sdf \ --max-nof-conf 50 --rmsd-ensemble --write-log-file