首页 >
SMILES
✍ dations ◷ 2025-08-28 03:05:27 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。
相关
- 糖化血红蛋白糖化血红蛋白(又称糖化血红素, 缩写作hemoglobin A1c, HbA1c, A1C, Hb1c; 有时缩写为 HbA1c)是血液红细胞中的血红蛋白与葡萄糖结合的产物,通常作为一段时间内平均血浆葡萄糖浓
- 惊厥惊厥(英语:Convulsion),亦称惊风,在医学上指肌肉突然紧张、松弛而导致身体失控颤抖的状况。因为症状与癫痫发作相似而被混淆,但并不是所有的癫痫发作都会导致惊厥。和西医所指的广
- 消毒消毒(Disinfection)是利用化学品或其他方法消灭大部分微生物,使常见的致病细菌数目减少到安全的水平。然而,与杀菌(Sterilization)相比,部分细菌孢子、滤过性病毒、结核杆菌及真菌
- 非维管植物维管植物 Tracheophyta非维管植物(或作非维管束植物)是对没有维管(木质部和韧皮部)的植物(包括绿藻)的总称。虽然非维管植物缺乏此类特殊的组织,但一部分的非维管植物会有特化来在
- 淋巴腺淋巴结(lymph node)是淋巴系统的一部分(以往亦称做淋巴腺,但其并没有分泌物质的功能,故称为“腺”并不对),作用类似过滤器,内部蜂窝状的结构聚集了淋巴球,能够将病毒与细菌摧毁,当身体
- 撒哈拉撒哈拉沙漠(阿拉伯语:الصحراء الكبرى,aṣ-Ṣaḥrāʾ al-Kubrā ,“大沙漠”)是世界最热的荒漠,亦是世界第三大荒漠,仅次于南极和北极,同时也是世界上最大的沙漠,其
- 全民健康保险全民健康保险,一般简称为“全民健保”或“健保”,是一种强制性保险的福利政策,法源是依据《中华民国宪法增修条文》所实施的全民医疗保险制度。为增进全体国民健康,中华民国于19
- 联合国教育、科学及文化组织联合国教育、科学与文化组织(法语:Organisation des Nations unies pour l'éducation, la science et la culture,缩写作 ONUÉSC ; 英语:United Nations Educational, Scient
- 再处理核燃料后处理技术原指用化学分离和纯化的方法从经过辐照的核燃料中分离可裂变的钚同位素。 但现代核燃料后处理已不仅仅着重于回收钚,还可以分离其它有用的元素,比如铀、甚至
- 健康传播健康传播是传播学的一个分支。美国学者Rogers,Everett M.在1994年提出一种界定,认为健康传播是一种将医学研究成果转化为大众的健康知识,并通过态度和行为的改变,以降低疾病的患