SMILES

✍ dations ◷ 2025-10-28 12:37:19 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • NCBI国家生物技术信息中心(National Center for Biotechnology Information,简称NCBI)是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分)。NCBI位于美国马里兰
  • 遗传漂变遗传漂变,或基因漂变(genetic drift),是指种群中基因库在代际发生随机改变的一种现象。由于任何一个个体的生存与繁殖都受到随机因素影响,繁殖过程可看做一种抽样,子代携带的等位
  • 纵膈纵膈(mediastinum)是描述胸腔中心为疏松结缔组织所包围的构造,并无一个明显的界限。本区域包含许多解剖构造,包含心脏及其周围血管系统、食道、气管、膈神经(英语:phrenic nerve)、
  • 死刑案陪审团死刑案陪审团(英语:Death-qualified jury)是指在美国可以判处死刑的刑事案件中的陪审团。上述的陪审团,其陪审员须具备下列资格:建立这种陪审团时,在“预备询问(英语:voir dire)”期
  • 前列腺增生良性前列腺增生症(英语:Benign Prostatic Hyperplasia,缩写BPH),俗称前列腺肥大症或前列腺肥大,以前列腺中叶增生为实质改变而引起的一组综合征,良性前列腺增生症是属于男性常见的
  • 坏死性筋膜炎坏死性筋膜炎(英文:Necrotizing fasciitis)又称食肉菌感染或噬肉菌感染,是身体内软组织坏死导致的感染疾病,是会突然发病并且快速散播的严重疾病,症状包含在感染部位皮肤呈现红色
  • 微升微升(microlitre)是容量计量单位,符号为μL,相近于体积单位λ(lambda,10−9 m3),自升而来。微升本身不是国际单位制单位,而是接受与SI合并使用的非SI单位。在生化单位及药物使用上,因
  • 第三党议长:南希·裴洛西(民主党) 多数党领袖(英语:Party leaders of the United States House of Representatives):斯坦利·霍耶(民主党) 少数党领袖(英语:Party leaders of the United Sta
  • 人均国民生产总值国民生产总值(英语:Gross National Product,缩写:GNP),台湾亦称国民生产毛额,在描述地区性生产时称本地居民生产总值或地区居民生产总值,即某一区域公民一年内所生产的最终产品(包括
  • 基因改造基因工程(英语:genetic engineering,又称为遗传工程、转基因、基因修饰)是一种使用生物技术直接操纵有机体基因组、用于改变细胞的遗传物质的技术。包括了同一物种和跨物种的基