简化分子线性输入规范

✍ dations ◷ 2025-12-02 13:42:47 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 早年衰老症候群早年衰老症候群(Hutchinson-Gilford Progeria syndrome),简称早衰症。早衰症是一种极端罕见的先天遗传性疾病,其患者身体的老化过程十分快速。而罹患此病孩童的年龄很少超过13岁
  • 焊料焊料(英语:Solder),通常为锡的合金,故又称焊锡,为低熔点合金(英语:Fusible alloy),在焊接的过程中被用来接合金属零件, 熔点需低于被焊物的熔点。一般所称的焊料为软焊料,熔点在摄氏90~4
  • 吉姆·洛弗尔小詹姆斯·“吉姆”·阿瑟·洛弗尔(James 'Jim' Arthur Lovell, Jr.,1928年3月25日-)曾是一位美国国家航空航天局的宇航员,以作为指令长将严重受损无法登月的阿波罗13号成功带回
  • 二级相变二级相变(Second order phase transition)为化学势的二阶偏微分发生突变的一类相变。相变时没有热效应和熵变,但热膨胀系数,压缩系数,比热容这三个化学势的二阶偏微分量发生突变
  • 法国原产地命名控制原产地命名控制(缩写:AOC,法文:Appellation d'origine contrôlée)是法国的一个产品地理标志,用于标明生产、加工在同一地理区域、使用受认可技术进行的产品。原产地命名控制标志
  • 欧盟军欧盟军(英语:European Union Force,缩写:EUFOR),是欧盟基于《共同安全与防务政策》下部署的战斗部队之统称。欧盟军受欧盟联合军事参谋部(英语:European Union Military Staff)(Europe
  • 将军将军可以指:
  • 2009年迈克尔·杰克逊之死阴谋论2009年6月25日,迈克尔·杰克逊在他位于洛杉矶荷尔贝山(英语:Holmby Hills, Los Angeles)租赁的住处逝世。他的私人医生康拉德·墨瑞曾试图急救但没有成功。洛杉矶消防队(英语:Los
  • 墨西哥市墨西哥城(西班牙语:Ciudad de México 西班牙语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","C
  • 查亚普拉查亚普拉(Jayapura)是印度尼西亚巴布亚省的首府,是巴布亚省以及西巴布亚的最大城市。位于新几内亚岛北岸,2002年时约有20万人口,2010年人口普查中有256,705人口; 最新的官方估计(