简化分子线性输入规范

✍ dations ◷ 2025-08-10 18:58:26 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 解码编码是信息从一种形式或格式转换为另一种形式的过程;解码则是编码的逆过程。对于特定的上下文,编码有一些更具体的意义。
  • 汉越音陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧  小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧  书法 ‧ 飞白书笔画 ‧ 
  • 平民平民是古罗马时代罗马公民(不同于奴隶)中最大的群体。他们不同于更高阶层的贵族,在政治和经济上缺少权力。对他们适用的法律为《万民法》。并非所有平民都有土地。随着历史的发
  • 卢森堡宫卢森堡宫 (法语:Palais du Luxembourg,发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000",
  • 殷鸿福殷鸿福(1935年3月19日-),中国地质古生物学家。1956年毕业于北京地质学院地质勘探系煤田地质专业,1961年在北京地质学院地层古生物学专业研究生毕业后一直留校任教。曾在美国自然
  • 环丙酮环丙酮(化学式:C3H4O)是环丙烷的氧代衍生物。其熔点为-90°C,很不稳定,可通过乙烯酮与重氮甲烷在-145°C时反应制备。 由于母体化合物不甚稳定,合成中使用环丙酮的缩酮 代替环丙酮
  • 中国共产党新闻网中国共产党新闻网,2006年7月1日上线的一家致力于宣传和介绍中国共产党的新闻网站,由人民日报社和人民网主办,除中文简体、繁体外,还开设了蒙文、藏文、维吾尔文、哈萨克文、朝鲜
  • 量子线路量子线路或沿用古典称呼而称作量子电路,是在抽象概念下,对于量子资讯储存单元(例如量子比特)进行操作的线路。组成包括了于量子资讯储存单元、线路(时间线),以及各种逻辑门;最后常需
  • 提乌德贝尔特一世提乌德贝尔特一世(法语:Thibert or Théodebert,500年-547或548年),从533年直到548年死亡是墨洛温王朝的奥斯特拉西亚国王。他是提乌德里克一世的儿子和图德巴得的父亲。提乌德贝
  • 云南菜云南菜简称滇菜,为发源于云南的地方菜,以烹制水鲜、山珍见长。其口味偏鲜糯酥脆、醇厚重油、酸辣微麻、清香回甜。烹饪技法上除了炖、卤、汆、炸、蒸、熘之外,还有隔器盐焗、焐