简化分子线性输入规范

✍ dations ◷ 2025-04-09 01:39:56 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 法兰克福大学歌德 - 美茵河畔法兰克福大学(德语:Goethe-Universität Frankfurt am Main),德文简称为“法兰克福大学”(Uni Frankfurt)或“歌德大学”(Goethe Uni)﹔据此,中文亦有称作“歌大”或“
  • 科赫尔埃米尔·特奥多尔·科赫尔 (Emil Theodor Kocher,1841年8月25日-1917年7月27日)出生于伯恩,是一位瑞士科学家。曾在苏黎世、柏林、伦敦与维也纳接受教育或进行研究,在1865年得到博
  • 颚部颚(英语:Jaw),在解剖学中,指在嘴部入口处相对的铰接式结构,最常见的用途是用来进食与咀嚼食物。在大多数的动物身上,都拥有这个解剖结构。在人体解剖学中,又称颌,指嘴部的上下骨骼与
  • 洪泛平原河漫滩,又称泛滥平原或洪泛平原,通常位于河流中下游,指由于河流堆积作用而形成的大片堆积体,是河流堆积地貌的一种。常在在枯水季节露出水面,在丰水季节又常被淹没。河漫滩一旦形
  • 无性细胞瘤无性细胞瘤(英语:Dysgerminomas)是一类生殖细胞瘤,通常是恶性肿瘤,并常病发于卵巢。无性细胞瘤占卵巢肿瘤的不到1%,它常病发于童年或早期成人阶段,大概5%的患者病发于青春期以前,很
  • 复兴广播电台复兴广播电台是一家隶属于中华民国国防部政治作战局政治作战总队的国营广播电台,简称复兴电台、FHBS。复兴广播电台于民国46年(1957年)8月1日开播(开幕典礼由影星穆虹剪彩,中央通
  • 厄尔·沃伦厄尔·沃伦(英语:Earl Warren,1891年3月19日-1974年7月9日),美国著名政治家、法学家,第14任美国首席大法官(1953年-1969年)、第30任美国加利福尼亚州州长(1943年-1953年)。他也是沃伦委
  • 烽火烽火,又称烽燧、狼烟、狼燧,是一种用于示警的讯号。白天以燃烧掺有粪便的柴草,释放浓烟来表达讯息,此称为“燧”。夜里则燃烧加有硫磺和硝石的干柴,使火光通明,以传递紧急军情,此称
  • 迪士尼电台迪士尼电台(英语:Radio Disney),也被称为“迪士尼广播网”(Radio Disney Networks), 其公司主体名为“迪士尼电台公司”(Radio Disney, Inc.), 是美国的一个广播联播网,隶属于迪士尼ABC
  • 夫余扶余可以指: