简化分子线性输入规范

✍ dations ◷ 2025-10-23 02:15:01 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 肉食性肉食性动物是指主要吃肉类的动物,跟草食性动物相较下肉食性动物有较好的立体视觉,其双眼多集中向前。肉食动物也可以吃腐肉或吸血。哺乳纲食肉目的动物大都是肉食性动物,但也有
  • 克尔切伊·费伦茨克尔切伊·费伦茨(匈牙利语:Kölcsey Ferenc,1790年8月8日-1838年8月24日),匈牙利诗人、评论家、演说家,匈牙利国歌《天佑匈牙利人》的作词人。
  • 夫婿丈夫,是男女婚姻中对男性的称谓,与妻子相对应。古代妻子对自己配偶又称夫婿、夫君、相公、官人,闽南语则称翁婿(闽南语读“ㄤ”(ang /ɑŋ/),字用“翁”)、头家、夫婿。外子则是妻
  • 滑动关节滑动关节,又称平面关节(Plane joint),是使骨块左右滑动的关节。在此种关节中,骨的表面实际上是平的,两骨块间彼此滑过而产生动作,可进行多方向的相对移动。滑动关节见于手的腕骨之
  • 阿联酋电信阿联酋电信公司(英语:Emirates Telecommunications Corporation),品牌名称Etisalat(阿拉伯语:اتصالات‎ ittiṣālāt,字面含义为“通信”),是一家阿拉伯联合酋长国电信服务提
  • 男性避孕男性避孕是指由男性进行的生育控制方式。主要的男性避孕方式有避孕套、性交中断法、非插入式性行为及输精管切除术。还有其他男性避孕的方式,不过仍在不同的研究开发阶段中,尚
  • 美国红杉加州红木(学名:Sequoia sempervirens),又称海岸红杉、红杉、北美红杉、美国红杉、长叶世界爷、咖斗,是世界上最高的针叶树(位于第二高花旗松的变种海滨黄杉以及第三高的北美云杉之
  • span class=nowrapAgsub3/subPOsub4/sub/span&g磷酸银,或正磷酸银,原磷酸银,是对光敏感的,黄色的,不溶于水的化合物,由银和磷酸根离子组成,化学式为Ag3PO4或Ag3O4P磷酸银作为一种黄色沉淀,可由可溶性银化合物(如硝酸银)与可溶性磷酸
  • 狭叶栎狭叶栎(学名:Quercus stenophylloides),又名狭叶椆、狭叶高山栎、台湾窄叶青冈,台湾特有种,为壳斗科栎属,常绿阔叶树。本种与白背栎(Quercus salicina)型态十分相近,对于两物种是否应
  • 西密歇根大学西密歇根大学(Western Michigan University,缩写:WMU)是美国的一所公立研究型大学,位于密歇根州卡拉马祖市,是一所州立大学。西密歇根大学由密歇根州州长阿伦·T·比利斯于1903年