简化分子线性输入规范

✍ dations ◷ 2025-11-12 08:16:45 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 双球菌双球菌(拉丁语:diplococcus,复数diplococci)是球菌的一类,其细胞沿一平面分裂,而子细胞成双排列。代表种类有脑膜炎双球菌(Neisseria meningitidis)、淋球菌(Neisseria gonorrhoeae)等
  • 植物病理学植物病理学,是对于引起植物疾病的病原体(感染性微生物)和环境条件(生理因素)的科学研究 。引起感染性疾病的生物体包括真菌,卵菌,细菌,病毒,类病毒,病毒样生物,植原体,原生动物,线虫和寄
  • 鼻烟鼻烟(英语:Snuff),一种无烟烟草制品。把烟草研磨成极细的粉末,以嗅闻的方式吸取进入鼻腔,经由鼻腔吸收其中的尼古丁成分。其中可以加入麝香等药材,或用花卉等提炼。烟味分五种:膻、
  • 全内反射荧光显微镜(TIRF)全内反射荧光显微镜(total internal reflection fluorescent microscope,TIRFM),利用光线全反射后在介质另一面产生衰逝波的特性,激发荧光分子以观察荧光标定样品的极薄区域,观测
  • 三观三观可以指:
  • 数据迁移数据迁移(英语:data migration)是指选择、准备、提取和转换数据,并将数据从一个计算机存储系统永久地传输到另一个计算机存储系统的过程。此外,验证迁移数据的完整性和退役原来旧
  • 前列腺按出液前列腺按出液是前列腺肛门指检时取得的液体。肛门指检时,当检查者食指完全伸入患者肛门,前列腺即在食指指腹下;透过直肠前壁,扪及前列腺后叶;在此位置做前列腺按摩,按出前列腺液的
  • 西西里岛战役英国和加拿大:2,721人阵亡7,939人负伤2,183人失踪法西斯意大利:4,678人阵亡32,500人负伤152,933人失踪/被俘加拿大军事行动盟军入侵西西里开始于1943年7月9日晚上,而盟军获胜于
  • 萧邦国际钢琴比赛肖邦国际钢琴比赛(波兰语:Międzynarodowy Konkurs Pianistyczny im. Fryderyka Chopina)是五年一度的国际钢琴比赛,1927年由波兰钢琴家茹拉夫莱夫(英语:Jerzy Żurawlew)创办,于著
  • 梅萨维德梅萨维德国家公园,也称弗德台地国家公园,位于美国科罗拉多州蒙提祖马县,紧挨四角落,是美国一处国家公园,于1978年被列入联合国教科文组织世界遗产名录。公园占地约211km²,以古普