简化分子线性输入规范

✍ dations ◷ 2025-06-29 02:49:02 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 弗罗茨瓦夫弗罗茨瓦夫(波兰语:Wrocław;德语:Breslau,中文译为布雷斯劳、布列斯劳、洛克劳;捷克语:Vratislav;拉丁语:Wratislavia 或 Vratislavia),是波兰城市,位于波兰西南部的奥得河畔,自1999年起
  • 电影史电影史跨越了从19世纪末期至21世纪初的一百多年。电影作为一种活动影像也渐渐由聚众猎奇发展成为21世纪大众传媒、交流与娱乐的重要工具之一。电影也在艺术、科技与政治领域
  • 滴眼液眼药水是治疗眼睛疾病的药水,其成分依作用的不同有许多种类,例如类固醇、抗生素、抗组织胺药、 β阻滞剂、非类固醇消炎止痛药等。一般眼药水为了长期保存而添加了微量的防腐
  • 卵巢白膜卵巢白膜(tunica albuginea)是在卵巢表面的坚韧纤维结缔组织,位在卵巢生发上皮(英语:Germinal epithelium (female))的下方。表面是由短结缔组织细胞以及之间的梭形细胞组成。卵巢
  • 皮质下区大脑皮质(英语:cerebral cortex),又称为大脑灰质,或简称为皮质或皮层,是大脑的一个解剖结构。大脑皮层是端脑的一部分,属于脑和整个神经系统演化史上最为晚出现、功能上最为高阶的
  • 科思创科思创(德语:Covestro AG})是一家德国化学工业公司。创建于2015年9月1日,前身是拜耳材料科学事业部。后来剥离出来成为一家独立公司。 2015年10月在法兰克福证券交易所挂牌上
  • 胃痛stomach ache, tummy ache Field =腹痛又可称(abdominal pain、stomach pain、肚痛、肚子疼等)泛指腹部及其周围部分的疼痛症状,常见的病因包含肠胃炎、大肠激躁症。
  • 文明开化文明开化,是指在明治时代,西洋的文明传入至日本,引致在制度及文化上出现巨大转变的现象。近代化=西欧化,是在明治时代的一贯课题。文明开化这个词汇一般是用来指,在明治初年,世相风
  • 西哥德人西哥特人(拉丁语:Visigothi),港、台译作西哥德人,是东日耳曼部落的两个主要分支之一,另一个分支是东哥特人。在民族大迁移时期,是摧毁罗马帝国的众多蛮族中的一个。公元4世纪西哥特
  • 沈刚伯沈刚伯(1896年12月4日-1977年7月31日),中华民国历史学家。湖北宜昌三斗坪人。自幼受留日归国的父亲沈莘庵教诲,读毕《左传》、《国语》、《国策》、《国礼》、《礼记》后,于11岁,19