简化分子线性输入规范

✍ dations ◷ 2024-12-23 03:25:55 #化学命名法,化学信息学

简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。

由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。

SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。

异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。

双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯(关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。

其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。

然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 红细胞生成红细胞生成(英语:erythropoiesis)是指红细胞的生成过程。缺氧时,会促进肾脏产生促红细胞生成素。这种激素可以刺激红细胞前体细胞的增殖分化,并最终在造血组织中发育成为成熟的红
  • 语义元语义元,或称语义素,是在先天上能够直接理解而无法以更简化的用词来表述的一组语义的概念。语义元能够表述透过后天习得,但不能被具体定义的单词或短语。 例如,英语 "touch" 最直
  • 哥伦比亚号航天飞机哥伦比亚号航天飞机(STS Columbia OV-102)是美国国家航空航天局(NASA)所属的航天飞机之一。哥伦比亚号是美国的航天飞机机队中第一架正式服役的,它在1981年4月12日首次执行代号ST
  • 颚毕河鄂毕河(俄语:Обь)位于西伯利亚西部,是世界上的一条长河。鄂毕河位于西伯利亚三大河最西侧,注入北冰洋鄂毕湾,鄂毕湾也是世界最长的河口。鄂毕河在当地不同民族中有不同的名字,奥
  • 定性定性分析的主要任务是确定物质(化合物)的组分,只有确定物质的组成后,才能选择适当的分析方法进行定量分析,如果只是为了检测某种离子或元素是否存在,为分别分析;如果需要经过一系列
  • 佛教宇宙论大千世界(Tri-sahasra-mahā-sahasra-lokadhātu,直译即为三千大千世界),是佛教说明世界组织的情形。每一个小世界(lokadhātu,组成宇宙的要素;Cakravāḍa,围绕小世界的铁围),其形式
  • 花东纵谷平原花东纵谷是位于台湾东部的一个纵谷,因横跨花莲、台东两县而得名,也是上述两县的精华地带所在。有时因地理位置而另称东台纵谷,在台湾日治时期也被称为中仙道平野或中仙道。其由
  • CaMKII结构 / ECOD钙离子/钙调素依赖的蛋白激酶或钙调蛋白激酶(英文:Ca2+/calmodulin-dependent protein kinases or CaM kinases )是一种丝氨酸/苏氨酸特性的蛋白激酶,被钙/钙调蛋白复合
  • 长崎市除特别注明外,本文所有时间均以东九区时间(UTC+9)为准。长崎市原子弹爆炸是第二次世界大战末由美军对日本长崎市发起的一次核攻击,发生于日本标准时间1945年8月9日上午11时02分(U
  • 哈珀斯·费里级1~2座21管“拉姆”近程舰空导弹发射系统 2座Mk-15“密集阵”近也武器系统,2座Mk-38型25毫米舰断,8挺12.7毫米机枪. SPS-49(Ⅴ)5型对空搜索雷达,SPS-67(Ⅴ)型对海搜索雷达,URN-25型“