SMILES

✍ dations ◷ 2025-01-22 23:49:49 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 疣微菌门疣微菌门(Verrucomicrobia)是一门被划出不久的细菌,包括少数几个被识别的种类,主要被发现于水生和土壤环境,或者人类粪便中。还有很多未被成功培养的种类是和真核宿主共生的,包括
  • 钾离子通道在细胞生物学的范畴,钾离子通道是最广泛分布的离子通道,且几乎存在大多数的生物中。 它们具有钾离子选择性的孔洞在细胞膜上,并且存在于大多数的细胞,控制了广泛的生物功能。钾
  • 飞行时差反应由于地球围绕着太阳的公转和地球的自转,使得生活在不同经纬度的人们处于不同的时区。因旅行的缘故,改变了人们所处的时区,出现时差,使身体产生了各种不适,最主要的后果是睡眠障碍
  • 活体组织切片活体组织切片(biopsy),从动物或人类身上取下少量活组织作病理学诊断的一种检查方法。活检对肿瘤的临床诊断有重要意义,不仅可以确定其组织分类,还可确定其良性或恶性,为治疗提供依
  • 不良反应药物不良反应(英语:adverse drug reaction,简称ADR)是患者在使用某种药物的治疗疾病的时候产生的与治疗无关的作用,而这种作用一般都对患者的治疗不利。不良反应是药物所具有的两
  • 覆盖噬菌体科覆盖噬菌体属 Corticovirus覆盖噬菌体科(Corticoviridae),Cortico-源自拉丁文,有厚皮之意。主要的宿主为细菌。覆盖噬菌体属(Corticovirus)代表种:
  • 另见内文貂属(学名 Martes)是食肉目鼬科动物中的一属。大部分貂属动物都居住在树上,以松鼠为食,它们的食物还包括小鸟和蛋。貂在中国主要产于东北地区,有多个品种。
  • 河川河流(江、河、江河、河道,古称水、川、河川,局地称溪、港、郭勒、沐沦、曲、藏布等)是自然汇入海洋、湖泊的流水,通常为淡水。在少数情况下,河流流入地下或者在汇入另一水体之前便
  • 信息图形信息图形(Information graphics或Infographics),是指数据、信息或知识的可视化表现形式。信息图形主要应用于必须要有一个清楚准确的解释或表达甚为复杂且大量的信息,例如在各式
  • 打喷嚏喷嚏,又称喷嚏反射,是一种人和动物的生理反射行为。反射的感受器在鼻黏膜,由三叉神经传导到脑部。打喷嚏前,鼻子变得发酸、发痒。过程一般为急促吸气,张嘴,然后高速(可达每小时50公