SMILES

✍ dations ◷ 2025-02-23 06:50:31 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • S/TICD-10 第十九章:损伤、中毒和外因的某些其他后果,即国际疾病与相关健康问题统计分类第十版的第十九个编码分系统(从S00-T98),其中包括了损伤、中毒和某些确定外因的后果,及其分类
  • 颈动脉体颈动脉体(carotid body)是颈动脉分支附近的一个化学受器(英语:chemoreceptor)暨支持组织。颈动脉体能侦测动脉血中的气体分压,主要是血氧及二氧化碳。此外也能感测pH值及温度。颈
  • 绿非硫细菌绿弯菌门(Chloroflexi)是一类通过光合作用产生能量的细菌,又称作绿非硫细菌,尽管还有一部分称作热微菌的细菌也属于绿非硫细菌。它们具有绿色的色素,包括作为反应中心的菌绿素a和
  • 艾伯斯坦-巴尔病毒人类疱疹病毒第四型(拉丁语:Epstein-Barr virus,缩写EBV、爱泼斯坦-巴尔病毒、 human herpesvirus 4 (HHV-4)),又称为EB病毒,是最常见能引起人类疾病的病毒之一。EBV是在公元1964
  • 毒伞肽毒伞肽(Amatoxin),又称毒伞肽类毒素、毒伞毒素、瓢蕈毒素,是多种来自毒蘑菇的毒素的统称,来自鹅膏菌属(Amanita)、锥盖伞属(Conocybe)、盔孢伞属(Galerina)及环柄菇属(Lepiota)等菌类。假
  • 新美鞭菌门新美鞭菌门是厌氧性真菌的一门,发现于食草动物的消化道中。它只包括一纲、一目、一科,目前已知6属。新美鞭菌门的真菌为Orpin于1975年首次根据绵羊的瘤胃中发现的运动细胞所描
  • 自闭症光谱自闭症谱系(英语:Autism spectrum)是一种心理状况的谱系障碍,亦称自闭症谱系障碍(英语:autism spectrum disorders,简写ASD;或autism spectrum conditions,简写ASC)或泛自闭症障碍,描述
  • 茶醉茶醉也叫醉茶,指过量饮茶或饮茶太浓而引起的不适现象,尤其身体虚弱和空腹者,以及不常喝或没喝过浓茶、咖啡因含量较高的茶的人士比较容易出现。导致茶醉的物质是茶中所含之咖啡
  • 广泛性焦虑症广泛性焦虑障碍(英语:Generalized Anxiety Disorder),是经常为小事而感到持续焦虑的状态,这种焦虑与周围任何特定的情景都没有关系,而一般是由过度的担忧引起。大部分人有时会感到
  • 效能效能(英语:efficacy),又称为内在活性(英语:Intrinsic activity,缩写IA)在药理学中指药物在受体上能产生的最大反应。这和药物与受体的结合亲和性不同,也和测量效价强度的EC50不同。19