SMILES

✍ dations ◷ 2025-08-07 06:32:37 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。

相关

  • 原虫传染原虫传染是指由以前归类于原生动物界的生物引起的寄生虫病。传统上统称为“原生动物”的物种彼此之间并不密切相关,只有表面上的相似性(如都是真核生物和单细胞生物,具有移动性
  • 神经眼科学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学神经眼科学(英语:Neuro-ophthalmology)
  • 法国– æ¬§æ´²ï¼ˆç»¿è‰²åŠæ·±ç°è‰²ï¼‰â€“ æ¬§ç›Ÿï¼ˆç»¿è‰²ï¼‰æ³•兰西共和国(法è¯
  • 外耳炎外耳炎(Otitis externa)是耳道的炎症,常见的症状有耳部疼痛(英语:ear pain)、耳道肿胀,偶尔也会有听力减退的情形。若动到外耳(英语:outer ear),多半会感觉疼痛。一般来说外耳炎不太会
  • D06BB(Antifungals for dermatological use)(Emollients and protectives)(Preparations for treatment of wounds and ulcers)(Antipruritics, including antihistamines, anesthetics,
  • V03A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码V03(其它各种治疗用药品)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO
  • 皮胆虫门皮胆虫(学名:Picozoa,Picobiliphytes或Picobiliphyta)是一类水生单细胞异养真核生物,尺寸小于约3微米。第一种被明确归为此类的生物是Picomonas judraskeda。 他们可能属于原始色
  • FMA解剖学基础模型,又称解剖学基础模型本体(Foundational Model of Anatomy Ontology, FMA),是解剖学领域的一部参考本体。它是对生物体典型的表现型结构的符号表达形式;FMA是一部由
  • 尺骨尺骨(拉丁语:Ulna)是位在人体上肢中前臂内侧的骨头,即在尾指侧的骨,在桡骨之旁。在靠近上臂处有一半月形的关节面,称为滑车切迹,与肱骨滑车共同形成关节。切迹上方有两个突起,分别称
  • 在各种酸碱理论中,碱都是指与酸相对的一类物质。碱多指碱金属及碱土金属的氢氧化物,而对碱最常见的定义是根据阿伦尼乌斯(Arrhenius)提出的酸碱离子理论作出的定义:碱是一种在水