首页 >
SMILES
✍ dations ◷ 2025-11-17 22:20:58 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。
相关
- 原虫传染原虫传染是指由以前归类于原生动物界的生物引起的寄生虫病。传统上统称为“原生动物”的物种彼此之间并不密切相关,只有表面上的相似性(如都是真核生物和单细胞生物,具有移动性
- 道尔顿原子质量单位(Atomic mass unit,amu),现称统一原子质量单位(Unified atomic mass unit,u)或道尔顿(dalton,Da),是用来衡量原子质量的单位,定义为静止未键结且处于基态碳12原子质量的1/12
- 肥胖肺换气不足综合征肥胖肺换气不足综合症亦称Pickwickian综合症,包括肥胖(BMI>30 kg/m2),睡眠时低氧血症和高碳酸血症,这是由睡眠时的肺换气不足(过度的缓慢或者浅呼吸)造成的。常伴有阻塞性睡眠呼
- 免疫性免疫(英语:immunity),指生物机体识别和排除抗原物质的一种保护性反应。其中包括特异性免疫(后天免疫系统)与非特异性免疫(先天免疫系统)。“免疫”一词,最早见于中国明代医书《免疫类
- ATP三磷酸腺苷(英语:adenosine triphosphate, ATP;也称作腺苷三磷酸、腺嘌呤核苷三磷酸)在生物化学中是一种核苷酸,作为细胞内能量传递的“分子通货”,储存和传递化学能。ATP在核酸合
- 不等鞭毛类不等鞭毛总门(学名:Heterokonta)旧为不等鞭毛门,是真核生物的主要演化支之一,已知的下辖物种超过10万个物种,当中大多数属于藻类,从多细胞的大型藻类海带,到单细胞的各种浮游硅藻,这
- 真菌修复真菌修复(Mycoremediation)是一个由美国真菌学家保罗·史塔曼兹创立的新词,是生物修复的一种,意指以真菌来降解环境中的污染物。真菌可分泌酵素到环境中,将许多有机污染物分解成
- 空窗期空窗期(英语:window period)在医学检验的领域中,指的是:“从生物体受到疾病感染 那一刻开始直到医学检验可有效侦测到生物体受到疾病感染那一刻为止”中间的时期。例如:一个生物体
- 阿拉伯国家联盟阿拉伯国家联盟(阿拉伯语:جامعة الدول العربية),简称阿盟,成立于1945年,是阿拉伯国家组成的地区性国际政治组织,成员国皆位于亚洲或非洲,宗旨是加强成员国间的协
- 朝鲜在联合国安理会关于朝鲜的决议已经通过了24项。五十年代朝鲜战争期间通过了五项决议。1991年关于朝鲜加入联合国的决议后。作为联合国会员国,安理会至今通过了关于朝鲜的导弹
