首页 >
SMILES
✍ dations ◷ 2025-04-03 16:24:30 #SMILES
简化分子线性输入规范(英语:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.),修改和扩展。由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。典范SMILES保证每个化学分子只有一个SMILES表达式。典范SMILES常用于分子数据库的索引。异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显著特征是可以精确地说明局部手性。双键两侧的结构分别用符号/和表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。而F/C=CF表示顺二氟乙烯(),它的两个氟原子位于双键的同一侧。手性碳原子的情况用 @ 或 @@ 标明。例如,L-丙氨酸表示为 N(C)C(=O)O,标示符 @@ 表明,从氮原子 (N) 处沿着连接氮原子和手性中心的碳原子的键看去, 取代基序列——氢原子 (H), 甲基 (C) 和羧基 (C(=O)O) ——按顺时针出现。 D-丙氨酸则表示为 N(C)C(=O)O, @ 即意为逆时针。取代基列出的顺序在这种情况下显得非常重要,D-丙氨酸还可以表示为 N(C(=O)O)C。表示同位素时将质量数写在元素符号前面。如氘代氯仿为 C(Cl)(Cl)Cl ,苯中一个碳原子是碳-14时表示为 1ccccc1。SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。USMILES(有时成为广义SMILES),这种“Unique SMILES”是日光化学信息系统有限公司关于结构的规范表达。就是说不管内部原子的编码顺序如何,通过这种算法总可以得到关于化合物规范的、无歧义的、唯一的描述(化学结构表达的唯一性,可参见国际化合物标识)。其他著名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与应用化学联合会推荐国际化合物标识作为标准的分子式表达式。然而普遍认为,SMILES与InChI相比更具有(对人来说的)可读性;而且很多软件都支持SMILES,其中不少软件都具有图论等方面的理论基础。
相关
- 艾滋病毒人类免疫缺陷病毒(英语:human immunodeficiency virus,簡稱HIV,又称艾滋病毒)是一种感染人类免疫系统细胞的慢病毒,属逆转录病毒的一种。普遍认为,人类免疫缺陷病毒的感染导致艾滋
- 人口密度人口密度(英语:Population density)是指在一定时期一定单位面积土地上的平均人口数目,计算方式是其总人口数除以总面积。一般使用的单位是每平方公里人数或每平方米所居住的人口
- 胰岛胰岛(兰格尔翰斯岛,德语: Langerhans-Inseln 英语: Islets of Langerhans)在1869年由德国病理学家保罗·兰格尔翰斯(Paul Langerhans)所发现。胰岛是胰脏里的岛状细胞团,由一群分
- 肥大细胞肥大细胞(mast cell),发育源于骨髓CD34+前体细胞,是连接神经系统和免疫系统的桥梁,因为靠近周围神经末梢而很早就可以感受神经纤维的活动。肥大细胞激活后,可以释放炎症因子并募集
- 变形虫变形虫,拉丁文为Amoeba,中文音译为阿米巴,所以也叫做阿米巴原虫、阿米巴变形虫或阿米巴虫或称食脑虫(透过感染鼻腔而进入脑部感染的死亡率高达九成)。是一种单细胞原生动物,仅由一
- 帕金森帕金森综合征(Parkinsonism)是和运动机能相关的临床综合征,其特征是颤抖、运动功能减退、僵硬(英语:Rigidity (neurology))及平衡障碍(英语:balance disorder)。在帕金森病(PD)患者身上
- 阳极阳极(英语:Anode)是发生氧化反应的电极。相对的,阴极(英语:Cathode)是发生还原反应的电极。英文anode和cathode是法拉第发明的词,anode表示“发生氧化反应的电极”(或者失去电子的电
- 幻觉幻觉(英语:Hallucination)是指在没有客观刺激作用于相应感官的条件下,而感觉到的一种真实的、生动的知觉。相对的,错觉则是具有真正的外在刺激,但反应错误的认知。幻觉是知觉障碍
- 神经毒性神经毒素是以神经系统为靶系统的毒性物质,其主要特征是干扰神经系统功能,产生相应的中毒体征和症状,严重时可致命。神经性毒剂一般指人工合成的神经毒物,大多数为有机磷化合物,与
- 男性生殖系统男性生殖系统是由男性许多生殖器官或组织组成,和人类繁殖有关的系统。有些在体外,有些则在骨盆腔内。男性主要的性器官是制造精子的睾丸,以及分泌精液的阴茎,在和女性性交,精子可