文档库

最新最全的文档下载
当前位置:文档库 > 红外谱图中特征峰与对应子结构相互关系的确定

红外谱图中特征峰与对应子结构相互关系的确定

红外谱图中特征峰与对应子结构相互关系的确定

红外谱图中特征峰与对应子结构相互关系的确定

陈海峰 罗时玮 姚建华 袁身刚 郑崇直

(中国科学院上海有机化学研究所,中国科学院计算机化学开放实验室 上海 200032)

范波涛 A 1PANA YE J 1P 1DOUCET

(法国巴黎第七大学,拓扑及系统动力学研究所 法国巴黎 75005)

摘要:采用子结构检索、公共子结构寻找和相似指数计算的方法研究了红外特征峰与对应子结构的相互关系。说明对大量谱图信息进行统计分析确定基团的特征峰,是一种行之有效的方法。

关键词 子结构检索,公共子结构,特征峰

中图分类号:O 561,1,O 6-39

Establishment of Correspondence bet w een Characteristic Peak

and its Substructure in IR Spectra

CHE N Hai 2Feng LUO Shi 2Wei Y AO Jian 2Hua Y UAN Shen 2Gang ZHE NG Chong 2Zhi

(L aboratory of Com puter Chemist ry ,Chi nese Academy of Sciences ,S hanghai Instit ute of Organic Chemist ry ,

Chi nese Academy of Sciences ,Shanghai 200032)

FAN Bo 2Tao Annick PANAYE J ean 2Piem DOUCET

(I TOD YS U niversit éde Paris V II ,Paris ,France 75005)

Abstract :This paper introduces a method which determinate the characteristic peak of IR through substructure searching ,common substructure spreading ,similarity index calculating.It is effective and useful method to determinate characteristic peak of IR by statistic large spectrum information.K ey w ords Substructure searching ,Common Substructure ,Characteristic peak

国家计委“九五”攻关项目(96-547-01)、国家自然科学基金(29872048)和中法先进研究计划(PRA96-6)资助项目

1 前言

红外光谱、核磁共振光谱、质谱可以帮助人们进行化学结构解析,根据化学结构与谱图的相关性,如果知道某一化合物的结构,应该能够通过计算机辅助技术获取它的谱图,而不需通过实际样品的测定。在本质上化合物的结构决定了图谱的峰位、峰强。从而出现了一系列的谱图预测软件,帮助化学工作者预测核磁共振谱、质谱等。由于红外光谱是连续的曲线谱,数字化处理非常麻烦,而且吸收十分复杂,特别是一些基团没有明显的特征峰,这给红外谱图的计算机模拟带来了很大的困难。我们提出了一种确定基团特征峰的方法,通过对包含该基团的大量谱图信息进行统计分析,从而确定该基团的特征红外峰。2 方法

首先在谱图数据库中对某一感兴趣的基团或结构片段进行子结构检索[1],找出库中所有包含该基团或结构的分子,然后对这些分子进行公共子结构寻找,在此基础上计算这些分子与提问结构的相似性指数,删除相似性差别较大的结构,并且按照相似性指数的大小进行排序。从剩下的结构中抽取红外谱图信息,如果大多数结构都在某一位置附近(允许20cm -1左右的偏差)出现一个红外吸收峰,而且这些分子中又不包含提问结构之外的公共子结构,则可以认为这个吸收峰就是该基团的特征吸收峰。如果存在,则判断特征峰库中是否有该子结构的特征峰信息来进行取舍。

3 主要算法

311 子结构检索

子结构检索中最费时的一步是子图的同构识别,由于属NP 完备性问题,必须通过穷尽匹配才能获得第17卷 第2期2000年3月28日计算机与应用化学

Computers and Applied Chemsitry Vol 117,No 12March ,2000

481计算机与应用化学17卷

准确结果,我们采用了较高效率的Ullmann算法。首先通过提问结构和库中结构中所含碎片筛的比较比较快的排除大量的不可能为命中结构的库中结构,然后用Ullmann算法作原子-原子精确匹配确定候选结构中是否包含提问子结构。如果成功,表明该候选结构是满足条件的命中结构,否则匹配失败。

312 公共子结构寻找

公共子结构操作的目的是要通过对子结构检索得到的包含了某一特定结构片断的所有分子的比较,获取它们共同具有的子结构,其数目可能不止一个,因而不同于最大公共子结构检索。借鉴各种不同的最大公共子结构算法,我们提出了一个基于宽度优先搜索的逐层扩展算法,来获取两个结构所共同具有的子结构集。该算法的基本思想是,当两个结构有公共的子结构存在时,必定在各自的结构中至少存在着一个对应点,当从该对应点各自按宽度优先来逐层扩展时,则按正确扩展方式扩展得到的等同块必定是最大的一个块,该块即为两个结构的一个公共子结构。

313 相似性指数的确定

结构上相似的化学体系具有相似的性质[2],根据这一原理相似的结构应该具有相似的谱图。根据这一工作的需要,我们定义了一种与结构相关的相似性指数。一个分子,本质上是由原子的数目、原子的种类、化学键的类型、连接度等信息决定的,这些信息在一定程度上可以描述一个分子的二维结构,分子的拓扑距离等只有对分子的三维结构才具有实际的意义。

4 结论

通过对大量谱图信息进行统计分析确定基团的特征峰,是一种行之有效的方法,可以解决红外谱图的计算机模拟中某些基团没有特征峰的困难。但是这种方法是基于对大量的红外谱图信息的统计结果,因此这种方法对未知化合物(或谱)的分析结果有时会有一定偏差,但用于文献没有报道特征峰的基团的特征峰的确定仍不失为一种对检索方法的有效补充。当某一基团的特征红外峰确定之后,再补充进数据库,下次遇到相同的基团就直接从数据库提取它的特征峰。

参考文献

1 姚建华,袁身刚,陈海峰,郑崇直,杨铄.三维分子结构检索系统的结构索引与匹配,计算机与应用化学,1999,16(2)

2 Johnson M A,Maggiora G M.Concepts and Applications of Molecular Similarity.Eds John Wiley,New Y ork,1990

红外谱图中特征峰与对应子结构相互关系的确定