1.1 原子型电拓扑态指数 ( En )的构建
分子拓扑指数其实是对分子结构的数值化表征,它来源于分子隐氢图的各种数学矩阵,比如距离矩阵和邻接矩阵等等,在经过一定的矩阵运算后便可以衍生出分子结构的描述符,这就是拓扑指数,以揭示分子结构某种化学特征。
因为Kier和Hall建立的原子类电拓扑态指数 (E-state indices,En)属于原子类型的一类,En反映的是化合物分子内各种非氢原子(n)的化学结构描述符,因此,En属于原子水平上的一类拓扑指数。En可以分成两个组成部分,第一组成部分为非氢原子(n)自身的原子结构和其周围局部化学环境,由此形成了非氢原子n的自有结构值(即特征值),常常以 “In”表示;第二组成部分反映了非氢原子n在分子中受其他杂原子扰动而引起的结构值增加的量(ΔIn)[11] 。定义化合物分子中杂原子n的特征值(In)为:
In = (1)
上式中的Nn 表示化合物分子中非氢原子n的电子层的数目; = , 、 表示化合物分子中原子n 的支化度、 键的数目,h n表示和原子n直接相连接的氢原子数。
1995年Hall等人对 修正以后的定义式:
(2)
(2)式当中的 、 分别表示化合物分子中原子n和杂原子成键时的 键电子数、未成键的孤对电子数。一般来说,原子类型在有机化合物分子中不止一种。因此,Kier等人把不同原子划分成79 种类型,还用不同的符号来表示。比如:“d”为一个双键、“s”为一个单键、“t”为一个叁键、“a”为芳香环中的一个键。
分子中的各个原子之间是有相互作用的,从而改变分子中原子n的电性,也就是扰动量“ΔIn”。 分子中原子n与原子j之间的本征值差值越大,则说明两个原子之间的距离越短,原子n受到原子j的作用(ΔIn)也就越大[11]。定义ΔIn为:
(3)
公式(3)中的r n j表示原子n和j之间最短的键数加1 ,即r n j d n j + 1。“Σ” 表示对其他非氢原子j的求和。ΔIn有拓扑和电性两种因素组成。
定义原子n电拓扑态指数En为:
公式(4)中的t表示分子中原子n的数目,可以是1~t。
1.2 方法
多元线性回归方法(MLR)是一种常用的建模方法,其原理是对自变量与因变量进行线性化拟合,源)自(优尔+文=论]文]网[www.youerw.com,进而所得的最小二乘条件下的最佳结果。将自变量设为每一个四氢-咪唑-苯二氮酮类药物分子的46个原子型电拓扑状指数 ( En ),相应的因变量则为四氢-咪唑-苯二氮酮类药物分子的log(1/EC50),由此构建一个数据集合,把它们一起输入Mintab14。首先采用最佳变量子集回归(LBR)方法对变量进行压缩,再此基础上,组合最佳变量,建立数学模型,并进行相关检验。