3。2 复共线性是由数据问题引起的来*自-优=尔,论:文+网www.youerw.com
这是指即使总体诸解释变量没有线性关系,但在具体样本中仍可能有线性关系。以下分两种情况加以说明:
情况一,例如当研究只含有两个解释变量x_1与x_2共线时,可将x_1对x_2回归,如样本可决系数R_(x_1 x_2)^2很大,则认为x_1和x_2可能存在严重的复共线性。如果样本可决系数R_(x_1 x_2)^2=1,则认为x_1与x_2可能存在完全复共线性。之所以说“可能”,因为R^2和样本容量n有关,当样本容量很小时,R^2容易接近于1。如同众所周知的当n=2时,两点总能连成一条直线,即R^2=1使原本并不存在线性关系的变量x_1与x_2,由于样本数据问题产生了共线性。因此,戈德伯格构造了微数缺测性〔2〕的概念与复共线性概念相对应。按照戈德伯格所说的,准确的微数缺测性(与完全复共线性相对应)是指样本大小n等于零的情形,这时任何种类的估计都是不可能的。近似微数缺测性则如同近似完全复共线性,指样本数n刚刚超过待估计参数个数k+1的情形。