2 文献综述
3 生存分析法及数据处理
3。1 生存函数模型
生存分析是将一件事件的结果和出现这一结果所持续的时间结合起来分析的一种统 计分析方法,本文主要采用以下两个模型对贸易持续时间进行分析:
1。生存函数[14]
设 T 表示失败事件发生的时间,是随机离散变量(ti=1,2,3,4。。。。。。。),概率密度函 数为 p(ti)=Pr(T=ti)(i=1,2,3,。。。。。。n)且 t1<t2<t3<。。。。。。tn。那么对于随机变量 T 的函数 如下:
S(t)=Pr(T>t)= P(ti)tit
对应的风险函数:
当 S(t0)=1,生存函数和风险函数存在以下联系:
2。K-M 非参数估计
设生存时间 ti 与观测值 i 的删失指标变量 ci 互相独立,假如发生失败 ci=1 否则 ci=0。 若有 m <n 个失败次数 ,则排序后的生存时间序列 t(1)<t(2)<t(3)<。。。。。。<t(m)。令 ni 是 ti 时处于失败风险的数量,di 表示失败的个数,则存在生存函数:
当 t<t(i)时,S(t)=1。那么对应的风险函数为失败的数量/处于风险的数量,即:
由于在国际贸易中,如上文所述许多原因会导致数据删失。K-M 非参数估计可以利用删失 和非删失的观测数据而且它对于删失情况具有稳健性,因此我们采用 K-M 非参数估计方法。
3。2 数据采集与处理
(1)本文采用 UN—COM TRADE 数据库中 1995—2014 年中国和墨西哥对美国农产品 出口的 SITC5 位数贸易数据,共 20 年的数据。其中包括中国和墨西哥对美国农产品出口的 贸易值,中国美国墨西哥的 2005 年不变价美元的 GDP 和人均 GDP;美国关于农产品的进 口总额和中国墨西哥出口的农产品总额;还有各国的汇率和国际油价。其中由于墨西哥 1999、2000、2001 年汇率没有数据,为了数据的完整以及不影响计算分析,通过简单差值 法得出这三年的数据,即 2001 年和 2003 年汇率的平均值为 2002 年的汇率,因此得出 2001
年的汇率。同理得出 2000 年和 1999 年汇率。(2)本文农产品分类是依照联合国《国际 贸易标准分类》第三次修订标准,包括是主要提供食用的活动物 SITC00、肉及肉制品 SITC01、 乳制品及禽蛋 SITC02、鱼甲壳及软体类动物及制品 SITC03、谷物及谷制品 SITC04、蔬菜及 水果 SITC05、糖糖制品及蜂蜜 SITC06、咖啡可可茶香料及其制品 SITC07、牲畜饲料 SITC08、 杂项制品 SITC09、饮料 SITC11、烟草及其制品 SITC12、生皮及生毛皮 SITC21、油籽及含油 果实 SITC22、生胶 SITC23、软木及木材 SITC24、纸浆及废纸 SITC25、纺织纤维及其废料 SITC26、 未列明的动物及植物原料 SITC29、动物油脂 SITC41、非挥发性植物油脂 SITC42、动植物蜡 及油脂的混合物及产物 SITC43。(3)农产品出口贸易持续时间问题。出口贸易持续时间 是指农产品从进入进口国到该产品停止进入所经历的时间(中间没有时间间隔),持续时
间通常用年来衡量。因此本文中中国和墨西哥对美国出口农产品贸易的持续时间即为中国 和墨西哥农产品从 1995—2014 年之间某年开始出口到美国市场到停止出口到美国市场所 经历的时间。(4)贸易数据删失。数据删失是指数据因为某些因素使之观测值缺失。本 文采用 1995-2014 年的数据对贸易持续时间进行研究,因此无法知道产品在 1995 年之前是 否存在贸易关系,这就是数据所存在的左删失问题。如果考虑左删失最终得出的结论会产 生向下的偏差,从而低估贸易的持续时间。因而为了得到无偏的估计量,本文剔除从 1995 年的开始的贸易时间段,用第二个持续时间段来作为第一个持续时间段,这样就有效解决 左删失问题。论文网