图1中的小白圈是异常取值,即离群点(outlier)。
箱线图
2.2 对数线性回归模型
对数线性回归模型是将列联表中的数据取对数再表示为各个变量以及它们交互效应的线性模型,然后在方差分析的基本思想上,使用逻辑变换来检验这些变量和交互效应的作用大小。
假设 表示行, 表列, 表示第 行第 列的观测频次。那么期望频次 被设定为一个乘积的函数。
(1)
代表概率里面的总概率值1, 和 分别代表 和 的边缘效应, 代表 与 的二维交互效应,当 时就是独立模型。
由于相乘形式不好计算,我们将其取对数
(2)
(3)
其中 为常数, 为因素A的效应, 为因素B的效应, 为 、 两因素的交互效应。
以上两个式子的对数转换使各种效应项相乘的关系被转换成相加的关系,使各项效应独立化了。
2.3 假设检验
本次研究用到了t检验,假设其原假设 ,备择假设 ,则检验统计量为
(4)
拒绝域为 。
3 模型建立
3.1 影响因素分析
由于不同国家和地区的电影产业发展状况不同,所以票房的影响因素也不同。本文以我国电影市场现状为基础,参考国内外学者在票房预测方面的研究结果,本文总结出了以下几点主要票房影响因素,比如导演、明星、剧本、电影类型、宣发方、档期、票价、电影制作成本、宣传费用等。
(1) 电影类型
电影类型的分类有不同的标准,一个国家的电影类型统计分布反映了该国观众的观影偏好,研究不同国家观众的观影偏好对于各国电影人的取材有很大的意义,可以更好的适应市场,促进电影产业的繁荣发展。例如,Neel-amegham和Chinatagunta ( 1999) 的研究认为观众更偏爱惊悚片,反而留给爱情片的市场空间相对较小。Barry Litman( 1983) 的研究则认为,科幻类型电影的票房收入更为可观。
(2) 剧本
剧本是一切戏剧表演的重要依据,是连接所有演职人员与电影的关键一环,是一部电影成功与否的重要因素。电影产品的消费在很大程度上受制于观影人群的主观情绪。比如在续集方面,如果一部电影让观众感到回味无穷,那么该电影续集的票房往往有不俗的表现;然而当一部电影的续集让观众觉得多余而冗长时,消费者就会渐渐失去新鲜感和观影的热情,从而续集就会有狗尾续貂的感觉。来.自>优:尔论`文/网www.youerw.com
(3) 导演
在我国电影的创作中,导演全权掌握电影拍摄制作的大权,即导演中心制。而且,在我国观影群众心目中,知名导演的影响力通常要大于明星效应。因此,研究导演对于国内电影票房的影响力具有重大意义。
(4) 明星
随着娱乐圈的发展,明星效应在电影票房中起到的作用越来越大,一线或者二线明星参演的电影通常能够吸引到更多观众,但是对于影响票房的因素中的明星效应因素始终饱有争议。Anderson和Faulkne ( 1987)发现好莱坞电影市场中的明星效应与电影票房呈正相关关系。针对美国电影市场,Casavant 、Prag( 1994 ) 以及Albert( 1998)和Basuroy et al. ( 2003)都支持明星的票房效应。但是也有反对的声音,比如Chang et al. ( 2005)的研究认为明星的票房效应并不像人们想象的那么大,它只有在电影首映周起到比较大的积极作用,而之后的影响甚至可能却为负。