3.2 变量选取 9
3.3 数据分析及模型 10
3.4 检验 14
3.5 预测 16
4 实证研究 16
4.1 数据分析 16
4.2 实证检验 20
4.3 预测 21
5 总结 22
致谢 23
参考文献 24
1 引言
1.1 课题的目的和意义
近年来,随着经济飞速发展,人们越来越重视精神生活的质量。电影行业,无疑是近年来的热门行业,由此为影院带来了丰厚的票房收入。电影的票房收入已经渐渐成为投资方竞相追逐的目标,所以票房研究对投资以及宣发方具有非常重要的意义。传统影院都是依靠人工经验排片,在电影上映前,凭经验对电影进行排片。但是由于影片的票房收入受多种因素的影响,排片多的电影可能最后的票房远低于预期值,导致影院因安排失误而损失了很多票房收入。论文网
基于此背景下,众多的影院希望有一个模型能够预测电影的票房,为影院的排片进行指导。但是在现有的电影票房预测与分类的研究中,存在预测精度不高、缺乏实际应用价值等缺陷,以及由于商业的原因,现有的电影票房预测模型很多都是不公开的。所以本文在分析了多元线性回归预测应用与票房预测模型的国内外研究现状的基础上,提出了用对数线性回归模型来进行票房预测。首先,分析确定电影票房的主次影响因素,并对每一个因素展开详细的分析; 其次,综合我国电影产业的现状从而选取变量,再对这些变量进行定量和归一量化处理;再次,建立对数线性回归的票房预测模型,针对2016年电影票房数据进行下一年的预测。本次研究内容能够在电影即将上映之时为投资方、宣发方提供比较全面可靠的参考方案;另外,在预测领域也具有较好的研究意义和前景。
1.2 国内外研究现状和发展趋势
1.3 文献综述
1.4 研究目的与范围
本文对电影票房预测在国内外的发展进行了简单总结概述,并对对数线性回归和电影票房预测领域的发展进行了简要总结。本次研究通过三个国内权威电影信息网站:中国电影宣传发行协会官网、艺恩电影智库和Mtime时光网,收集到2010-2013年千万票房及以上的所有国产电影的票房数据以及2016年部分知名国产电影的票房数据;采用对数线性回归模型,设计并实现电影票房的预测。
2 相关原理介绍
2.1 箱线图
箱线图,又称箱形图或箱须图。它是一种常用统计图,用来显示一组数据的分散情况以及是否具有对称性,比较简洁直观地表现数据的分布情况。箱线图应用于各种领域,常见于品质管理。R语言软件有专门绘制箱线图的命令,使用十分方便。
图例解释:
如下图,是一个简单的箱图。图里面有一个小方框,我们称之为“箱子”。箱子的下、上边分别是第一、第三个四分位数。箱子中间的黑线是第二四分位数(即中位数)。其中,第一四分位数,是样本中所有数据从小到大排列之后,排在第25%的数字;第二四分位数,即“中位数”,是数据从小到大排列之后的第50%的数字;第三四分位数,也就是排在第75%的数字。另外,我们称第一四分位数和第三四分位数之间的差距为四分位距(InterQuartile Range,IQR)。文献综述