2.1视频数据特点和结构 5
2.2 基于深度的3D视频的结构 5
2.3视频摘要的关键步骤 6
第3章 自适应阈值算法 10
3.1 RGB颜色模型 10
3.2灰度直方图 10
3.3自适应阈值算法 12
第4章 基于镜头聚类的关键帧提取算法 14
4.1聚类概述 14
4.2基于聚类的关键帧提取方法 14
4.3关键帧提取算法步骤 14
4.4镜头检测、关键帧提取的实验结果及分析 15
第5章 总结与展望 21
5.1总结 21
5.2 展望 21
致 谢 23
参考文献 24
第1章 绪论
1.1 研究背景
随着多媒体技术和宽带接入技术的日益成熟和不断发展^优尔!文`论^文'网www.youerw.com,视频数据大量增长,视频成为信息传递和存储的重要载体。视频关键帧摘要技术对于更为有效的管理、存储、检索相关的视频内容显得至关重要,将使得视频数据的存储量大大降低,办事效率极大提高。3D(Three Dimension)视频以其高分辨率、高清晰度、沉浸式的画面体验效果而迅速推广市场,其视频格式以多视点视频加深度视频表示。多视点加深度的3D视频在市场上迅速推广和应用,使得视频数据呈指数型增长,这引发了视频存储归类的难题,同时也促进了很多相关技术的产生以及发展,例如视频存储、视频检索等方面的技术不断呈现。然而这一系列的工作都需要快速的检索视频数据,那就是快速知道视频的基本内容。
1.2 视频摘要的研究现状
1.3 视频摘要一般的研究内容
视频摘要是提取视频的系列关键镜头或者关键帧,让视频信息获得者能够快速的知悉其主要内容。就像写文章的时候,总要给出摘要,就是对内容做一个高度简洁的概括,包括文章表达的中心思想、主要内容等。由此可知,视频摘要就是通过计算机以一定的方式或者算法基于视频帧、字幕等信息分析视频内容,选择有代表性的帧图像或语音生成简明扼要但又包含视频主要内容的缩略视频。视频摘要的形式多种多样,不拘一格,其中包括标题、海报、故事板、漫画书、视频概述、漫画等形式。其生成方式也多种多样,算法不尽相同,各有千秋。但一般有以下几个步骤:
(1)视频分割
视频分割就是将视频分割成以镜头、场景为基本组织架构的基础单元,在这个基本单元中,视频背景变化不大,没有很大的人物变化和外在景物变化。视频分割是为了便于后期提取单元内重要的帧信息。
(2)视频内容提取
视频数据是帧的连续组合,帧由像素元素为基本单位构成。每一帧图像都有其不同于其他帧图像的像素值分布,可以按照某一原则提取能被计算机直接处理的像素信息。对帧图像的像素分布作统计,用某一种尺度衡量各图像的特征,返回每个基于该图像帧的特征值。
(3)关键帧提取
根据某一算法或者原则,合理的选取重要的帧图像来反映视频的基本内容。一般是在将视频分割为基本单元之后,在基本单元局部均选择合适的差异明显的帧作为关键帧输出,然后按照一定的时间先后顺序生成视频关键帧摘要。