目前,深度学习的算法中应用较好的是监督学习算法,而半监督学习算法和无监督学习 算法是目前深度研究的瓶颈。常见的深度学习算法框架包括:卷积神经网络(Convolutional Neural Networks)、深度信念网络(Deep Belief Networks)、受限玻尔兹曼机(Restricted Boltzmann Machine)、堆栈式自动编码器(Stacked Auto-encoders)等[5]。这些算法已被应用 在计算机视觉、语音识别、自然语言处理、视频图像识别与生物信息学等领域,并获取了极 好的效果。
1。1。3 深度学习在图像识别挑战赛 ImageNet ILSVRC 中的应用
由深度学习引爆的科技,已经在多个领域带来了变革式的发展。尤其是在图像应用 方面,大幅提升了图片识别的准确率。
这其中最引人注目的进步体现在 ImageNet ILSVRC 挑战赛中的图像分类任务,这一比赛 是目前国际上最大规模的图像分类和测试平台。该数据集共包含约 150 万张图像,分为 1000
个不同的类别,参赛者被要求在 10 万张前所未见的测试数据集上进行分类。卷积神经网络被 应用之前,传统的计算机视觉分类方法在这个测试集上最低的错误率是 26。172%。2012 年 Hinton 的研究小组利用卷积神经网络在这个测试集上把错误率降到 15。315%。这个网络的结 构被称作 AlexNet。
2013 年的 ImageNet ILSVRC 比赛中,排名前 20 的小组使用的都是深度学习,这时深度 学习在图像识别方面的优势逐渐显露出来。2014 年在该项比赛中,参赛者使用深度学习算法 又取得了重要进展,在 ILSVRC2014 比赛中,获胜者 GooLeNet 将错误率降到 6。656%。 GooLeNet 的突出特点是大大增加了卷积网络的深度,其隐层数目超过 20 层,这是卷积神经 网络中大胆的尝试。虽然深度学习在 ImageNet 上取得了巨大成功,但是如何有效地训练网 络层次很深的网络模型仍是未来研究的一个重要课题。[6]
本科毕业设计说明书 第 3 页
1。2 本文完成工作及论文章节安排
本文主要完成以下三项工作:
1) 围绕卷积神经网络进行介绍,包括了传统神经网络基本概念、BP 算法、卷积神经网 络结构特征,之后简要介绍深度学习开发工具 Caffe。最后重点分析了典型网络 LeNet-5 的网 络结构和相关配置文件,并通过实验展示了其在 MNIST 数据集上的准确率。
2) 本文介绍了全卷积神经网络(FCN)基于卷积神经网络(CNN),在网络结构上所做 的两点改进,着重分析 FCN 最后一层全连接层变换为卷积层的原因,以及使输出图像尺寸与 输入图像尺寸相同方法的原理。文献综述
3) 在分析全卷积神经网络(FCN)的网络配置文件后,根据已有 Caffe 平台修改相关配 置文件,本文展示了模型训练的基本过程。之后给出了单幅图片经过预模型分割后的效果图, 并与图像分割的中的评价标准图(ground truth)进行比较。
论文余下章节安排如下:第 2 章介绍神经网络基本组成,尤其是输入信号前向传递以及 误差反传的过程,然后介绍 BP 神经网络中误差反传的影响因素,之后侧重分析了卷积神经 网络(CNN)的相关结构特点,接下来介绍了深度学习开发工具 Caffe,最后是分析了 LeNet-5 网络基本结构以及训练模型所用的网络配置文件,并演示了经典实例 LeNet-5 实例。第 3 章 着重分析了全卷积神经网络(FCN)的结构特点,尤其是相比卷积神经网络的优势所在。第 4 章在第 3 章的基础上,在 Caffe 框架中修改 FCN-32s 模型的相关配置文件,训练 FCN-32s 模型,并用相关图片验证了该模型的先进性能。
第 4 页