3.5 系统的优缺点 13
3.5.1 系统优点 13
3.5.2 系统缺点 13
4 系统实现设计 14
4.1 功能界面 14
4.1.1 1对1功能设计 14
4.1.2 1对N功能设计 16
4.1.3 N对N功能设计 18
4.2 系统实现中关键代码 19
4.2.1 LD算法的关键代码 19
5 系统测试 22
5.1 程序的调试 22
5.2 程序的测试 22
5.2.1 程序测试的目的及重要性 22
5.2.2 程序测试的过程 23
5.2.3 程序测试中的主要内容 23
5.2.4 测试案例的内容 24
总结 29
参考文献 31
致谢 32
1 绪论
学术不端或恶意学术造假事情频发不断,给整个学术界的声誉造成了极坏的影响。在学术界,以科学、诚实和追求真理的形象,已经受到社会大众的质疑,许多人认为学术界便是社会道德的一道最后的防线,但是,如今的这道防线已经被攻破,学术界面临着前所未有的诚信危机。比如清华大学某教授伪造个人学术成果和北京大学某教授著作涉嫌抄袭他人作品等事件。学术不端的问题不仅在中国,在世界范围内,同样是一个令学界头痛不已的学界“肿瘤”。又比如日本科学家 森口尚史(Hisashi Moriguchi)在2012 年时发表的利用诱导多能干细胞培育出心肌细胞,并移植到6名严重心力衰竭病患进行治疗的研究论文被证实造假。所提及的这些案例,都是讲在学术上论文的抄袭造假问题。学术界的问题同样可以引申到大学当中来,或许,对于大学生来说学术论文还离得远了一点的,但是,我们需要知道,学术的诚信危机不仅仅是学术界的事,也是当代大学生应该关注的事。这个诚信问题也是我们的社会道德的一道防线,我们应该守护这道岌岌可危的防线。在现在的大学中,抄袭现象更是屡见不鲜,从小的方面来说平时的课堂作业,实验报告,从大一点的方面来说有大学生的毕业论文等。这些现象的发生是和我们息息相关的,我们应该关注并防止这种现象的发生。
1.1 课题介绍源'自-优尔;文,论`文'网]www.youerw.com
课题题目:文本相似度检测系统
课题来源:上海应用技术学院
课题的任务内容:文档相似性检测工具是通过比对源文档和目标文档相似性给出相似度结果的一种信息处 理系统。 本软件自动将文档切割为多个50到200字(可自定义)的小文本,通过一定的算法将其与其它文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。
调研方法:通过网上查找相关资料进行分析参考运用以及课本知识和导师的指教,对系统进行开发。
1.2 可行性研究分析
1.2.1 本课题研究的意义
(1)关于文本相似度检测系统及其前景
一如在绪论中提到的学术作假抄袭的例子,这些学术界的问题看似对于大学生来说离得还有些远,但是,学术方面的诚信问题不仅仅是学术界的事情,亦是我们当代大学生关注的事情。抄袭这一诚信问题,是社会道德的一道防线,也是我们大学生诚信责任的一道防线,抄袭的行为就是在对这防线的冲击,我们作为当代大学生理当出面守护这道岌岌可危的防线。学术不端的各种行为中,文字复制是最为普遍和严重的,目前的文本监测系统对文字复制的检测已经打到了相当高的水平,通过检测软件,我们可以轻易的找到是否有抄袭的现象,找到抄袭的对象以及可以精确的算出有多少的抄袭成份,可以做出科学而有依据的对是否存在抄袭行为做出判断。