1999开始的、获得美国国家标准技术研究所支持的(NIST)ACE评测会议每年举办一次,旨在开发自动内容抽取技术,以支持对3种不同来源(普通文本、由自动语音识别ASR得到的文本、由光学字符识别OCR得到的文本)的语言文本的自动处理,研究的主要内容是自动抽取新闻语料中出现的实体(Entitie)、关系(Relation)、事件(Event)等内容,即对新闻语料中的实体、关系、事件进行识别与描述。64304

国内对汉语文本信息处理的研究近年来也受到足够的重视。20世纪90年代北京语言文化大学和清华大学出台了《现代汉语语料库文本分词规范》。教育部语言文字应用研究所出台了《信息处理用现代汉语词类标记规范》,《信息处理用现代汉语分词规范》(国家规范G1/T13715-92)上升到困家层面[3]。1991年首次对汉字识别进行测试。2003年3月,由ACL-Sighan主办,举行了第一届国际汉语分词评测(The first international Chinese word segmentation bakeoff),同年10月由863中文与接口技术评测组组织对其进行测评。该会议从2005年开始每年主办一次,现在受到越来越多的重视。

参考文献

[1] Lawrence S et al. Searching the World Wide Web. Science, 1998, 280( 536): 98-100

[2] 袁鼎荣,钟宁,张师超.文本信息处理研究述评[J].计算机科学,2011.38(2):9-13

[3] 杨尔弘,方莹等.汉语自动分词和词性标注评测[J].中文信息学报,2005.20(1):44,49

[4] 王继成,武港山,周源远,张福炎.一种篇章结构指导的中文Web 文档自动摘要方法[J].计算机研究与发展2003.40(3):398-405

[5] 王麒.江开忠.杨静.顾君忠基于领域本体的文档自动摘要算法[J].华东师范大学学报(自然科学版),2007(5) 

[6]张彩琴,袁健.改进的正向最大匹配分词算法[J].计算机工程与设计,2010,31(11) 2595-2597

[7]许晓昕,李安贵.一种基于TFIDF的网络聊天关键词提取算法[J].计算机技术与发展,2006,16(3):122-123

[8]谭翀,陈跃新.自动摘要方法综述[J].情报学报,2008,27(1):62-68

[9] D.D.Lewis.Naive Bayes at forty:The independence assumption in inforrnation retrieval.The 10th European Conf on Machine Leaming.Heidelberg,Germany 1998,4-15.

[10] S.Eyheramendy,D.Lewis and D.Madigan.on the naive bayes modeI for text categorization.The 9th Intemattonal Workshop on Artificial Intelligence and Statistics.Florida USA,January,2003.

[11] Y.Yang.An evaluation of statistical approaches to text categorization.Joumal of Infornlation Retrieval,1999,l(1/2):69-90.

[12] W.W.Cohen,and Y.Singer.Context-senSitiVe leaming methods for text categorization.Proceedings of the 19th Annual Intemational ACM S1G1R Conference on Research and Development in Infornlation RetrieVal.Zurich,SwitZerland,August,l 996,307-315.

[13] D.D.Lewis,R.E.Schapore,J.P.Callan,et a1.Training algorithms for linear text classifiers.Proceedings of the 19th Annual Intemational ACM SIGIR Conference on Research and Development in Infomation RetrievaI.Zurich,Swizerland,August,l 996,298-306.

[14] Y.Yang and C.G.Chute.A linear leaSt squares fit mapping method for information retrieval from natual language text.Proceedings of the l4th Conference on Computational Linguistics.Nantes,France,August,1992,447-453.

[15] T.Joachims.Text categorization with support Vector machines:Ieaming wim many relevant features.Proceedings of the 1 Oth European Conference on Machine Leaming.Chemnitz Gemlany,April,1 998,137-142.

[16] G.Dong and J.Li.Efficient mining of emerging patterns:discovery trends and differences.Proceedings of the 5th International Conference on Knowledge Discovery and Data Mining.SanDiego,USA,August'1999,43-52.

上一篇:群决策国内外研究现状综述
下一篇:网络舆情研究现状和参考文献

微课国内外研究现状和发展趋势

翻转课堂国内外研究现状

国内外会议产业现状研究

会展场馆空间分布特征国内外研究现状

社区的三维可视化国内外研究现状

不同形貌SnO2纳米材料的光...

会展品牌塑造国内外研究现状综述

老年2型糖尿病患者运动疗...

麦秸秆还田和沼液灌溉对...

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识

网络语言“XX体”研究

新課改下小學语文洧效阅...

我国风险投资的发展现状问题及对策分析

安康汉江网讯

ASP.net+sqlserver企业设备管理系统设计与开发

互联网教育”变革路径研究进展【7972字】