string HTML0 = httpClient.GetString();
                    string HTML;
                    HTML=PatternMatch.NormalPatternMatch(HTML0,"<p class=\"result\" id=\"result\">(.|\n)+</p>");            
                     List<string> searchresullist = PatternMatch.MultiPatternMatch(HTML, "<p class=\"r-info|(\\sr-info\\d)\">(.|\n)*?</p>",true);
                    for (int ii = 0; ii < searchresullist.Count; ii++)
                    {
                        Sina sinaResult = new Sina();
                        sinaResult._RawString = searchresullist[ii];
                        urlList.Add(sinaResult);
                    }
                    for (int ii = 0; ii < urlList.Count; ii++)
                    {
                        urlList[ii].Analysis();
                    
                   for (int ii = urlList.Count-1; ii >= 0; ii--)
                    {
                        if (urlList[ii]._Abstract == null)
                        {
                            urlList.RemoveAt(ii);
                        }
                   }
               
            }
4.3 分词统计与分析模块详细设计
4.3.1 分词系统概述
分词系统主要是将一个语句切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。本文就是利用分词系统将新浪新闻的摘要内容进行分析。
分析统计将新浪新闻摘要中分词后提取的所有关系动词出现的具体次数记录下来,并以这些关系动词的出现次数的次数用冒泡法做排序。
上一篇:ASP.net+sqlserver旅游信息网站设计+ER图
下一篇:ASP.net小型网上书店的设计与实现

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

网络常见故障的分类诊斷【2055字】

网络安全的研究【1797字】

网络信息安全技术管理的...

Web技术的网络考试系统【2240字】

C#学校科研管理系统的设计

承德市事业单位档案管理...

国内外图像分割技术研究现状

10万元能开儿童乐园吗,我...

中国学术生态细节考察《...

AT89C52单片机的超声波测距...

志愿者活动的调查问卷表

医院财务风险因素分析及管理措施【2367字】

公寓空调设计任务书

神经外科重症监护病房患...