1。2。1 理论意义 1
1。2。2 实践价值 2
1。3 本文的研究思路及内容 2
1。3。1 研究思路 2
1。3。2 研究内容 2
1。4 本文章节安排 2
2 文献综述 4
2。1 用户建模研究 4
2。1。1 用户建模的定义和过程 4
2。1。2 用户建模的类型及方法 4
2。2 用户信息行为研究 5
2。2。1 用户信息行为的定义 5
2。2。2 网络用户信息行为 5
2。3 微博内容挖掘研究 6
2。3。1 微博话题发现研究 6
2。3。2 情感倾向性分析研究 7
2。4 现有研究总结 8
3 基于用户信息行为和微博内容的用户兴趣建模研究 9
3。1 研究框架 9
3。2 关键技术描述 10
3。2。1 微博数据采集 10
3。2。2 用户兴趣特征提取 10
3。3 实验分析 12
3。3。1 用户兴趣特征提取实验步骤 12
3。3。2 融合用户信息行为和微博内容的用户兴趣建模实验步骤 19
4 实证研究 21
4。1 实验数据概括 21
4。2 建模结果评估 22
4。2。1 微博内容融合用户信息行为前后建模结果比较分析 22
4。2。2 融合用户信息行为和微博内容的用户建模结果抽样评估 24
5 总结与展望 27
5。1 研究总结 27
5。2 不足之处 27
5。3 研究展望 28
致 谢 29
参 考 文 献 30
图表目录
图3。1 研究框架 9
图3。2 火车头采集器构建采集转发静态页面的网址规则界面 13
图3。3 Fiddler Web Debugger捕捉微博转发页面两次动态加载的网址界面 13
图3。4 火车头采集器内容采集规则界面 14
图3。5 按照用户整合转发内容的程序结果截图 15
图3。6 转发分词程序运行截图 15
图3。7 转发分词结果截图 16
图3。8 CHI。py运行截图 16
图3。9 运行CHI。py后所得特征词和期卡方值结果截图