用户兴趣模型可根据时间跨度分为长时兴趣和短时兴趣两种。
通常情况下,长时兴趣源自于用户长期的访问历史记录和长期的搜索关键字,即当前查询以前用户提交的查询和点击记录。短时兴趣来自于短期历史,一般指当前的查询会话。查询会话指用户为了满足一个搜索意图而在较短的时间内进行的连续查询行为。由于用户的信息需求难以通过查询完全表达清楚,研究者经常借助历史信息中体现出来的用户兴趣提高检索性能。70616
长期历史记录了过去很长一段时间中用户感兴趣的信息,许多研究基于长期历史对用户兴趣建模。有的根据所有用户历史典籍,利用用户典籍的文档和跳过的文档构成训练序对,采用SVM模型优化检索结果;有的在向量空间模型框架下为每个用户建立长时兴趣模型,从用户历史点击中提取关键词等方式来构建长时兴趣模型。
与长时兴趣不同,短时兴趣来自查询会话,它表示用户当下的兴趣。一般认为,短时历史与当前查询主体是连贯的。实际上短时兴趣体现了用户短暂的兴趣信息,长时兴趣体现了持续性信息。[9]
当前,很多搜索引擎都是建立在一种用户长时兴趣模型的基础上,短时兴趣,作为一个新的概念,已经逐渐开始进入人们的视线,可是在短时兴趣模型领域的研究和探索深度上还略显不足。大多的研究都是针对长时兴趣模型的短时优化,提及到了短时兴趣,却很少有直接针对短时兴趣建模的研究,对用户短时兴趣模型的研究深度可进一步深入挖掘。论文网
针对用户短时兴趣进行优化后的长时兴趣模型,虽然某种程度上提高了短时用户的搜索效率,但是仍然没有解决长时兴趣模型的另一个隐患,数据隐私泄露问题。
因此,设计一个完全基于短时兴趣模型的信息搜索系统是很有必要的,无需大量的用户隐私数据,仅基于用户短时兴趣网络,结合语义词典和多用户协同网络共同作用,来定位出最符合用户需求的搜索结果,既提高效率,又保护了用户隐私。