基于复杂网络理论的推荐算法研究
作 者 : 江山
学位授予单位 : 西南财经大学
学位名称 : 硕士
外文题名 : Research of Recommendation Algorithm Based on the Complex Network Theory
导师姓名 : 王鹏
学位年度 : 2012
关键词 : 个性化推荐系统;推荐算法;复杂网络;随机游走;热传导
摘 要 : Internet的快速发展使得用户接触到的信息越来越多,及时、准确在海量信息源中发现有价值的信息变得越来越困难。个性化推荐系统被视为解决这一问题的最有效方式之一。个性化推荐系统可以根据用户历史行为,通过建立相应的推荐算法,挖掘出用户特点和喜好,依据预测推荐结果帮助用户快速找到所需信息,达到个性化服务的目的。推荐算法作为个性化推荐系统中最为核心的组成部分,其效率的高低直接影响着整个推荐系统的表现。比较成熟的推荐算法有基于内容的、协同过滤等算法,这些算法虽然已经被普遍使用,但仍有不少需要完善的地方。基于复杂网络理论的推荐算法的提出就是一种很好的尝试,它也是目前的研究热点之一。随着复杂性科学的发展,将现实社会中各种现象或者关系抽象为复杂网络模型已经成为一种趋势。将个性化推荐系统中用户和商品抽象为复杂网络中的节点,用户与商品之间的选择关系抽象为网络中的连线,在这一模型基础上进行分析,为推荐算法的研究带来了新突破的可能。以复杂网络理论和相关的数据挖掘方法为基础,论文着重于寻求提升个性化推荐系统中推荐结果的精确性、多样性以及新鲜性的途径。在简述了一些复杂网络和个性化推荐系统的背景知识的基础上,分析探讨了推荐算法的发展与演变,最后结合随机游走与热传导两种物理过程构造出两类基于网络结构的推荐算法。具体工作如下:第一部分为绪论,介绍了互联网时代个性化推荐系统的研究背景,阐述了其对于解决信息超载问题的重要意义,并且对主要的研究方法和研究内容进行了概括。第二部分介绍了复杂网络理论以及个性化推荐系统。首先,概述了复杂网络理论的概念、特点以及发展状况和应用的领域。对复杂网络的几类主要拓扑特征进行了描述;介绍了几类经典复杂网络模型,并分析了各自的网络拓扑特性。其次,论文对个性化推荐系统进行了介绍。针对目前信息超载的现状指明了个性化推荐系统的研究意义以及商业价值;分析了推荐系统的业务流程、推荐系统的整体框架和推荐系统面临的主要挑战。第三部分对目前的个性化推荐算法研究进展进行了综述。主要介绍了基于内容的推荐算法、协同过滤推荐算法、基于复杂网络的推荐算法等。重点分析了基于网络结构的推荐算法,其基本思路为将用户抽象为节点,用户之间通过商品的联系抽象为连边,构建二部图(bipartite network)网络结构。类比物质扩散这种资源分配过程实现用户之间的相似性传递,以达到为目标用户推荐其未选择过商品的目的。该部分的最后对各种算法的优缺点进行了比较。第四、五部分是本论文的重点。第四部分通过分析商品度的影响能力以及资源随机游走传播方向性问题,修正了传统的协同过滤网络结构算法。尝试提出了基于随机游走的二部图网络结构推荐算法。传统的协同过滤网络结构推荐算法对于用户相似性的刻画都是从目标用户到邻居的方向来考虑。在现实的在线网络系统中,不活跃的用户占据了大部分的比例,活跃用户只有少数,本文指出有效的利用这种不均等的用户配比关系,可以增强在线社会网络以及电子商务网站的可扩展性以及用户依赖度。通过加入对于流行商品推荐能力限制的参数,适当降低流行商品的资源贡献强度,可以提高系统中那些较为冷门商品的出现比例,这样也就优化了推荐结果的多样性。同时,通过改变系统中固有的随机游走的资源传播方向,可以在不受实验数据特性的影响下,通过计算找到用户间相似性最大值,改善推荐系统的精确性。通过以上两个步骤的调整,算法可以在精确性、多样性以及个性化结果上优于以往的传统的协同过滤网络结构算法。第五部分类比物理上的热传导过程,利用标签等内容信息,在三部图网络结构中,尝试提出了基于热传导的三部图网络结构推荐算法以增加推荐结果的多样性。传统的推荐算法集中于对推荐结果精确性的改进,高精确性确实是衡量推荐系统效果的最为重要的指标之一,但是这样的结果并无法满足用户的个性化需求,因为高精确性带来的推荐往往都是那些已经可以从其他各种渠道获取到信息的流行商品。本部分通过从展示商品内容特征的标签信息入手,并将热传导这种物理过程成功的运用到用户-商品-标签三部图的复杂网络结构中,借鉴热传导的原理,不仅提高了算法的推荐结果多样性,同时也保障推荐结果的精确性。这一算法的整体表现,优于基于物质扩散的二部图网络结构推荐算法,同时也完善了传统的基于物质扩散的三部图网络结构的推荐算法。第六部分阐述本文的主要结论和不足之处,并对进一步的研究进行了展望。本文的主要创新点有两处。第一是考虑了方向性带给用户之间相似性计算的差异,引入物理学中的随机游走过程,通过比较采用两用户间相似性值较大者,改进了标准的基于网络结构的协同过滤算法。并且,通过加入对于流行商品推荐能力限制的参数,适当降低流行商品的资源贡献强度,提高系统中一些非流行商品的出现比例,这样也就优化了推荐结果的多样性。第二是在原有的利用标签信息构建的三部图网络结构推荐算法中,借鉴了物理学中热传导的原理,在用户-商品之间使用类似于热传导的资源传播方式增加了两用户的推荐列表差异性,从而改进了整个推荐算法的多样性。

      • 温馨提示:
      • 在微信、微博等APP中下载时,会出现无法下载的情况
      • 这时请选择在浏览器中打开,然后再请下载浏览

发表回复

后才能评论