计算机论文模板代写:基于交互兴趣图的轻量级GCN推荐方法

发布时间:2023-10-04 18:47:48 论文编辑:vicky

本文是一篇计算机论文,笔者认为利用GCN方法实现协同过滤,更能提高模型推荐的准确性和适用性。相较于传统的基于用户、项目等协同过滤方法,本文模型结合的轻量级GCN方法可更为全面地利用到整体数据,避免数据运用过程中的丢失,提高预测准确度。

1  绪论

1.1  研究背景与意义

计算机论文怎么写

推荐系统作为大数据时代获取信息的重要工具之一,受到广泛关注和研究[1]。但随着海量数据的增加及技术的革新,人们的需求不仅满足于得到相同的推荐结果,而希望得到主动符合用户个性化需求的推荐结果。这就要求推荐模型能定制排名列表,以满足用户的个性化需求。但传统研究通常建立在历史行为的用户配置文件中,并直到结果排序时才考虑用户和项目间的关系[2],显然,这很难满足用户的个性化需求。

协同过滤(Collaborative Filtering, CF)[3]作为推荐领域中经典的算法之一,近几十年来得到了广泛的发展和应用。它通过结合不同群体(用户和项目)间的相似规律来实现评分填充或项目推荐。基于协同过滤的推荐模型能较充分地利用用户的全局信息,获取较好的推荐精度,但单一的协同过滤推荐模型对数据的完整性要求极高,故在实际使用中,数据稀疏性、训练效率低等问题是这一类模型的通病。而不可否认的是,评分、浏览等基础信息确实最能展现用户兴趣,也极易从中获取兴趣。因此,纵向深挖用户基础信息以获取深度信息(如本文的自适应周期、兴趣量因子等)的意义并不亚于横向融入近期热门辅助信息。换句话说,基础信息中蕴含的大量深度信息在传统推荐模型中难以挖掘或易过拟合,这种局限性导致很多推荐模型盲目地朝着融入更多辅助信息的方向发展,使得模型变得异常复杂。

基于深度学习的推荐模型对挖掘用户与项目间的非线性关系有着独特的优势,且其抽象的编码能力可表示更高层次的交互信息,解决了很多传统推荐模型面临的问题,其中采用多种神经网络组合成的混合神经网络[4]表现出的优势更为明显。但这些模型始终面临着数据稀疏性问题,且在复杂信息抽象编码的过程中会丢失大量的潜在信息。近些年较热门的基于图卷积网络(Graph Convolutional Network, GCN)的推荐模型[5-7]采用GCN方法将用户-项目图结构信息输入模型中,最大程度上保留了潜在信息,能很好地实现协同过滤的思想。然而,这些工作尽管对于用户的潜在信息更为关注,但对用户和项目的高阶交互信息挖掘程度仍较浅,也未兼顾到用户-项目间更深层次的关系,数据深度与模型复杂度的不对称性是其中的一大因素(为适应结构更加复杂的数据,模型的复杂度往往会成倍增加)。如今数据的庞杂性加大了对复杂技术的依赖,使得模型构件冗余的现象愈加严重。但事实上,结合传统经典技术,或轻量级神经网络技术的推荐,不仅能降低复杂度,性能也并不逊色,因此,挖掘合适的深度信息作为模型输入对推荐性能的提升至关重要。

1.2  研究目标

本文就如何在保证模型复杂度的情况下,提高模型的推荐效果,提出基于交互兴趣图的轻量级GCN推荐方法。一方面,通过利用较为传统的技术来深度挖掘基础信息中的自适应周期和兴趣量因子等深度信息,并构建用户-类型-项目交互兴趣图,使该图结构数据能够更好地契合轻量级GCN网络。另一方面,在构建交互兴趣图之后,对交互兴趣图进行簇间交互和子图分裂等操作,以形成更容易被轻量级GCN所利用的子图结构信息。欲达到以下目标:

1) 根据目标用户对该项目类型的当前兴趣形态和构建的用户-项目兴趣浮点模型来分别匹配兴趣函数预测下一个行为的项目自适应周期,以及求解各个兴趣类型的兴趣量因子,以挖掘出蕴含着大量潜在兴趣的深度信息。

2) 通过合理地归纳总结深度信息中所蕴含的行为规律,来预测用户的兴趣项目类型,从而构建用户-类型-项目交互兴趣图,以契合轻量级GCN的高阶传播机制。

3) 采用面向簇型兴趣图的方法来对交互兴趣图进行消息交互,使用户序列不仅得到邻居的充分交互,还让其与项目序列也得到充分交互,以实现丰富用户节点自身表示的同时,使其携带更多潜在项目信息的目的。

4) 对经过充分交互的高密兴趣图,按照无监督和基于用户意图的方式进行子图分裂,使得生成的子图在进行高阶传播时,能够缓解轻量级GCN的过度平滑问题,以改善推荐效果。

2  相关理论与方法

2.1  传统推荐方法

本节将在2.1.1节中介绍基于协同过滤的推荐,在2.1.2节介绍关于时间因素的时间感知邻域的推荐,以及在2.1.3节和2.1.4节中分别介绍运用聚类和线性回归解决或缓解推荐中的相关难题及存在的不足。

2.1.1  协同过滤的推荐

协同过滤推荐算法是推荐领域中研究与应用最为广泛的算法之一[14],有相关工作将协同过滤推荐算法看成是基于用户与项目评分的二元模型,因为该算法的基本原理是通过已有的用户项目评分学习预测未进行的项目评分,并根据结果生成最终推荐[15]。协同过滤是一种利用用户或项目间相似度来预测的经典算法,基于协同过滤的推荐模型能较充分地利用全局信息,但单一的协同过滤推荐模型很难适应不同的场景。比如,为实现个性化推荐而细化用户的不同兴趣,就要求协同过滤可融入时间等方面的因素并关注到局部信息。因此,在推荐系统的发展过程中,很多基于协同过滤的时序预测和用户兴趣预测方法脱颖而出。

2.1.2  时间感知邻域的推荐

时间感知邻域模型[16]在协同过滤的基础上,对时序信息进行建模,比如,在挖掘用户-项目信息的过程中,将用户交互过的项目按时间轴顺序展开,使得用户对项目的关注度也随时间分布。此外,时间感知模型还能与其他很多技术相结合进行推荐,比如,Baytas等[17]提出了一种新的长短期记忆网络(Long Short-Term Memory, LSTM)单元,称为时间感知LSTM(T-LSTM),用于处理纵向患者记录中的不规则时间间隔,同时学习了单元存储器的子空间分解,它使时间衰减能够根据经过的时间来表现存储器内容的变化,该模型能够在时间不规则的序列中捕获其底层结构。但这些方法虽扩展了传统模型对时序信息的挖掘与利用,却未能弥补传统模型固有的缺陷。

2.2  深度学习推荐方法

本节将先在2.2.1节中介绍传统神经网络的推荐,再在2.2.2和2.2.3节中分别介绍图神经网络的推荐和基于图卷积神经网络的推荐,最后在2.2.4节中介绍融合用户意图的深度推荐。

2.2.1  传统神经网络的推荐

循环神经网络(Recurrent Neural Network, RNN)作为一种优秀的序列问题处理技术,被广泛运用到各种推荐[25-26]中。比如,动态回归模型(Dynamic Regression Model)使用RNN来优化自身,使其在下一个篮子推荐[27]中的效果得到很大的提升。此外,传统神经网络与其他技术的高效融合,也使得这些网络技术依然具有很大的优势。比如,因自注意机制是线性建模,石美惠等[28]等在自注意力后采用点向前馈网络来捕捉不同维度之间的相互作用,进而赋予自注意力机制非线性能力。但RNN对数据的要求比较高,需要数据有统一的格式,比如一维向量、二维矩阵、三维张量等,即欧式空间的数据,很难处理类似图结构等复杂混合型的数据。

2.2.2  图神经网络的推荐

传统神经网络对处理图结构数据的局限性,使得主要解决图论问题的图神经网络(Graph Neural Network, GNN)方法开始得到很多推荐领域学者的关注。但直到2014年,Perozzi等[29]提出了Deepwalk,意味着图表示学习技术在这个深度学习时代才正式被激活,之后便得到更为深入的应用。Wu等[30]提出深度影响传播模型(DiffNet++)来建模社交推荐中的递归动态社交扩散过程,主要研究了用户间的社交关系网络及用户-项目间的兴趣交互网络。

3  融合自适应周期与兴趣量因子的轻量级GCN推荐 ......................... 9

3.1问题定义 .................................. 9

3.2  LG_APIF推荐框架 .................................... 9

3.3  兴趣模型构建 ................................ 10

4  融合用户意图的簇型兴趣图交互再分裂的轻量级GCN推荐 ........................ 38

4.1 问题定义 .................................... 38

4.2 LG-ISU推荐框架 ..................................... 38

4.3 融合用户意图的兴趣图构建 ........................... 39

5  总结与展望 ..................................... 59

5.1 总结 ....................................... 59

5.2 展望 ............................................ 60

4  融合用户意图的簇型兴趣图交互再分裂的轻量级GCN推荐

4.1  问题定义

基于GCN的推荐模型建立在用户-项目交互图基础上,通过迭代聚合从相邻(用户和项目)节点传递的消息来学习的,但并非所有来自高阶邻居的信息都是正面的,这是图神经网络(graph neural network, GNN)推荐模型产生过度平滑效应的原因之一。在未解决这种过度平滑效应的情况下,兴趣图个体间的紧密程度越高,就越可能使目标用户学习到更多的负面信息,对推荐性能越不利。基于此,有相关研究者就从兴趣图的构建出发,降低个体间的紧密程度,来缓解过度平滑问题[5-6]。但这些研究又易陷入一个新的问题,即,基于GNN的推荐模型很难适应项目序列松散或项目间交互不充分等的兴趣图,这对提升推荐性能依然很不利。

为此,本文在第3章介绍了一种能够在基础信息中挖掘更多有用信息的方法,用以更好地进行推荐,表述基础信息中存在的潜在价值信息,但并不是表明引入辅助信息,或从构建复杂的结构信息,对模型就是绝对无益的。本文第4章将介绍一种融合用户意图的推荐方法,目的是为了表明基础信息在交互充分,且突显有益数据的情况下,对模型的推荐效果依然有利,还能缓解传统GCN模型所面临的过度平滑问题。

计算机论文参考

5  总结与展望

5.1  总结

用户浏览需求的不断变化推动了推荐系统发展形式的变革,不仅使很多传统的人工智能技术得到很大的应用和改进,还催生了一些新生技术与推荐系统的契合,以满足用户不断变化的个性化需求和解决信息过载问题。本文在已有工作的基础上,针对推荐模型愈加复杂,难以充分利用基础信息的问题,以及为缓解GCN技术所不能避免的过度平滑问题,并为进一步使信息得到充分利用,提出融合自适应周期与兴趣量因子的轻量级GCN推荐,以及融合用户意图的簇型兴趣图交互再分裂的轻量级GCN推荐,且这两种策略均取得较好的推荐效果。本文的主要特色与创新如下:

1) 利用遗忘曲线构建兴趣模型,更加显式地表示用户的兴趣变化规律。此方法结合人类思维方式的规律,将其扩展运用到推荐系统中,可比较显式地表示用户的动态行为变化,进一步采用遗忘曲线拟合出的函数对用户的兴趣占比进行计算,更准确地判别出用户当前的兴趣情况。

2) 挖掘自适应周期和兴趣量因子等深度信息以增强特征表示,更准确地解析用户的整体偏好。根据用户针对同种类型项目具有相似行为的规律对用户行为进行聚类并拟合,获取用户的自适应周期,再结合用户-项目的行为规律,归结出用户对项目的兴趣量因子。这些深度信息的特征表示,蕴含着更高阶的协作,有助于捕获用户的整体偏好。

3) 利用GCN方法实现协同过滤,更能提高模型推荐的准确性和适用性。相较于传统的基于用户、项目等协同过滤方法,本文模型结合的轻量级GCN方法可更为全面地利用到整体数据,避免数据运用过程中的丢失,提高预测准确度。

4) 融合用户意图构建簇型兴趣图,能提高图结构的连接性以减少孤立节点。结合时间和位置因素来考虑用户意图,将传统的用户-项目交互组织图中松散的、孤立的节点进行增强连接,不仅使项目序列变得更紧密,还提高了用户兴趣表示的精确性。

参考文献(略)