关键词:
移动应用推荐
协同过滤
矩阵分解
数据集成
分布式系统
摘要:
随着移动互联网技术的快速发展,移动设备逐渐成为主流终端,海量移动应用应运而生。这些移动应用大大提高了生产效率,为用户的生活带来许多便利,然而,海量的移动应用也带来了信息过载等问题,用户很难准确找到符合自己喜好的应用,信息过载问题愈发严重。为解决这些问题,需要科学的方法来帮助用户进行选择。个性化移动应用推荐系统即为一种可行方案,其利用用户历史行为数据,通过挖掘用户潜在偏好,向用户推荐符合需求的移动应用。然而,面对海量的移动应用和繁杂的用户历史数据,如何收集和处理这些数据也是一个重要问题。面对以上挑战,移动应用数据的高效集中收集与精准的个性化推荐算法是解决信息过载的可行方案。
本文提出了一个基于联合矩阵分解的移动应用推荐框架,使用矩阵分解模型预测用户和移动应用之间的关系。与传统的矩阵分解不同,本文发现用户之间的相似性、移动应用之间的相似性都会对推荐的结果产生影响。因此,本文使用矩阵中的数据作为向量,计算用户之间、移动应用之间的相似性,并分别利用挖掘到的相似性信息构建两个联合矩阵分解模型。为同时利用上述两种相似性,本文将进一步提出一个集成推荐模型,通过上述模型实现对用户与移动应用之间关联的预测。本文在真实的移动应用数据集上进行了实验,并将所提出的模型与已有的代表性方法进行了比较。实验结果表明,本文提出的框架在所有情形中都产生了最佳性能,在面对冷启动问题时也能够得出良好的预测结果。
同时本文实现了一个基于流式数据处理框架的移动应用推荐数据集成平台,该系统在各个异构数据源之间传输并处理移动应用的使用数据,基于大数据处理、数据采集等技术,解决异构数据源之间的连通问题,最终完成移动应用推荐任务。在系统设计实现方面,本文设计了系统架构并对各个功能模块进行设计与实现。具体地,采用微服务框架设计系统整体架构,以方便功能扩展;使用流式数据处理框架完成移动应用推荐任务,同时从源数据源中抽取数据、处理数据并将其加载至目标数据源;根据数据集成任务和移动应用推荐任务的实际需求设计了数据库中的数据存储方案。最后,本文将该系统部署到运行环境中,对系统的主要功能设计测试用例并在运行环境中完成系统功能性测试。同时,对数据传输的性能以及任务并行处理的规模进行了测试,测试结果表明本系统全面完成了既定需求。