社区微信群开通啦,扫一扫抢先加入社区官方微信群
社区微信群
https://code.fb.com/core-data/recommending-items-to-more-than-a-billion-people/
Recommending items to more than a billion people
网络上数据的增长使得在完整数据集上使用许多机器学习算法变得更加困难。特别是对于个性化问题,数据采样通常不是一种选择,因此有必要创新分布式算法设计,以便我们可以扩展到这些不断增长的数据集。
协同过滤(CF)是重要的应用领域之一。 CF是一种推荐的系统技术,可帮助人们发现与其最相关的项目。在Facebook上,这可能包括页面,群组,活动,游戏等。 CF基于这样的想法,即最佳推荐来自具有相似品味的人。换句话说,它使用志同道合的人的历史项目评级来预测某人如何评估项目。
CF和Facebook规模
Facebook的CF平均数据集拥有1000亿个评级,超过10亿用户和数百万个项目。相比之下,着名的Netflix Prize推荐竞赛包含一个拥有1亿个评级,480,000个用户和17,770个电影(项目)的大型工业数据集。从那以后,该领域有了更多的发展,但我们读到的最大数量至少比我们处理的数字小两个数量级。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!