奈飞公司的创新的大数据推荐算法

如题所述

第一个Netflix大奖成功的解决了一个巨大的挑战,为提供了50个以上评级的观众准确的预测他们的口味。下一个百万大奖目标是,为那些不经常做影片评级或者根本不做评级的顾客推荐影片,要求使用一些隐藏着观众口味的地理数据和行为数据来进行预测。同样,获胜者需要公开他们的算法。如果能解决这个问题,Netflix就能够很快开始向新客户推荐影片,而不需要等待客户提供大量的评级数据后才能做出推荐。
新的比赛用数据集有1亿条数据,包括评级数据,顾客年龄,性别,居住地区邮编,和以前观看过的影片。所有的数据都是匿名的,没有办法关联到netflix的任何一个顾客。
与第一个大奖赛不同,这次比赛没有设定比赛目标。50万美金首先奖励给6个月内取得领先的团队,另外50万美金奖励给18个月后取得领先的团队。
推荐引擎是Netflix公司的一个关键服务,1千多万顾客都能在一个个性化网页上对影片做出1-5的评级。Netflix将这些评级放在一个巨大的数据集里,该数据集容量超过了30亿条。Netflix使用推荐算法和软件来标识具有相似品味的观众对影片可能做出的评级。两年来,Netflix 已经使用参赛选手的方法提高了影片推荐的效率,这已经得到了很多影片评论家和用户的好评。
Strands推荐引擎的首席科学家里克·汉加特纳博士写道:“在短期内,搜索引擎将会越来越多地加入简单的推荐技术,以处理接近的查询词(例如,“您要找的是这个,根据类似查询/其他人的搜索,你可能要寻找的是这个。”)但从长期来说,而比起搜索行业和搜索技术,推荐技术会更加地无孔不入。”

温馨提示:答案为网友推荐,仅供参考
相似回答