每天超50亿推广流量、3亿商品展现,阿里妈妈的推荐技术有多牛?
技术
作者: AI公开课
2021-01-13 07:03:02
[ 闻蜂导读 ] 推荐系统与流行 AI 技术的结合究竟对优化推荐效果起到了多大的作用?打破推荐系统领域瓶颈的突破口在哪里?怎样做,才能让推荐系统更好地服务用户?两大关键技术模块取得突破能不能听得真、辨得准,就是推荐技术的核心技能。阿里妈妈定向广告团队在推荐技术的两个关键模块上均取得了较大的突破:匹配召回技术(matching):在业界首创了第三代基于树结构的深度检索系

推荐系统与流行 AI 技术的结合究竟对优化推荐效果起到了多大的作用?打破推荐系统领域瓶颈的突破口在哪里?怎样做,才能让推荐系统更好地服务用户?两大关键技术模块取得突破能不能听得真、辨得准,就是推荐技术的核心技能。阿里妈妈定向广告团队在推荐技术的两个关键模块上均取得了较大的突破:匹配召回技术(matching):在业界首创了第三代基于树结构的深度检索系统 TDM[1]。相比于第一代基于统计规则的协同滤波,第二代基于向量化表达的全库检索,TDM 技术可以使用任意复杂高阶的深度学习模型计算 user 与 item 之间的关系,并且结合 tree-based 的高效索引结构、对全部 item 库进行全局最优匹配。得益于强大的模型能力,TDM 可以对用户进行深层次的理解与刻画,从而召回的结果在多样性、精准性等方面,相比前两代技术都有显著的提升。预估排序技术(ranking):阿里妈妈是业界最早一批全面构建、创新自研大规模端到端深度学习模型的团队,尤其是立足于电商场景、针对海量的用户行为数据,阿里妈妈持续发力用户兴趣建模技术,提出了深度兴趣网络 DIN[2]、用户兴趣演化网络 DIEN[3]、用户多兴趣轨道记忆网络 MIMN[4]、基于行为序贯特性的全空间多任务模型ESMM[5]等一系列业界领先的深度学习算法。这些建模算法极大地拓宽了业界对于点击率、转化率等推荐系统核心排序技术的认知,被业界各大公司的同行参考,并做了各种进一步的优化改进,形成了该领域的一个全新流派。传统推荐系统+AI技术,超百亿收入增量深度学习基础之上,强化学习则驱动了阿里妈妈的广告策略机制和智能调控算法的关键升级。构建在这些 AI 技术之上的业务算法,给阿里妈妈直接带来的收入增量超百亿。据统计,仅DIN/DIEN/MIMN/TDM 等论文中披露的数字显示,核心场景的点击率累计提升就超过 40%。 AutoML 技术的应用现状。他表示,根据阿里妈妈的经验和与业界同行的交流来看,类似在图像领域中直接通过 AutoML 技术搜索出更优模型结构并取得显著指标提升的可能性不大。不过,AutoML 技术可以用来进行模型精度与算力需求的联合优化,寻找精度不变情况下更低能耗的模型结构。虽然这种技术本身不会直接带来效果提升,但是由于它的助攻,使得离线模型算法的设计可以有更大的自由度,生产化落地有更多的保障手段。抗住工业级场景压力的“武器”不过,他认为真正决定整个技术体系构建成败的关键挑战,是由深度学习引发的新一代技术革新对算法、工程、数据、测试等传统技术工种的融合需求。工业级深度学习 2.0 时代接下来工业级深度学习将进入 2.0 时代,这个阶段面临的核心问题,是当前深度学习仍然跑在为上一代大规模机器学习模型需求而构建的系统架构之上,但过去的那套架构已经不太适合如今数据、算法和算力背后的需求。没有最理想的系统架构,只有适应当前算力、算法需求,协同发挥最大收益的合理架构。生产关系和生产力从来都是配对出现的。推荐系统的瓶颈一是模型跟随问题。数据挖掘领域经典的“啤酒与尿布”案例,在今天的推荐系统中同样存在,而且更加隐蔽和普遍。在构建推荐模型时,往往是基于系统收集的展现-反馈日志体系,同时挖掘用户近期的历史行为,进而训练模型,对未来的用户兴趣进行预测。这个体系乍看很合理,但深入思考后会发现,推荐模型大都时候是依据用户在系统中留下的蛛丝马迹做相应的判断,这种判断本质是在跟随用户的显式行为,或者很多时候我们称之为重定向。其中关键点在于对数据循环链路的掌控,不仅仅拟合数据分布,同时能够主动地扰动数据分布,结合算法设计,构建更具洞察与推理的推荐技术。二是集合展现问题。这与推荐系统的展现交互密切相关。目前有两类典型的交互方式,一类是淘宝、今日头条等以瀑布流式上下滑动的空间维度集合展现;一类是以抖音、快手等沉浸式左右滑动的时间维度集合展现。不论哪种模式,对于用户而言,会在短时间连续浏览到批量的内容结果。如果把用户的每一次浏览看成是其与推荐系统的一次对话,那么推荐系统在这种连续交互式对话上还处于处级阶段。理想中的推荐系统参考文献:好消息!AI ProCon 2019推荐系统技术专场迎来重磅嘉宾朱小强,花名怀人,毕业于清华大学,阿里资深算法专家,现任阿里妈妈深度学习算法平台负责人、兼任定向广告&信息流广告排序技术团队负责人。他主持了三代核心算法架构(大规模、深度端到端、深度实时化)的设计和落地,驱动了深度学习对阿里广告技术的全面变革与创新,领导了阿里开源深度学习框架X-DeepLearning从0到1的自研、从1到开源演进的全过程,在KDD、AAAI、SIGIR等顶级会议上发表过DIN/DIEN/ESMM等多篇有影响力的工业实战论文,是workshop DLP-KDD 2019的发起人和联合主席。京东集团高级总监殷大伟、快手科技推荐架构负责人任恺和华为诺亚方舟实验室推荐与搜索项目组资深研究员唐睿明,分享推荐系统在电商、短视频等领域的应用和实践。论坛日程如下:扫码或点击AI 开发者大会,了解更多嘉宾和大会信息

相关文章

  • 验证码: 看不清?点击更换 看不清? 点击更换
  • 意见反馈
    意见反馈
    返回顶部
    Google 必应 Facebook YouTube Twitter Tumblr Flickr 4 ebay SSENSE Shopbop Ashford