(7秒核心解读)中文字幕 有限公司 视频一区电脑版v28.52.98.39.79.239-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-04 04:57:23
泉源:

猫眼影戏

作者:

郭粤梅

手机审查

  猫眼影戏记者 林文龙 报道Q8X2R7L1T4J5M9B6W3

天天,推荐系统都在捕获我们的兴趣与偏好 。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的明确上,推断用户喜欢哪类视频、哪种话题,善于在「内容层」识别用户喜欢什么,却很少真正明确「你是谁」 。

快手消耗战略算法团队注重到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」 。为填补这一缺失的建模角度,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其以是然」 。

该研究效果已被 NeurIPS 2025 吸收,相关代码与实验框架已周全开源,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论 。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」 。如图2 所示,headset-symphonist-violin 的关联关系,实则泉源于「交响乐手」这一用户角色;在电阛阓景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点 。相比基于 ID 的古板隐式建模,引入user role视角让推荐系统得以更清晰地明确用户,从而迈向显式的可诠释推荐演进 。

另一方面,当需要建模 topic-topic 关联时,自己可以将其看成 topic-role-topic 关联的效果图 。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力 。这种通用的协偕行为建模,不但能捕获那些统计要领难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证) 。

并且,团队还通过实验发明,基于 user role 的建模在统计意义上优于古板的 topic 建模,不但具备更稳固的空间,也能带来更显著的推荐效果提升 。

综上所述,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑纪律 。

注:文章后续形貌中 user tag = user role = 用户特征,item tag = item topic = 兴趣点 。

两个新使命

除了古板的推荐使命外,本研究借鉴 topic modeling 的思绪,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁) 。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户 。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料 。

图3

解决计划

?樯杓

图4 - TagCF 主要功效?

TagCF 主要包括如下三个?椋

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后),使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义,从而自动天生响应的 item tag 与 user tag,并实时更新标签库 。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图 。详细的,凭证给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag 。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式) 。为了包管建?占涞囊恢滦,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强,对应的计划为TagCF-it和TagCF-ut 。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强 。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁徙能力,未来可以为其他相关营业(如电商和搜索)赋能 。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等 。

为相识决上述问题,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性 。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其历程相近,详细流程如下:

履历上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳固性和通用性,有利于种种下游链路的研发 。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子,以便对 tag 举行细腻排序,对应的蒸馏模子后续在推荐历程中也会被重复使用 。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略,从准确率、完整度、合理性和可读性等多个维度举行了人工评测 。效果显示,该要领在效果上已能知足工业级应用需求,整体体现与GPT-4o靠近 。

显式茧房建模和突破

基于上述三个?,TagCF-it 模子延续兴趣点建模思绪,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘 。至此,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐 。

详细的,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散,获得茧房外的 tag 荟萃,记为 T(1) 。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0),维持茧房内特征,注重提升准确度 。TagCF-expl:使用T(0)和T(1)的并集,突破茧房并举行相关新特征探索,注重提升多样性 。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证 。

NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标 。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果 。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐),且仍然能够提升对应 backbone 的效果 。

两种 TagCF 变体泛起出差别的行为特征,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性 。

三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯 。

线上实验

在研究中,团队举行了线上重排阶段的模子增强实验,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl 。

在实验中,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037% 。

别的,团队还视察到,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果 。这些优势意味着,相比兴趣点,用户角色是越发稳固的特征,越发适于推荐系统中的建模和剖析 。

总结和思索

快手团队从推荐系统的「双端视角」出发,首次提出「视频明确与用户明确并重」的理念,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势 。推荐系统的目的历来不但是「推荐内容」,它更关乎明确人(微观)与社会(宏观)的科学 。

基于这一理念,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分 。tag-logic 内容明确中台具备强盛的可迁徙能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多营业场景;另一方面,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿 。

推荐系统与大模子的连系,正在让内容分发进入一个全新的阶段 。

它能更智慧地明确用户、更精准地匹配内容,也带来了关于隐私、清静与公正的新思索 。未来,团队将继续完善 tag-logic 中台系统,探索更高效的推理与资源使用方法 。

恒久以来,行业主要深耕于统计模子建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果 。而本文提出的显式用户明确与 tag-logic 建模要领,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间 。

更主要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,睁开有逻辑的语义探索——既坚持精准,又敢于突破 。怎样在「准确」与「多样」之间找到平衡,正是推荐系统进化的要害命题 。从「懂内容」到「懂人」,TagCF 的探索不但是手艺的一次跃迁,更是手艺贴近真实的人与社会的具象体现 。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:www.日本黄色.com

??12月04日,广西贵港:网传教师对待学生粗暴 已对涉事教师停课处理,

  “滚开!”蛟鹏狂傲,眸光酷寒,以铁箭瞄准了石昊,将弓拉满,直指他的哽嗓咽喉 。

,就去吻狠狠的干 。

??12月04日,镜观·回响|当好国家粮食稳产保供“压舱石”,

  回首我国黄金市场,已往的一切已经成为了历史,无论是乐成的履历,照旧波折的教训,都已成为我们的参照、沉淀与积累延续的财产,而现在的金耘百得,我们已有了自己的企业文化、生长战略、谋划宗旨、谋划理念、人才步队和有用的运行机制,即,金耘百得已有了却实的灵魂和体魄,及一份自信 。

,大黄片com,美绝警母全文阅读免费,欧美人牲交免费黄色一级片爱情就爱 。

??时势2:毛片盗摄系列

??12月04日,赏民俗“嗨”电音泡温泉 青海金银滩草原开启欢乐冬游模式,  别的,范鸿达教授以为,“神秘且极具吸引力”的中东将吸引越来越多的中国游客 。他说:“有经济实力出境游的中国游客,可能已经去过美国和欧洲许多次了,以是中东显然是下一个对他们有吸引力的目的地 。”,欧美a∨欧美伦妇高潮,性爱a爱网站,美女黄视频三级片A片AA 。

??12月04日,波兰外交部:俄罗斯驻波兹南总领馆须在11月30日前关闭,

  亲爱的同砚们,伸出你的手,伸出我的手,让我们一起播种绿色,让我们一起宣传绿色建议,让大地妈妈拥有更多的绿色吧

,伊蕾娜本子,国产夜色快憣免费完整片,52av 。

??时势3:日韩中文字幕一区二区

??12月04日,秦国文同志任湖南省委常委、秘书长,

  3、加入冬季磨炼,要有循序渐进的历程,更要有顽强的毅力、持之以恒的精神,才华收到优异的效果,切不可“三天捕鱼,两天晒网” 。

,人人做人人爱人人操人人摸,超碰520,欧美精品刺激A片一区二区三区 。

??12月04日,【国际熊猫日特刊】被“圆滚滚”萌晕了!国宝表情包大合集来啦,

  中银富登村镇银行是中国银行与其战略投资者新加坡淡马锡公司旗下富登金融控股公司合资设立的,中国银行是中国国际化和多元化水平最高的银行,列全球1000家大银行第十八位,居亚洲和海内银行第三位 。淡马锡是亚洲主要的金融业投资者,是由新加坡财务部认真羁系的一家控股公司,总资产凌驾420亿美元 。中银富登村镇银行现在主要效劳工具是中小企业、微型企业、小我私家客户和农户,是海内村镇银行全新的运行模式,是天下第二家,山东省第一家 。

,欧美性爱在线白白播放,在线播放视频无码,小鸟酱挑战36厘米尾巴隐藏关卡怎么过 。

??时势4:成人深夜美女

??12月04日,“能源新都”庆阳建陇东能源化工基地,

  狈村的人焦虑,张弓巨弓,就要压上来解救,由于在这样下去狈风不残也得废了,别指望一个天才崛起了 。

,色色色A片一级色色,黄色网站免费,美妇妈妈跪趴吞精全集 。

??12月04日,藏族姑娘线上“吸粉引流”助力边境旅游,且看新时代守边人:恩嘎儿返乡创业记,  记者视察发明,受商业利益驱使,一些研学机构会将大凉山的孩子包装为“追求支教先生的学生”,并借此推出“7天收费万元就能拿到自愿者公益证书、墟落助学研学报告”的研学项目 。,欧美福利片之麻豆国产,伊人一级黄色视频,把我的香蕉伸进美女的桃子 。

责编:宋长士

审核:郑稳棠

责编:盛欢

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图