我的好妈妈韩剧,界面清爽、功能强大,专为极致体验而生

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-04 06:56:08
泉源:

猫眼影戏

作者:

邱琳娜

手机审查

  猫眼影戏记者 哈利法塔 报道Q8X2R7L1T4J5M9B6W3

天天 ,推荐系统都在捕获我们的兴趣与偏好 。从刷过的视频到停留的直播间 ,算法总是聚焦在「内容」的明确上 ,推断用户喜欢哪类视频、哪种话题 ,善于在「内容层」识别用户喜欢什么 ,却很少真正明确「你是谁」 。

快手消耗战略算法团队注重到了这一问题 ,他们想让推荐系统不止「会猜」 ,而是「懂你」 。为填补这一缺失的建模角度 ,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学 ,提出了 TagCF 框架 ,让推荐系统从「知其然」迈向「知其以是然」 。

该研究效果已被 NeurIPS 2025 吸收 ,相关代码与实验框架已周全开源 ,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论 。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时 ,这种关联背后往往隐藏着用户角色这一「混杂因素」 。如图2 所示 ,headset-symphonist-violin 的关联关系 ,实则泉源于「交响乐手」这一用户角色;在电阛阓景中 ,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点 。相比基于 ID 的古板隐式建模 ,引入user role视角让推荐系统得以更清晰地明确用户 ,从而迈向显式的可诠释推荐演进 。

另一方面 ,当需要建模 topic-topic 关联时 ,自己可以将其看成 topic-role-topic 关联的效果图 。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力 。这种通用的协偕行为建模 ,不但能捕获那些统计要领难以识别的弱交互 ,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证) 。

并且 ,团队还通过实验发明 ,基于 user role 的建模在统计意义上优于古板的 topic 建模 ,不但具备更稳固的空间 ,也能带来更显著的推荐效果提升 。

综上所述 ,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据 ,学习到用户是一个什么样的人 ,并找到涉及用户角色的通用的原则性的客观逻辑纪律 。

注:文章后续形貌中 user tag = user role = 用户特征 ,item tag = item topic = 兴趣点 。

两个新使命

除了古板的推荐使命外 ,本研究借鉴 topic modeling 的思绪 ,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁) 。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3) ,可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户 。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料 。

图3

解决计划

?樯杓

图4 - TagCF 主要功效?

TagCF 主要包括如下三个?椋

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后) ,使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding ,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义 ,从而自动天生响应的 item tag 与 user tag ,并实时更新标签库 。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后 ,第二步就是构建 tag2tag 逻辑图 ,即 U2I 和 I2U 逻辑图 。详细的 ,凭证给定的起始 tag ,我们构建对应的逻辑推理 prompt(图6) ,并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag 。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后 ,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式 ,有别于 LLM-as-rec 范式) 。为了包管建?占涞囊恢滦 ,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强 ,对应的计划为TagCF-it和TagCF-ut 。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强 。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统 ,但其具有一定通用性 ,尤其行为逻辑图也被验证有一定迁徙能力 ,未来可以为其他相关营业(如电商和搜索)赋能 。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等 。

为相识决上述问题 ,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集 ,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集 ,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性 。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分 ,其历程相近 ,详细流程如下:

履历上 ,cover sets 在量级上为 7k-20k 不等 ,相比开放语义空间中的全集 ,cover sets 能够在 30 天内收敛 ,在工业场景下具有足够的稳固性和通用性 ,有利于种种下游链路的研发 。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子 ,以便对 tag 举行细腻排序 ,对应的蒸馏模子后续在推荐历程中也会被重复使用 。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略 ,从准确率、完整度、合理性和可读性等多个维度举行了人工评测 。效果显示 ,该要领在效果上已能知足工业级应用需求 ,整体体现与GPT-4o靠近 。

显式茧房建模和突破

基于上述三个? ,TagCF-it 模子延续兴趣点建模思绪 ,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘 。至此 ,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐 。

详细的 ,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃 ,记为 T(0) ,然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散 ,获得茧房外的 tag 荟萃 ,记为 T(1) 。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0) ,维持茧房内特征 ,注重提升准确度 。TagCF-expl:使用T(0)和T(1)的并集 ,突破茧房并举行相关新特征探索 ,注重提升多样性 。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证 。

NDCG 和 MRR 是推荐准确率指标 ,Cover 和 Gini 是多样性指标 。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果 。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图 ,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐) ,且仍然能够提升对应 backbone 的效果 。

两种 TagCF 变体泛起出差别的行为特征 ,TagCF-ut 整体准确率更好 ,TagCF-it 则更容易提升多样性 。

三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯 。

线上实验

在研究中 ,团队举行了线上重排阶段的模子增强实验 ,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强 ,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl 。

在实验中 ,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037% 。

别的 ,团队还视察到 ,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力 ,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果 。这些优势意味着 ,相比兴趣点 ,用户角色是越发稳固的特征 ,越发适于推荐系统中的建模和剖析 。

总结和思索

快手团队从推荐系统的「双端视角」出发 ,首次提出「视频明确与用户明确并重」的理念 ,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势 。推荐系统的目的历来不但是「推荐内容」 ,它更关乎明确人(微观)与社会(宏观)的科学 。

基于这一理念 ,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分 。tag-logic 内容明确中台具备强盛的可迁徙能力 ,其通用框架也可以在召回等其他链路阶段使用 ,未来可扩展至召回、电商、搜索等多营业场景;另一方面 ,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿 。

推荐系统与大模子的连系 ,正在让内容分发进入一个全新的阶段 。

它能更智慧地明确用户、更精准地匹配内容 ,也带来了关于隐私、清静与公正的新思索 。未来 ,团队将继续完善 tag-logic 中台系统 ,探索更高效的推理与资源使用方法 。

恒久以来 ,行业主要深耕于统计模子建模路径 ,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果 。而本文提出的显式用户明确与 tag-logic 建模要领 ,则在符号与统计两种范式之间搭起了桥梁 ,为行业带来了全新的想象空间 。

更主要的是 ,tag-logic 逻辑图让系统有能力从用户的信息茧房出发 ,睁开有逻辑的语义探索——既坚持精准 ,又敢于突破 。怎样在「准确」与「多样」之间找到平衡 ,正是推荐系统进化的要害命题 。从「懂内容」到「懂人」 ,TagCF 的探索不但是手艺的一次跃迁 ,更是手艺贴近真实的人与社会的具象体现 。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:另类专区欧美国产

??12月04日,西安北站内近百米高铁桥梁完成转身,

  先生们、同砚们 ,新的挑战在迎接着我们 ,未来的优美蓝图期待我们用勤劳和智慧去描绘 ,我衷心希望每一位先生、每一位同砚在以后的学习生涯中 ,用我们的实干精神、拼搏进取精神去创立腰陂中心小学的绚烂生长 。同砚们 ,只要你们做到青春无悔 ,不吝汗水 ,起劲耕作 ,受苦学习 ,就一定能铸就明天的绚烂 ,创立漂亮人生 ,就一定能成为学校明天的自满 。

,麻豆视频N号房导航总站 。

??12月04日,《黑神话:悟空》全球销量破千万套 巧译中华文化受好评,

  当春女人姗姗来迟的时间 ,万紫千红的花儿园中翘首;深树中的黄鹂无羁高歌……而人们却忘了绿遍山野的小草 。它默默无闻地站在绿化建设的第一线 ,没有树高 ,没有花香 。手挽手 ,迎风而立 ,为大地铺成一条无边无涯的绿毯 。一棵棵小草 ,是一个绿色精灵 ,心甘情愿地任人民临身而踏 ,不发一句呻吟 ,不作一点诉苦 。漫漫长夜里 ,不求相识;未知日子里 ,不求回报 ,它只是在墙角召唤着人类那颗已昏睡的心:请给天空一片蔚蓝;请给夏夜一阵蛙鸣;请给森林一曲鸟歌吧……

,www.黄色网站视频,精品免费一级污片,1024在线看电影基地 。

??时势2:久久久久免费毛A片免费

??12月04日,新疆兵团基层医务工作者李琳:37年扎根深山守护牧民健康,

  立异工厂将驻足信息工业最热门领域:即互联网、移动互联网和云盘算 ,选择相关手艺作为创业起点 。

,国产精品国产AV永久入口久久久,国产大屁股精品视频,国产精品欧美色图 。

??12月04日,“装修返租”真有那么好吗?小心上当,

  这群人不是许多 ,能有一百多号 ,但都是能征惯战之辈 ,尤其是几位头领 ,掌握有强盛的骨文秘力 。

,高贵人妻被强中文字幕久久,青草无码一区二区三区,国产一级a免费无码视频 。

??时势3:艹爆老婆视频

??12月04日,中外嘉宾共话世界城市可持续发展,

  四、既要增强师生相同 ,又要增强生生相同 。

,91精品国产无线乱码在线观看,91九色熟女,看AV的网页 。

??12月04日,重庆:四年内监测记录冬候鸟增加20种,

  “记着 ,只有二十天的时间 ,不然你们等着灭族吧!”一个头领喝道 ,此后用力抽了一鞭 。

,白咲碧的服装店三部曲,16sex,欧美日韩一区二区三区在线播放 。

??时势4:亚洲图片欧美一区二区在线

??12月04日,【小新的Vlog】“特种兵式”逛“博博会”:一日打卡400余家博物馆,

  狈村的族长狈里青尚有狩猎步队的头领狈山一起大叫 。

,国产淫网站,jizz中国 jizz,www com黄色网站在线观看 。

??12月04日,黑龙江省2024年旅游增量领跑全国,

  “姐姐好 ,我跟爷爷一起来的 。”小不点腼腆的笑着 ,虽然满脸污渍 ,破烂的兽皮衣上全是兽血 ,可是那双明亮的大眼 ,照旧能让人感受到他的纯粹与质朴 。

?第七章 梧木巢,91精选视频在线观看,美女裸体黄18以下禁止观看免费,影音先锋中文无码 。

责编:杨金志

审核:孟武斌

责编:宁江

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图