v5.355.2842 PC版
v2.514 最新版
v7.229.9719.326300 安卓漢化版
v4.947.5225.430340 安卓免費版
v9.196.1605.558866 安卓版
v5.208 PC版
v7.984.3753.777718 最新版
v5.146.1635.791783 最新版
v4.478.9161.644996 PC版
v1.258.4845 PC版
v7.806.7981.375243 IOS版
v3.98.1422.705072 安卓版
v3.714.3834.587429 安卓免費版
v3.737.2019 安卓版
v7.947.4224 安卓版
v2.694.5645.566246 PC版
v5.658.6890 安卓漢化版
v2.774.1560 安卓版
v6.810.1589 IOS版
v7.487.4519 最新版
v2.32.7481.17265 最新版
v6.429.1868.572689 PC版
v3.412.5202 安卓漢化版
v5.458.1528 安卓最新版
v5.868.6860 安卓免費版
v2.142.8077.111811 安卓漢化版
v7.168.7707.172147 安卓版
v3.616.6199.510644 安卓免費版
v6.536 最新版
v4.546.650 PC版
v1.93.6092.466224 安卓版
v3.835.6036.395509 最新版
v6.140.3981.550000 安卓漢化版
v2.618 PC版
v1.943.6605 PC版
v2.892.4004.32806 安卓免費版
v8.231.3527.877054 安卓版
v5.301.8581.768510 PC版
v2.693.5855.674065 最新版
v4.347.9630.695587 安卓版
v9.12.8743 安卓漢化版
v9.215.3355 安卓免費版
v7.716.4636 PC版
v6.40 安卓漢化版
v8.677.4684.804844 安卓版
v9.466.1200.85048 安卓免費版
v3.895.7015.246053 安卓漢化版
v4.851 最新版
v4.195.2503.835696 IOS版
v3.729.7838 安卓最新版
v7.560.9424.763336 安卓最新版
v8.627.1584.245310 安卓版
v5.992.5547 安卓免費版
v9.102.1561.400520 安卓漢化版
v1.965.6952.19965 安卓漢化版
v7.46.1521 安卓版
v9.88 IOS版
v6.333 IOS版
v6.147.5775.307590 PC版
v6.52.893 最新版
v9.946.3887.923041 安卓最新版
v4.87.2671.313216 IOS版
v8.369.6056.910096 安卓版
v4.372 最新版
v3.634.2770.410639 安卓漢化版
v5.329.8045.850556 最新版
v4.161.7404.656280 IOS版
v5.742.6002.316467 安卓版
v3.842 安卓版
v6.86.1312 PC版
v4.440.7969.61420 安卓最新版
v2.905.6606.33001 最新版
v3.273.8370.613630 PC版
v2.305.9288.19648 IOS版
v2.591.5157.410805 PC版
v3.546.7419 安卓免費版
v1.251 安卓漢化版
v6.875.8400.564156 安卓最新版
v1.298 最新版
v8.644.5890.45280 安卓版
中文字幕丝袜无码有码在线
天天,推荐系统都在捕获我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的明确上,推断用户喜欢哪类视频、哪种话题,善于在「内容层」识别用户喜欢什么,却很少真正明确「你是谁」。
快手消耗战略算法团队注重到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」。为填补这一缺失的建模角度,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其以是然」。
该研究效果已被 NeurIPS 2025 吸收,相关代码与实验框架已周全开源,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论。
论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF
配景和念头
用户明确:A Missing Formulation
图 2
当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示,headset-symphonist-violin 的关联关系,实则泉源于「交响乐手」这一用户角色;在电阛阓景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的古板隐式建模,引入user role视角让推荐系统得以更清晰地明确用户,从而迈向显式的可诠释推荐演进。
另一方面,当需要建模 topic-topic 关联时,自己可以将其看成 topic-role-topic 关联的效果图。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力。这种通用的协偕行为建模,不但能捕获那些统计要领难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。
并且,团队还通过实验发明,基于 user role 的建模在统计意义上优于古板的 topic 建模,不但具备更稳固的空间,也能带来更显著的推荐效果提升。
综上所述,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑纪律。
注:文章后续形貌中 user tag = user role = 用户特征,item tag = item topic = 兴趣点。
两个新使命
除了古板的推荐使命外,本研究借鉴 topic modeling 的思绪,为推荐系统拓展出两个新使命:
用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁)。
用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子使命:
I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料。
图3
解决计划
?樯杓
图4 - TagCF 主要功效?
TagCF 主要包括如下三个?椋
基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后),使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义,从而自动天生响应的 item tag 与 user tag,并实时更新标签库。
图5
基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图。详细的,凭证给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag。
图6
赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式)。为了包管建?占涞囊恢滦,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强,对应的计划为TagCF-it和TagCF-ut。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强。
注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁徙能力,未来可以为其他相关营业(如电商和搜索)赋能。
挑战和工程计划
实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等。
为相识决上述问题,文章提出了几个有用的解决计划并在线上落地:
构建弱重叠高频 tag 子集,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其历程相近,详细流程如下:
履历上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳固性和通用性,有利于种种下游链路的研发。
对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子,以便对 tag 举行细腻排序,对应的蒸馏模子后续在推荐历程中也会被重复使用。
人工大模子比照验证:接纳经典的 Good-Same-Bad 战略,从准确率、完整度、合理性和可读性等多个维度举行了人工评测。效果显示,该要领在效果上已能知足工业级应用需求,整体体现与GPT-4o靠近。
显式茧房建模和突破
基于上述三个?,TagCF-it 模子延续兴趣点建模思绪,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘。至此,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐。
详细的,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散,获得茧房外的 tag 荟萃,记为 T(1)。下图为示例:
可以显式控制的两种预预战略:
TagCF-util:仅使用T(0),维持茧房内特征,注重提升准确度。TagCF-expl:使用T(0)和T(1)的并集,突破茧房并举行相关新特征探索,注重提升多样性。
实验
离线实验
主实验在快手的 industrial 离线数据集上首先获得验证。
NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标。
实验结论:
TagCF 能有用增强 backbone 模子推荐效果。
提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐),且仍然能够提升对应 backbone 的效果。
两种 TagCF 变体泛起出差别的行为特征,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性。
三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯。
线上实验
在研究中,团队举行了线上重排阶段的模子增强实验,其详细的 workflow 如下图:
团队举行了模子增强、训练增强和预估打分增强,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl。
在实验中,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037%。
别的,团队还视察到,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果。这些优势意味着,相比兴趣点,用户角色是越发稳固的特征,越发适于推荐系统中的建模和剖析。
总结和思索
快手团队从推荐系统的「双端视角」出发,首次提出「视频明确与用户明确并重」的理念,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势。推荐系统的目的历来不但是「推荐内容」,它更关乎明确人(微观)与社会(宏观)的科学。
基于这一理念,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分。tag-logic 内容明确中台具备强盛的可迁徙能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多营业场景;另一方面,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿。
推荐系统与大模子的连系,正在让内容分发进入一个全新的阶段。
它能更智慧地明确用户、更精准地匹配内容,也带来了关于隐私、清静与公正的新思索。未来,团队将继续完善 tag-logic 中台系统,探索更高效的推理与资源使用方法。
恒久以来,行业主要深耕于统计模子建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果。而本文提出的显式用户明确与 tag-logic 建模要领,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间。
更主要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,睁开有逻辑的语义探索——既坚持精准,又敢于突破。怎样在「准确」与「多样」之间找到平衡,正是推荐系统进化的要害命题。从「懂内容」到「懂人」,TagCF 的探索不但是手艺的一次跃迁,更是手艺贴近真实的人与社会的具象体现。
参考文献:
[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.
[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024
[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).
[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).
相关版本
多平台下载
审查所有0条谈论>网友谈论