X平台新算法揭秘:点赞价值骤降,互动行为权重飙升150倍

Wendy4天前
X 新算法曝光:点赞几乎不值钱,这个行为价值翻 150 倍

原文作者:David,深潮 TechFlow

1月20日下午,X平台开源了其新版推荐算法。

Musk在回复中表示:「我们知道这算法很蠢,还需要大改,但至少你能看到我们在实时挣扎着改进。别的社交平台不敢这么干。」

image

这句话有两层含义:一是承认算法存在问题,二是将「透明性」作为卖点。

这是X平台第二次开源算法。2023年那版代码三年未更新,早已与实际系统脱节。此次完全重写,核心模型从传统机器学习替换为Grok transformer,官方称「彻底消除了手工特征工程」。

简单来说:以前的算法依赖工程师手动调参,现在AI直接根据用户的互动历史决定内容推送。

对内容创作者而言,这意味着过去那些「最佳发帖时间」「热门标签涨粉」的玄学可能失效了。

我们查阅了开源的Github仓库,在AI辅助下发现代码中隐藏了一些关键逻辑,值得深入探讨。

算法逻辑变化:从手工定义到AI自动判断

先明确新旧版本的区别,否则后续讨论容易混淆。

2023年开源的版本名为Heavy Ranker,本质上是传统机器学习。工程师需要手动定义数百个「特征」:帖子是否有图片、发帖人粉丝数量、发布时间距离当前多久、是否包含链接等。

然后为每个特征分配权重,反复调整以找到效果最佳的组合。

此次开源的新版本名为Phoenix,架构完全不同,可以理解为更加依赖AI大模型的算法,核心采用Grok的transformer模型,与ChatGPT、Claude等使用的技术类似。

官方README文档中明确写道:「We have eliminated every single hand-engineered feature。」

传统的手工提取内容特征规则被彻底摒弃。

那么,现在的算法如何判断内容的好坏?

答案是行为序列。你过去点赞过什么、回复过谁、在哪些帖子上停留超过两分钟、屏蔽过哪类账号,Phoenix将这些行为输入transformer,让模型自行学习规律并总结。

image

做个比喻:旧算法像一张人工编写的评分表,每项打勾算分;

新算法则像一个看过你所有浏览记录的AI,直接预测你下一秒想看什么。

对创作者而言,这意味着两点:

第一,过去那些「最佳发帖时间」「黄金标签」的技巧参考价值降低。因为模型不再关注这些固定特征,而是每个用户的个人偏好。

第二,你的内容能否被推送,越来越取决于「看到内容的人会如何反应」。这种反应被量化为15种行为预测,我们将在下一章详细说明。

算法预测你的15种反应

Phoenix获取一条待推荐的帖子后,会预测当前用户看到这条内容可能产生的15种行为:

  1. 正向行为:如点赞、回复、转发、引用转发、点击帖子、点击作者主页、看完一半以上视频、展开图片、分享、停留超过一定时长、关注作者
  2. 负向行为:如点击「不感兴趣」、屏蔽作者、静音作者、举报

每种行为对应一个预测概率。例如,模型判断你有60%的概率点赞这条帖子、5%的概率屏蔽这个作者等。

接着,算法做一件简单的事:将这些概率乘以各自的权重,加总得到一个总分。

image

公式如下:

Final Score = Σ ( weight × P(action) )

正向行为的权重为正数,负向行为的权重为负数。

总分高的帖子排在前面,低的沉下去。

跳出公式来看,说白了就是:

现在内容的好坏,真的不由内容本身的质量决定(当然可读性和利他性仍是传播的基础),而是更多取决于「这条内容会让你做出什么反应」。算法不在乎帖子本身的质量,只在乎你的行为。

按此逻辑,极端情况下,一条低俗但让人忍不住回复吐槽的帖子,得分可能比一条优质但无人互动的帖子更高。这套系统的底层逻辑或许正是如此。

不过,新开源版本的算法并未公开具体行为权重的数值,但2023年的版本曾公开过。

旧版参考:一次举报 = 738次点赞

接下来我们可以分析2023年的那组数据,虽然是旧的,但能帮助理解各种行为在算法眼中的「价值」差异。

2023年4月5日,X确实在GitHub上公开过一组权重数据。

直接看数字:

image

翻译得更直白一些:

X平台新算法揭秘:点赞价值骤降,互动行为权重飙升150倍

数据来源:旧版 GitHub twitter/the-algorithm-ml 仓库,点击可查看原算法

几个数字值得关注。

第一,点赞几乎不值钱。 权重仅为0.5,是所有正向行为中最低的。在算法眼中,一个点赞的价值约等于零。

第二,对话互动才是硬通货。 「你回复,作者又回复你」的权重为75,是点赞的150倍。算法最希望看到的不是单向的赞,而是来回的对话。

第三,负向反馈代价极高。 一次屏蔽或静音(-74)需要148次点赞才能抵消。一次举报(-369)需要738次点赞。而且这些负分会累积到你的账号信誉分中,影响后续所有帖子的分发。

第四,视频完播率权重低得离谱。 仅为0.005,几乎可以忽略。这与抖音、TikTok形成鲜明对比,后者将完播率视为核心指标。

官方在同一份文件中也提到:「The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics.」

权重随时可能调整,并且确实调整过。

新版本未公开具体数值,但README中的逻辑框架相同:正向加分,负向扣分,加权求和。

具体数字可能变了,但量级关系大概率仍在。回复别人的评论,比收到100个赞更有用。让人想屏蔽你,比没人互动更糟糕。

知道这些后,我们创作者能做什么

分析完X平台的新旧算法代码,结合来看,提炼几条可操作的结论。

1.回复你的评论者。 权重表中「作者回复评论者」是最高分项(+75),比用户单方面点赞高150倍。不是让你去求评论,而是有人评论了就回。哪怕回一句「谢谢」,算法也会记一笔。

2.别让人想划走。 一次屏蔽的负面影响需要148次点赞才能抵消。争议内容确实容易引发互动,但如果互动方式是「这人烦死了,屏蔽」,你的账号信誉分会持续受损,影响后续所有帖子的分发。争议流量是双刃剑,砍别人之前先砍自己。

3.外链放评论区。 算法不想把用户导出站外。正文带链接会被降权,这点Musk自己公开说过。想导流的话,正文写内容,链接放在第一条评论。

4.别刷屏。 新版代码中有个Author Diversity Scorer,作用是对同一作者连续出现的帖子降权。设计意图是让用户的feed更加多样化,副作用是你连发十条不如精发一条。

6.没有「最佳发帖时间」了。 旧版算法有「发布时间」这个人工特征,新版直接砍掉了。Phoenix只看用户行为序列,不看帖子是几点发的。那些「周二下午三点发帖效果最好」的攻略,参考价值越来越低。

以上是从代码层面解读出的内容。

还有一些加分减分项来自X平台的公开文档,不在这次开源的仓库中:蓝标认证有加成、全大写会被降权、敏感内容触发80%触达率削减。这些规则未开源,就不展开了。

总结来看,这次开源的内容相当实在。

完整的系统架构、候选内容的召回逻辑、排序打分的流程、各种过滤器的实现。代码主要是Rust和Python,结构清晰,README比许多商业项目都详细。

但有几样关键内容未公开。

1.权重参数未公开。 代码中只写了「正向行为加分,负向行为扣分」,具体点赞值多少分、屏蔽扣多少分,未说明。2023年那版至少公开了数字,这次只给了公式框架。

2.模型权重未公开。 Phoenix使用的是Grok transformer,但模型本身的参数未公开。你能看到模型如何被调用,看不到模型内部如何计算。

3.训练数据未公开。 模型是用什么数据训练的、用户行为如何采样、正负样本如何构造,均未提及。

打个比方,这次开源相当于告诉你「我们用加权求和算总分」,但没告诉你权重是多少;告诉你「我们用transformer预测行为概率」,但没告诉你transformer内部是什么样子。

横向比较的话,TikTok和Instagram连这些都没公开过。X平台此次开源的信息量,确实比其他主流平台多。只是离「完全透明」还有距离。

这并不是说开源没有价值。对创作者和研究者而言,能看到代码总比看不到强。

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场