分类 杂七八糟 下的文章

X(原Twitter)本次开源算法总结(基于 xai-org/x-algorithm 仓库)

本次开源的仓库(https://github.com/xai-org/x-algorithm)是 X 平台 For You 时间线(推荐饲料)的全新推荐算法,由 xAI 主导开源。核心变化是:彻底放弃了旧版算法中的手工艺特征(hand-engineered features)和各种人工启发式规则(heuristics),转而完全依赖 基于 Grok 模型的 Transformer(Phoenix 组件)进行端到端学习和排名。

算法整体流程:

  • 候选来源:In-Network(关注的人,Thunder 来源) + Out-of-Network(全局推荐,Phoenix 检索)。
  • 模型直接从用户历史互动序列中学习相关性,预测多种用户行为概率。
  • 最终分数通过 加权求和 计算得出,再施加多样性和 OON(Out-of-Network)调整。
  • 多层过滤确保内容质量。

关键点:具体数值权重未开源
与 2023 年旧版 Twitter 开源算法(twitter/the-algorithm)不同,本次 没有公开任何硬编码的数值权重或乘数(如旧版的 LikeWeight = 30、RetweetWeight = 100、Real Graph 权重 0.85 等)。官方明确表示:所有相关性由 Grok-based Transformer 直接学习,加权求和中的具体 weight_i 值属于保密部分,未在代码或文档中披露。

有效权重/因素详细罗列(所有实际影响排名的组件)

以下是算法中明确提及的、实际生效的权重、信号和调整因素(来自 README 和核心组件描述)。它们是当前算法中“有效”的部分,按管道阶段分类列出:

1. 核心排名信号:Engagement Probability Predictions(Phoenix Transformer 输出)

模型为每个候选推文预测以下 15 种用户行为概率(这些概率是排名的核心基础):

  • 正面行为(赋予正权重)

    • P(favorite) → 点赞(Like)
    • P(reply) → 回复
    • P(repost) → 转发(Retweet)
    • P(quote) → 引用
    • P(click) → 点击推文
    • P(profile_click) → 点击作者资料
    • P(video_view) → 观看视频
    • P(photo_expand) → 展开图片
    • P(share) → 分享
    • P(dwell) → 长时间停留
    • P(follow_author) → 关注作者
  • 负面行为(赋予负权重)

    • P(not_interested) → 不感兴趣
    • P(block_author) → 拉黑作者
    • P(mute_author) → 静音作者
    • P(report) → 举报

生效方式:这些概率直接决定了推文的“相关性”。正面行为概率越高,分数越高;负面行为概率越高,分数越低。

2. 加权求和(Weighted Scorer)—— 最核心的有效权重

最终分数计算公式:

Final Score = Σ (weight_i × P(action_i))
  • 正权重:应用于上述 11 种正面行为(具体数值保密)。
  • 负权重:应用于 4 种负面行为(具体数值保密,作用是惩罚可能让用户反感的内容)。
  • 生效阶段:Phoenix Scorer 之后,直接决定排序基础分数。
  • 说明:这是算法中最主要的“权重”部分,但 exact weight 值未公开,被视为商业机密。

3. 作者多样性调整(Author Diversity Scorer)

  • 作用:对同一作者的重复出现进行 分数衰减(attenuation),防止饲料被少数账号霸屏。
  • 生效阶段:加权求和之后、最终选择之前。
  • 有效性:强制提升内容多样性,是当前算法中少数明确的“后处理权重调整”之一(无具体衰减系数公开)。

4. Out-of-Network 调整(OON Scorer)

  • 作用:专门针对非关注来源(Out-of-Network)的内容进行 分数调整(可能提升或衰减,以平衡关注内/外内容比例)。
  • 生效阶段:评分阶段,与 Weighted Scorer 并行。
  • 有效性:确保推荐饲料不完全被关注列表主导(无具体调整公式公开)。

5. 过滤器(Filters)—— 间接影响“有效权重”(二元筛选,非数值权重)

这些不是传统权重,但会直接决定推文是否能进入排名(相当于权重为 0 或 1):

  • 预评分过滤(Pre-Scoring Filters):去除重复、太老、自推、已见、被屏蔽作者、付费墙等。
  • 后选择过滤(Post-Selection Filters):去除违规、spam、暴力、已删除内容,并对对话线程去重。
  • 生效性:任何被过滤掉的推文分数直接归零,无法上饲料。

总体结论

  • 本次开源的核心创新:完全 ML 驱动(Grok Transformer),没有旧版那种明确的手工权重(如 Real Graph 概率、Trust & Dignity 分数、Social Proof 等)
  • 真正“有效”的权重:主要是 15 种行为概率的 保密加权求和,加上作者多样性和 OON 调整。
  • 没有公开的具体数值:官方只开源了架构、模型结构和概率列表,实际权重值仍保密(社区分析也普遍认为这是“secret”部分)。
  • 如果你想对比旧版(2023 年),旧版有大量硬编码权重(如点赞 30 分、转发 100 分等),但本次已全部移除,转为纯模型学习。

X(原推特)是允许发布成人视频的,但有严格的规则和限制。

根据 X 官方成人内容政策:

  • 允许用户发布自愿生产和分发的成人内容,包括裸露或性行为的视频(涵盖真人、AI 生成、动画如 hentai 等)。
  • 必须正确标记:上传时需要添加内容警告(敏感媒体标签),否则可能被系统自动调整设置、移除内容或限制账号。未标记的内容容易被举报。
  • 未满 18 岁或未填写出生日期的用户无法查看标记内容。
  • 禁止的内容包括:非自愿的、涉及未成年人的、推广剥削/物化/伤害、淫秽行为等。
  • 成人内容不能放在高可见位置,如头像、封面、直播等。

只要遵守这些规则(尤其是自愿 + 正确标记),就可以发布成人视频。违反可能导致内容删除、账号只读或永久封禁。

Gmail账号被停用解决方法,此账号似乎是与多个其他账号一起创建或使用的

Gmail账号被停用解决方法

您的账号被停用原因是涉嫌“批量创建或机器人创建”,违反Google政策。这种情况恢复难度较大(很多用户反馈成功率不高,尤其是新账号),但官方唯一有效方式是尽快提交申诉。停用后账号会最终删除,建议立即行动。

步骤1:提交申诉(最重要)

  1. 用浏览器(推荐Chrome)访问:

或去 https://myaccount.google.com/ 输入你的邮箱。

  1. 系统会显示停用通知,出现“发起申诉”或“Start Appeal”按钮,点击它。
  2. 填写表单:

    • 提供一个有效的备用邮箱(用于接收Google回复,非停用邮箱)。
    • 在申诉理由栏用英文填写解释(100字以内为宜,简洁礼貌)。

推荐申诉模板(约80字,可复制修改)

Dear Google Review Team,

This Gmail account was created and used solely by me personally, not through any automated script or as part of multiple accounts.

It is linked to important financial services and accounts. Losing access would prevent me from managing critical personal finances and logging into other platforms.

I believe this is a misunderstanding. Please review and reinstate my account.

Thank you.
  1. 提交后,通常2-7天(有时更长)会收到邮件回复。如果被拒,可尝试再次申诉(部分用户第2-3次成功,但不保证)。

步骤2:其他辅助方法

  • 下载数据备份:申诉前/后,尝试用停用账号登录 https://takeout.google.com/ 下载邮件、联系人、照片等(如果还能访问)。
  • 如果您在欧盟:可额外引用GDPR权利,要求Google提供更多解释或数据,但需证明欧盟身份(美国用户通常不行)。
  • 社区求助:在Google官方论坛发帖求助(https://support.google.com/accounts/community),但效果有限。
  • 预防未来:新账号避免频繁创建、使用VPN批量操作等可疑行为。

申诉是唯一官方渠道,耐心等待回复。如果多次失败,建议创建新Gmail并逐步转移重要绑定(金融类需联系对应平台解绑旧邮箱)。

根据提供的视频来源,英语听力学习被划分为五个阶段,并以“江湖侠客”的等级作为比喻。以下是各阶段的详细描述、适合的听力材料以及相关背景信息:

1. 第一级:入门小学徒 (Apprentice)

  • 阶段特征: 像学徒跟着师傅一招一式地学习,句子拆解得非常清楚,环境绝对安静,。发音一字一顿,清晰易懂。
  • 推荐材料:

    • 《新概念英语》第一、二册 (New Concept English Books 1 & 2)
    • VOA Learning English
  • YouTube 搜索关键词: New Concept English Book 1, VOA Learning English

2. 第二级:出世面的少侠 (Junior Hero)

  • 阶段特征: 开始下山步入江湖,语速比第一级快,不再刻意放慢动作,但依然比较客气,发音没有刻意模糊,。
  • 推荐材料:

    • YouTube 频道:Easy English
    • BBC 6 Minute English
  • YouTube 搜索关键词: Easy English channel, BBC 6 Minute English

3. 第三级:英雄大会 (Hero’s Assembly)

  • 阶段特征: 难度增加,句子结构变复杂,词汇量变多。播报员虽然语速快,但依然字正腔圆,通常是在无噪音的实验室环境下录制,。
  • 推荐材料:

    • TED Talks
    • BBC News (新闻播报)
  • YouTube 搜索关键词: TED Talks, BBC News

4. 第四级:华山论剑 (Sword Duel at Mount Hua)

  • 阶段特征: 高手之间的对决,招式化于无形。内容更加自发性 (Spontaneous),包含口误、发音模糊以及多个人声重叠,不再像演讲稿那样完美。
  • 推荐材料:

    • TED Interview (比 TED Talks 更具随机性)
    • The Tim Ferriss Show (提摩西·费里斯秀)
  • YouTube 搜索关键词: TED Interview, The Tim Ferriss Show

5. 第五级:龙门客栈 (Dragon Gate Inn)

  • 阶段特征: 真正的“江湖大乱斗”,环境极其嘈杂(如背景里有喝酒、摔盘子声),多人同时说话,伴随方言、黑话或背景噪音。这是最接近英语母语国家现实生活的场景。
  • 推荐材料:

    • 混乱场景的电影/剧集,例如 《大熊餐厅》(The Bear)
    • 真实的现实场景录音 (如嘈杂的博物馆、鸟园介绍)
  • YouTube 搜索关键词: The Bear clips, Real life English conversation with background noise

总结表

阶段称号特点推荐材料
第一级入门学徒极慢、清晰、无噪音《新概念英语》1&2, VOA Learning English
第二级出世少侠自然流淌、不刻意模糊Easy English (YouTube), BBC 6 Minute English
第三级英雄大会词汇量大、快而标准TED Talks, BBC News
第四级华山论剑随机表达、发音模糊/重叠TED Interview, The Tim Ferriss Show
第五级龙门客栈环境极度嘈杂、方言、黑话《大熊餐厅》 (The Bear), 真实生活场景

注意: 来源中提到,许多优秀的学生(如托福 110+)往往卡在第四级,难以突破到第五级,是因为他们习惯了“实验室环境”下的逐字接收,而缺乏对“意义模块” (Meaning Chunks) 的整体把握以及在噪音环境下的训练,,。

为了帮助理解,你可以把听力比作练习驾驶:第一级是在空旷的操场上练习挂挡(极简清晰);而第五级则是在暴雨天的闹市区早高峰开车,你不仅要看路,还要应付周围的喇叭声、行人和各种突发状况,这时候你靠的是直觉和整体路况的把握,而不是盯着每一个仪表盘读数。