分类 实用工具 下的文章

Clawdbot 介绍

Clawdbot 是一个开源的个人 AI 助手(Personal AI Assistant),完全运行在你的本地设备或服务器上。它不像传统聊天 AI 那样只被动回复,而是能主动消息你、执行真实任务,像一个“AI 员工”或“AI 管家”。项目 GitHub 星数已超 40k,非常火爆(最近导致 Mac mini 和一些 VPS 售罄)。官网:https://clawd.bot/,GitHub:https://github.com/clawdbot/clawdbot

它基于 Node.js 构建,支持多种大模型(Claude、GPT、本地模型等),通过你常用的聊天 app(如 Telegram、WhatsApp、Discord、Slack 等)交互,隐私性强(数据默认不离开你的设备)。

主要用途和功能

主要用途

  • 作为 24/7 在线的个人/家庭/团队助手,处理重复性任务、自动化工作流、主动提醒。
  • 适合日常效率提升:比如手机上发消息让它在电脑/VPS 上执行操作(你不在电脑前也能控制)。
  • 典型场景:邮箱管理、日程安排、智能家居控制、代码开发、网页自动化、内容生成等。

关键功能

  • 主动行为:能定时提醒、监控事件、主动发消息(比如总结未读邮件、提醒喝水)。
  • 系统级访问:读写文件、运行 shell 命令、浏览器自动化(浏览网页、填表、刮取数据)。
  • 集成能力:支持 50+ 服务(Gmail、Calendar、Spotify、GitHub、Obsidian、Twitter 等)。
  • 扩展性:技能系统(Skills),可安装插件或自写扩展。
  • 多渠道:WhatsApp、Telegram、Discord、Slack、Signal、iMessage 等,几乎所有主流聊天 app。
  • 其他:持久记忆、语音交互(部分平台)、图像/媒体处理、cron 定时任务、沙箱安全模式。
  • 可以用它做几乎任何事:订机票、自动化报销、跑代码测试、建网站、甚至控制家里的空气净化器。

总之,它把 AI 从“聊天工具”变成“能干活的代理”(Agent),强调实际行动而非只生成文本。

如何部署到 VPS Ubuntu 上

Clawdbot 支持 Linux/Ubuntu 服务器部署(推荐 Ubuntu 22.04+,至少 2GB RAM,建议 4GB+ 以防模型推理卡顿)。部署很简单,但VPS 部署有安全风险(后文详述)。

步骤(推荐安全方式)

  1. 准备 VPS

    • 选择一个 Ubuntu 22.04 VPS(例如 Hetzner、DigitalOcean、SurferCloud 等,5-10 美元/月即可)。
    • SSH 登录:ssh root@你的VPS_IP
  2. 系统准备

    • 更新系统:apt update && apt upgrade -y
    • 安装必要工具:apt install curl git -y
    • (可选,如果 RAM 小)添加 swap:fallocate -l 2G /swapfile && chmod 600 /swapfile && mkswap /swapfile && swapon /swapfile
  3. 安装 Node.js 22+(必须):

    curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
    apt install -y nodejs
  4. 安装 Clawdbot(推荐一键脚本):

    curl -fsSL https://clawd.bot/install.sh | bash

    或者手动:

    npm install -g clawdbot@latest
  5. 初始化并安装为服务(让它后台 24/7 运行):

    clawdbot onboard --install-daemon
    • 这会启动向导(wizard),引导你配置:

      • 设置模型(输入 Anthropic/OpenAI 等 API key)。
      • 配置聊天渠道(比如 Telegram bot token)。
      • 安装 systemd 服务(自动开机启动)。
  6. 启动并检查

    clawdbot gateway  # 手动启动测试
    clawdbot doctor    # 检查配置是否有问题
  7. 远程访问(重要!不要直接暴露端口):

    • 默认 Gateway 只监听本地(127.0.0.1:18789)。
    • 推荐用 Tailscale(免费 VPN)或 SSH 隧道访问 dashboard 和控制。
    • 防火墙设置(ufw):

      ufw allow from 你的本地IP to any port 22  # 只允许 SSH
      ufw deny 18789  # 禁止公网访问 Gateway 端口
      ufw enable

注意:如果用 Docker 部署更安全(官方支持),参考 docs.clawd.bot/install/docker。

如何使用

  1. 配置聊天渠道(以 Telegram 为例,最简单):

    • 在 Telegram 找 @BotFather 创建新 bot,获取 token。
    • 在 Clawdbot wizard 或 dashboard 中输入 token。
    • 在 Telegram 私聊你的 bot,发消息测试(比如 “hello”)。
  2. 日常使用

    • 在聊天 app 中直接发消息给 bot,比如:

      • “帮我清理 Gmail 未读邮件”
      • “明天 9 点提醒我开会”
      • “浏览淘宝搜 iPhone 16 价格并总结”
      • “运行 git pull 并告诉我变化”
    • 它会思考、执行、回复结果(支持流式回复)。
    • 复杂任务可指定 “thinking high” 让它更仔细。
  3. 管理界面

    • 本地访问 http://127.0.0.1:18789 (VPS 上需隧道转发)。
    • 这里可以查看会话、配置技能、检查日志。

重要安全警告

  • Clawdbot 给 AI 很大权限(可运行命令、访问文件),本地跑没问题,但VPS 上暴露端口非常危险(默认无强认证,别人可能偷 API key 或控制你的 bot)。
  • 强烈建议

    • 只本地绑定端口,用 Tailscale/SSH/VPN 访问。
    • 开启沙箱模式(sandbox)限制工具。
    • 定期跑 clawdbot doctor 检查风险。
    • 不要在公网直接开放 18789 端口!
  • 参考官方安全指南:https://docs.clawd.bot/gateway/security

如果遇到问题,查看官方文档 https://docs.clawd.bot/ 或 GitHub issues。享受你的个人 AI 管家吧!

自检方法很简单,把以下账号健康检测提示词喂给Grok就可以,不明白的V友在评论区回复,我帮你一对一指导:

以 X 高级算法工程师的身份,对我的个人资料(@你的账号ID)进行一次彻底的审计。分析以下 3 个致命向量:
1.垃圾信息概率(Spam Probability):我的回复是否触发了“互动诱导(engagement bait)”过滤机制?
2.社交图谱毒性(Social Graph Toxicity):我是否正在与机器人账号集群或低质量账号圈子频繁互动?
3.隐形封禁状态(Shadowban Status):请评估并计算我的账号触达(reach)被系统限流的概率。
输出:
1.一个精准的“账户健康分数”(Account Health Score,0-100 分)。
2.3 个可以立刻执行的“外科手术式”修复动作,用于恢复账号自然触达。

一句“你平时抽烟吗?我不抽烟”被90后小伙用101种方言演绎,涵盖东北话、粤语、闽南语等,视频走红网络,点赞量近80万。
该视频创作者杨先生自高中起自学方言,部分发音参考中国语言资源保护工程采录展示平台,部分向当地人学习,录制耗时约两小时。

https://zhongguoyuyan.cn/

Gemini-Subtitle-Pro 是一款一站式全自动字幕生成工具,使用 Google Gemini AI 和 OpenAI Whisper 等模型,实现从视频下载到字幕压制的完整流程,无需人工干预。主要功能包括:

  • 全自动流程:支持从视频链接自动下载、语音转写、翻译、时间轴对齐、字幕压制导出。
  • 视频下载:支持 YouTube(包括 Shorts)和 Bilibili(BV 号、分 P)视频下载(桌面版专有)。
  • 语音转写:使用 Whisper 模型(支持本地离线模型 whisper.cpp 或在线 OpenAI API),实现高精度语音识别。
  • 翻译与润色:使用 Gemini 模型(Gemini 1.5 Flash、1.5 Pro、2.0 Flash 等)进行高质量翻译,支持长上下文分段处理。
  • 精准时间轴对齐:毫秒级字符同步,支持强制对齐,实现字幕与音频/视频精确匹配。
  • 智能后处理:自动断句、时间轴校正、术语自动提取与替换(通过 Google Search 验证标准译法)、说话人识别与标注。
  • 字幕预览与渲染:实时所见即所得预览,支持 ASS 样式(字体、颜色、位置等)。
  • 视频压制:内置 FFmpeg,支持 H.264/H.265 编码,双语 SRT/ASS 格式导出。
  • 性能优化:智能并发处理、GPU 加速(NVIDIA 显卡可提升 Whisper 速度 5-10 倍),30 分钟视频约 8-10 分钟完成。
  • 其他:缓存管理、自定义 API、版本快照等。

整体适合影视字幕制作、听障辅助、专业配音等高精度需求。

如何使用(详细步骤)

项目主要提供 Windows 桌面便携版,使用非常简单,以下是完整步骤:

  1. 下载程序

  2. 安装与启动

    • 解压 ZIP 文件到任意文件夹。
    • 双击 Gemini Subtitle Pro.exe 启动程序(无需安装)。
  3. 配置 API Key(必须)

    • 打开程序后,进入“设置”页面。
    • 填写 Gemini API Key(推荐使用支持 Gemini 1.5/2.0 模型的公益站或官方 Key)。
    • 填写 OpenAI API Key(用于在线 Whisper 转写,可选)。
    • 保存配置。
  4. 可选:启用本地离线 Whisper 转写(推荐,避免 API 费用):

    • 从 Hugging Face 下载 GGML 模型(如 ggml-base.binggml-small.bin):https://huggingface.co/ggerganov/whisper.cpp/tree/main
    • 在设置 → 常规 → 选择“使用本地 Whisper”。
    • 点击“浏览”选择下载的 .bin 模型文件。
    • 保存(推荐 ggml-small.bin 或更高以获得更好质量)。
  5. 可选:启用 GPU 加速(NVIDIA 显卡)

    • 从 whisper.cpp Releases 下载 GPU 版(如 whisper-cublas-bin-x64.zip):https://github.com/ggerganov/whisper.cpp/releases
    • 解压得到 whisper-cli.exe 和相关 DLL 文件。
    • 将这些文件放入程序主目录或 resources/ 文件夹。
    • 重启程序,即可自动使用 GPU 加速。
  6. 可选:启用高精度时间轴强制对齐(实现毫秒级字符同步):

    • 从项目 Releases 下载 aligner-windows-x64.zip,解压得到 align.exe
    • 从 Hugging Face 下载对齐模型:https://huggingface.co/MahmoudAshraf/mms-300m-1130-forced-aligner
    • 在设置中选择“强制对齐”。
    • 设置“执行文件”为 align.exe 路径。
    • 设置“模型路径”为下载的模型文件夹。
    • 保存启用。
  7. 开始生成字幕

    • 在主界面输入视频文件路径或支持的视频链接(YouTube/Bilibili)。
    • 配置目标语言、翻译模型、输出格式等参数。
    • 点击开始处理,程序会自动完成下载 → 转写 → 翻译 → 对齐 → 压制全流程。
    • 处理完成后,可实时预览字幕效果,并导出 SRT/ASS 文件或压制视频。

注意事项

  • 不支持播放列表、直播、付费内容下载。
  • 处理长视频时建议使用本地 Whisper + GPU 以提升速度和降低成本。

部署方式

  • 是否只能本地部署:是的,主要设计为本地桌面应用(Windows 便携版),依赖 Electron + Node.js 图形界面和本地资源文件(如 whisper-cli.exe、align.exe),适合个人电脑本地运行。
  • 是否可以在 VPS Linux 上部署使用不支持。项目没有提供 Linux 版本或服务器端部署方式,无法在无图形界面的 Linux VPS 上运行(缺少 GUI 支持和 Windows 专用的可执行文件)。即使通过源码构建,也仅生成 Windows 桌面包,不适用于 Linux 服务器环境。

如果需要在 Linux 上实现类似功能,建议寻找其他开源项目(如基于 Python 的 Whisper + Gemini 脚本工具),但本项目不直接支持。