分类 实用工具 下的文章

一句“你平时抽烟吗?我不抽烟”被90后小伙用101种方言演绎,涵盖东北话、粤语、闽南语等,视频走红网络,点赞量近80万。
该视频创作者杨先生自高中起自学方言,部分发音参考中国语言资源保护工程采录展示平台,部分向当地人学习,录制耗时约两小时。

https://zhongguoyuyan.cn/

Gemini-Subtitle-Pro 是一款一站式全自动字幕生成工具,使用 Google Gemini AI 和 OpenAI Whisper 等模型,实现从视频下载到字幕压制的完整流程,无需人工干预。主要功能包括:

  • 全自动流程:支持从视频链接自动下载、语音转写、翻译、时间轴对齐、字幕压制导出。
  • 视频下载:支持 YouTube(包括 Shorts)和 Bilibili(BV 号、分 P)视频下载(桌面版专有)。
  • 语音转写:使用 Whisper 模型(支持本地离线模型 whisper.cpp 或在线 OpenAI API),实现高精度语音识别。
  • 翻译与润色:使用 Gemini 模型(Gemini 1.5 Flash、1.5 Pro、2.0 Flash 等)进行高质量翻译,支持长上下文分段处理。
  • 精准时间轴对齐:毫秒级字符同步,支持强制对齐,实现字幕与音频/视频精确匹配。
  • 智能后处理:自动断句、时间轴校正、术语自动提取与替换(通过 Google Search 验证标准译法)、说话人识别与标注。
  • 字幕预览与渲染:实时所见即所得预览,支持 ASS 样式(字体、颜色、位置等)。
  • 视频压制:内置 FFmpeg,支持 H.264/H.265 编码,双语 SRT/ASS 格式导出。
  • 性能优化:智能并发处理、GPU 加速(NVIDIA 显卡可提升 Whisper 速度 5-10 倍),30 分钟视频约 8-10 分钟完成。
  • 其他:缓存管理、自定义 API、版本快照等。

整体适合影视字幕制作、听障辅助、专业配音等高精度需求。

如何使用(详细步骤)

项目主要提供 Windows 桌面便携版,使用非常简单,以下是完整步骤:

  1. 下载程序

  2. 安装与启动

    • 解压 ZIP 文件到任意文件夹。
    • 双击 Gemini Subtitle Pro.exe 启动程序(无需安装)。
  3. 配置 API Key(必须)

    • 打开程序后,进入“设置”页面。
    • 填写 Gemini API Key(推荐使用支持 Gemini 1.5/2.0 模型的公益站或官方 Key)。
    • 填写 OpenAI API Key(用于在线 Whisper 转写,可选)。
    • 保存配置。
  4. 可选:启用本地离线 Whisper 转写(推荐,避免 API 费用):

    • 从 Hugging Face 下载 GGML 模型(如 ggml-base.binggml-small.bin):https://huggingface.co/ggerganov/whisper.cpp/tree/main
    • 在设置 → 常规 → 选择“使用本地 Whisper”。
    • 点击“浏览”选择下载的 .bin 模型文件。
    • 保存(推荐 ggml-small.bin 或更高以获得更好质量)。
  5. 可选:启用 GPU 加速(NVIDIA 显卡)

    • 从 whisper.cpp Releases 下载 GPU 版(如 whisper-cublas-bin-x64.zip):https://github.com/ggerganov/whisper.cpp/releases
    • 解压得到 whisper-cli.exe 和相关 DLL 文件。
    • 将这些文件放入程序主目录或 resources/ 文件夹。
    • 重启程序,即可自动使用 GPU 加速。
  6. 可选:启用高精度时间轴强制对齐(实现毫秒级字符同步):

    • 从项目 Releases 下载 aligner-windows-x64.zip,解压得到 align.exe
    • 从 Hugging Face 下载对齐模型:https://huggingface.co/MahmoudAshraf/mms-300m-1130-forced-aligner
    • 在设置中选择“强制对齐”。
    • 设置“执行文件”为 align.exe 路径。
    • 设置“模型路径”为下载的模型文件夹。
    • 保存启用。
  7. 开始生成字幕

    • 在主界面输入视频文件路径或支持的视频链接(YouTube/Bilibili)。
    • 配置目标语言、翻译模型、输出格式等参数。
    • 点击开始处理,程序会自动完成下载 → 转写 → 翻译 → 对齐 → 压制全流程。
    • 处理完成后,可实时预览字幕效果,并导出 SRT/ASS 文件或压制视频。

注意事项

  • 不支持播放列表、直播、付费内容下载。
  • 处理长视频时建议使用本地 Whisper + GPU 以提升速度和降低成本。

部署方式

  • 是否只能本地部署:是的,主要设计为本地桌面应用(Windows 便携版),依赖 Electron + Node.js 图形界面和本地资源文件(如 whisper-cli.exe、align.exe),适合个人电脑本地运行。
  • 是否可以在 VPS Linux 上部署使用不支持。项目没有提供 Linux 版本或服务器端部署方式,无法在无图形界面的 Linux VPS 上运行(缺少 GUI 支持和 Windows 专用的可执行文件)。即使通过源码构建,也仅生成 Windows 桌面包,不适用于 Linux 服务器环境。

如果需要在 Linux 上实现类似功能,建议寻找其他开源项目(如基于 Python 的 Whisper + Gemini 脚本工具),但本项目不直接支持。

Easy-Vibe 项目详细介绍

Easy-Vibe 是 Datawhale(一个开源学习社区)推出的一个项目制学习教程仓库,全称“从 0 到 1 学会 vibe coding,项目制学习”。它的核心目标是帮助学习者从零基础开始,掌握 vibe coding(一种 AI 辅助的、直觉式的现代编程方式),最终能够独立构建完整的 AI 原生应用(AI-native products)并上线部署。

这是用来做什么的?

  • 解决的问题

    • 很多人不知道如何选择和使用 AI 编程工具(比如 Claude、Cursor、Trae 等)。
    • 不知道如何将大模型的能力(如生成代码、图像、视频)应用到实际产品中。
    • 不清楚 AI 生成的代码距离真实上线运行还有多大差距。
  • 核心理念:通过“vibe coding”方式(用自然语言提示 AI 生成、迭代代码),结合项目实践,让学习者快速从想法原型到生产级产品。
  • 学习路径:分为三个阶段:

    1. 本地原型阶段:构建简单的 Web 小应用(如贪吃蛇游戏)。
    2. 全栈开发与部署阶段:集成后端、数据库、RAG(检索增强生成),并上线部署。
    3. 跨平台复杂应用阶段:开发更高级的 AI 应用(如霍格沃茨肖像生成器)。
  • 目标受众

    • 非技术小白(但建议有基本编程基础)。
    • 中级开发者想快速原型化。
    • 高级工程师想高效构建 AI 产品。
  • 额外收获:不仅仅教编码,还强调产品思维(如需求文档 PRD 编写、UI/UX 设计、用户增长策略、想法验证)。

项目通过一系列递进的实战项目(如贪吃蛇游戏、霍格沃茨肖像应用、现代 Web App)来教学,帮助你掌握从想法到上线的全流程。

主要特点和技术栈

  • 特点

    • 项目驱动学习,闭环体验(建议完整做完所有项目)。
    • 强调 AI 工具链的使用,减少手动敲代码。
    • 包含额外知识补充(如 Git/GitHub 使用、API 调用等)。
  • 关键技术

    • 前端:HTML/CSS/JS、现代组件库、UI 设计工具。
    • 后端:Supabase(数据库、认证、存储、边缘函数)、Dify(RAG、工作流编排)。
    • AI 工具:Trae(推荐 AI IDE)、Cursor、VS Code、Claude 等大模型。
    • 部署:Zeabur(一键云托管)、类似 Vercel/Netlify。
    • 版本控制:Git & GitHub(分支、PR、SSH)。
    • API:文本转图像/视频、Dify API、Supabase API 等。

仓库许可:CC BY-NC-SA 4.0(知识共享、非商业、相同方式共享)。

如何使用?

  1. 准备环境

    • 安装 Node.js、npm、Git。
    • 推荐使用 AI IDE(如 Trae、Cursor 或 VS Code + AI 插件)。
    • 有基本编程知识(任意语言)最好。
  2. 克隆仓库

    git clone https://github.com/datawhalechina/easy-vibe.git
    cd easy-vibe
  3. 运行本地服务(两种方式):

    • 推荐现代方式(AI IDE)
      在 AI IDE 中打开项目文件夹,直接输入提示:

      请你帮我运行这个项目的本地服务

    AI 会自动帮你安装依赖并启动。

    • 传统 CLI 方式

      npm install
      npm run dev

      然后浏览器打开 http://localhost:3000 查看。

  4. 学习和使用流程

    • docs/ 目录开始阅读:

      • 先看 Chapter 0:学习地图docs/project/chapter0-learning-map/),了解整体路径。
      • 依次完成 Project 1~6(每个章节有详细 Markdown 教程、代码示例和 AI 提示指导)。

        • 示例项目:Project 1 用 AI 构建贪吃蛇游戏,并集成文本/图像生成 API。
        • Project 4:用 AI IDE 将设计图转为霍格沃茨肖像应用代码。
      • 额外示例(docs/examples/):如用 Trae 构建微信小程序版贪吃蛇。
    • 在实践中,多用 AI 提示生成代码、调试、优化。
    • 项目逐步引入 Git 提交、分支管理、部署到 Zeabur 等。
  5. 注意事项

    • 仓库主要文档是中文(英文文档不完整)。
    • 部分高级项目(7~9)和示例(2~3)仍在建设中(

nanobanana提示词各种模版

https://youmind.com/nano-banana-pro-prompts

例如

Create a modern Apple Design-inspired "This Day in History" calendar page for {当前月}月{当前日}日, {当前年份}, commemorating {历史事件标题} on {事件月}月{事件日}日, {事件年份}. Ultra-minimalist, clean, and sophisticated layout in 4K quality.
Layout Structure:

  • Top: Elegant Chinese date "{月}月{日}日" (large), "星期{X}" (small)
  • Calendar widget: Top-right corner showing {当前年份}年{当前月}月 calendar grid
    CRITICAL - Calendar Accuracy Requirements:
  • Display the CORRECT month: {当前年份}年{当前月}月 (e.g., "2026年1月" for January 2026)
  • Show accurate calendar grid with correct day-of-week alignment
  • Highlight date {当前日} (e.g., if today is 1月6日, highlight "6")
  • Calendar must start from the 1st day of the current month
  • Show correct number of days for the month (January = 31 days)
  • First day of month must align with correct weekday
  • Reference: January 2026 starts on Thursday (周四), so grid layout should be:
    Row 1: [empty] [empty] [empty] [1] [2] [3] [4]

Row 2: [5] [6-highlighted] [7] [8] [9] [10] [11]
etc.

  • Use accurate 2026 calendar data, do NOT use random or placeholder dates
  • Main card: Frosted glass effect with subtle shadows
    Central Illustration:

{根据领域选择对应插画场景配置}

  • Clean line-art style with limited color palette
  • {领域特定元素列表}
  • Soft ambient lighting creating depth
  • Cute minimalist cartoon character in {领域}风格 in corner
    Typography (4K clarity):
  • Category: "历史上的今天 | {领域}" - Thin sans-serif
  • Title: "{事件年份}年{事件月}月{事件日}日:{事件标题}" - Medium weight
  • Body: "{事件详细描述}" - Light weight, 1.8 line-spacing
  • Highlight keywords: {关键词列表} with subtle emphasis
    Design Elements:
  • 60% white/negative space
  • 8px grid system alignment
  • Soft shadows (0 4px 16px rgba(0,0,0,0.06))
  • {领域特定装饰图案}
  • {领域特定纹理}
    Color Scheme:
  • Background: {领域背景色} with {领域纹理}
  • Primary text: #1D1D1F
  • Accent: {领域点缀色1} and {领域点缀色2}
  • Card: rgba(255,255,255,0.96) with blur
    Watermark:
  • "{当前年份}" in English, 6% opacity, ultra-thin, diagonal background
    Apple Design Principles (4K):
  • Crystal-clear typography with perfect anti-aliasing
  • Sophisticated shadow layering
  • Minimum 32px padding
  • WCAG AAA contrast ratios
  • Perfect pixel precision
    Bottom right: "创作者: Berryxia" in subtle elegant text

Format: Portrait (9:16 or 2:3), 4K quality
Mood: Elegant, {领域情绪}, sophisticated - celebrating {领域特点} with contemporary design excellence.
VERIFICATION CHECKLIST (Must satisfy ALL):
✓ Calendar shows correct month: {当前年份}年{当前月}月
✓ Calendar grid starts from day 1 of current month
✓ Date {当前日} is highlighted correctly
✓ Days of week align correctly (consult 2026 calendar)
✓ Number of days matches actual month length

这个可用做历史今天

nanobanana提示词各种模版

NotebookLM 不支持直接将生成的分类总结或笔记输出为 DOCX 文档。它主要通过网页界面生成和显示内容,如笔记、学习指南、FAQ 或音频概述,而内置导出选项有限,通常仅支持下载为 Markdown、PDF(部分功能如 Infographic 可下载为 PNG)或分享链接。

替代方法实现类似输出

尽管没有原生 DOCX 导出,你可以通过以下方式获取内容并转换为 DOCX:

  1. 手动复制并粘贴:在 NotebookLM 的笔记或聊天响应中,生成的分类总结通常以结构化文本(如 bullet 列表或表格)呈现。你可以全选复制,然后粘贴到 Microsoft Word 或 Google Docs 中,保存为 DOCX。这会保留基本格式,但可能需要手动调整表格或方程。
  2. 使用第三方工具转换

    • 生成 Markdown 输出(NotebookLM 支持导出笔记为 Markdown),然后使用工具如 MassiveMark、Pandoc 或在线转换器(如 bibcit.com)将其转为 DOCX。这些工具能保留表格、代码和方程的格式。
    • 例如,在 NotebookLM 生成总结后,导出为 Markdown 文件,然后在 Word 中打开或使用转换服务下载 DOCX。
  3. 下载所有笔记:如果你生成多个笔记,可以使用扩展方法(如浏览器插件或脚本)一次性下载整个项目的内容,然后导入 Word。但这不是官方功能,需要额外步骤。

NotebookLM 支持上传 DOCX 文件进行分析(如你的物理题目文档),但输出侧重点在交互式笔记而非文件导出。如果需要更灵活的导出,考虑结合 Google Docs(NotebookLM 基于 Google 生态)或外部 AI 工具来处理生成的内容。

bibcit.com 在线工具注册就可以领取免费额度.

NotebookLM 结果导出DOCX 文档或者pdf文档