Files
openclaw-skills/categories/speech-and-transcription.md
2026-03-11 16:19:25 +08:00

7.4 KiB
Raw Permalink Blame History

语音与转录

← 返回主列表

45 个技能

  • addis-assistant-stt - 提供语音转文本STT与文本处理能力。
  • agent-voice - 面向 AI 代理的命令行博客平台。
  • akaunting - 通过 REST API 与 Akaunting 开源会计软件交互。
  • alexa-cli - 通过 alexacli CLI 控制 Amazon Alexa 设备和智能家居。
  • announcer - 通过 Airfoil AirPlay 扬声器在家中播报文本。
  • assemblyai-transcribe - 使用 AssemblyAI 转录音频/视频。
  • audio-gen - 生成有声书、播客或教育音频内容。
  • audio-reply - 使用 TTS 生成音频回复。
  • auto-whisper-safe - Support for memory-safe automatic chunking transcription — can run on a 16GB machine without crashing.
  • brw-de-ai-ify - Remove AI-generated tone and restore a more natural human expression to the text.
  • chichi-speech - 使用 Qwen3 提供高质量文本转语音 RESTful 服务。
  • claw-voice - 你已通过语音连接到一个实时用户会话。
  • clonev - 使用 Coqui XTTS v2 克隆任意声音并生成语音。
  • critical-article-writer - 生成文章草稿与大纲。
  • cult-of-carcinization - 让你的代理拥有声音——以及听觉。
  • deepdub-tts - 使用 Deepdub 生成语音音频并以 MEDIA 格式附加。
  • deepgram - Deepgram Speech-to-Text 的命令行接口。
  • dellight-cro-revenue-ops - DELLIGHT.AI 是一家位于迪拜DIFC的人工智能初创公司相关技能。
  • documents-ai - Veryfi 提供的实时 OCR 与数据提取 API。
  • doubao-api-open-tts - 使用豆包(火山引擎)的文本转语音服务。
  • duby - 使用 Duby.so API 将文本转换为语音。
  • eachlabs-voice-audio - Using ElevenLabs, Whisper, and RVC for TTS, STT, and voice conversion.
  • easyverein-api - 集成 easyVerein v2.0 REST API。
  • elevenlabs-agents - 创建、管理并部署 ElevenLabs 代理。
  • elevenlabs-media - ElevenLabs 音乐生成技能。
  • elevenlabs-transcribe - 使用 ElevenLabs 将音频转录为文本。
  • elevenlabs-tts - ElevenLabs TTS——OpenClaw 的高质量 ElevenLabs 集成。
  • elevenlabs-voices - 提供 18 种角色、32 种配置的高质量语音合成。
  • eternal-haven-lore-pack - Eternal Haven Chronicles 世界观与神话人格包。
  • faster-whisper - 使用 faster-whisper 在本地执行语音转文本。
  • feishu-minutes - 获取飞书妙记的信息、统计、转录和媒体内容。
  • freshbooks-cli - FreshBooks CLI用于管理发票、客户和计费。
  • gettr-transcribe-summarize - 下载并处理 GETTR 帖子的音频。
  • hebrew-nikud - 面向 AI 代理的希伯来语元音nikud参考工具。
  • her-voice - 让你的代理拥有声音。
  • inworld-tts - 通过 Inworld.ai API 将文本转换为语音。
  • jarvis-voice - 具备 TTS 与可视化转录风格的金属感 AI 语音人格。
  • kokoro-tts - 使用本地 Kokoro TTS 引擎从文本生成语音音频。
  • lnbits - 管理 LNbits 闪电钱包(余额、支付、发票)。
  • lnbits-with-qrcode - 管理 LNbits 闪电钱包(余额、支付、发票)。
  • miranda-sag - ElevenLabs 文本转语音,带有 macOS say 风格体验。
  • norman-categorize-transactions - 审核并分类未归类银行交易,将其与发票匹配并核验账务分录。
  • norman-monthly-reconciliation - 执行完整月度财务对账:审查交易、匹配发票并检查未结项。
  • ressemble - 使用 Resemble AI HTTP API 实现文本转语音与语音转文本集成。
  • siliconflow-tts-gen - 使用 SiliconFlow APICosyVoice2进行文本转语音。