做了个 macOS 实时语音转写+翻译工具:低延迟、双语字幕,想听听大家建议

2 月 27 日
 leetcode2020

Voice Real-time Translation ( VRT )

macOS 实时转写与实时翻译 面向跨语言会议、远程沟通、内容创作和学习场景的低延迟原生工具。

在 macOS 上,把实时转写和实时翻译做成一个可以长时间稳定跑的原生工具。
目标只有一个:让你把注意力放回沟通本身。

🌐 落地页(主入口)https://vrt.junxinzhang.com
⬇️ 下载( macOS )https://vrt.junxinzhang.com/downloads/VoiceTranslation.dmg
🎬 演示视频https://www.bilibili.com/video/BV1LyA2zSEnZ


隐私与部署方式


视频预览

当前平台不支持内嵌播放器时,点击上方预览图可直接跳转播放。
备用链接:https://www.bilibili.com/video/BV1LyA2zSEnZ


我为什么做 VRT

最近一年我自己的跨语言沟通越来越频繁:开英文会、和海外同事语音、看外语内容做记录。
真正的痛点不是“翻译不出来”,而是跟不上节奏:你在听、在想、还要手动记,几件事同时发生,很容易漏信息。

市面上很多工具能解决单点问题,但在 macOS 上常见体验是:


当前版本能力


我主要在这些场景里使用

  1. 跨语言会议:减少错听和遗漏。
  2. 远程沟通:语音讨论时更快达成共识。
  3. 内容创作:访谈/口述后直接得到结构化文本。
  4. 学习场景:听外语材料时实时辅助理解。

想重点收集的反馈

欢迎直接留言或私信联系我


再次放主入口

VRT 落地页https://vrt.junxinzhang.com

1575 次点击
所在节点    分享创造
6 条回复
Mandyer
2 月 27 日
系统音频里,点击开始翻译,立马自动停止。麦克风模式则正常
zhang666
2 月 27 日
完全本地运行?用的什么开源 asr 模型?
leetcode2020
2 月 27 日
@zhang666 ASR 是苹果原生能力,翻译直连 LLM API
leetcode2020
2 月 27 日
@Mandyer 感谢反馈!我和朋友的 M2 MAX ( 26.3 ) 都没有这个问题,可能和 Core Audio Tap 的资源释放有关。

麻烦你帮忙提供一下崩溃日志,方便我定位具体原因:

1 、打开 访达( Finder )
2 、菜单栏点击 前往 → 前往文件夹
3 、输入路径:~/Library/Logs/DiagnosticReports/
4 、找到文件名包含 VoiceTranslation 的 .ips 文件(按修改日期排序,找最近的)
把这些文件发给我即可

如果该目录下没有 VoiceTranslation 相关文件,说明 app 可能不是崩溃退出而是其他原因停止的,那麻烦你补充一下:
1 、macOS 版本号(系统设置 → 通用 → 关于本机)
2 、控制台是否有弹出任何权限请求的窗口
Mandyer
2 月 28 日
@leetcode2020 #4 这里说的立马停止不是 app 崩溃退出,是点击开始翻译后,自动停止录音识别。
Mac Mini M4 系统版本 26.3
初次打开软件时,弹窗申请了麦克风权限,已授权
leetcode2020
2 月 28 日
@Mandyer 感谢反馈!我会找个设备测试并修复这个问题,谢谢!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1194643

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX