首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2K star!电脑端离线语音输入工具

2K star!电脑端离线语音输入工具

CapsWriter-Offline 是一款功能强大的PC端语音输入及字幕转录工具,拥有以下两项主要功能:

使用 大写锁定键(CapsLock) 触发录音,松开即停止录音,并自动将语音转换为文字输入到当前光标位置。

支持音视频文件拖拽,能够自动转录生成 .srt 格式的字幕文件。

CapsWriter-Offline 示意图核心特性

完全离线使用:确保隐私安全,无需联网即可使用。

无限时长录音:不受时间限制,满足长时间录音需求。

低延迟体验:优化后的识别流程保证了输入的即时性。

高准确率识别:准确捕捉语音细节,提升文字转换质量。

中英文混输支持:无缝识别中英文混合语音输入。

自动数字识别:将语音中的数字自动转换为阿拉伯数字形式。

智能中英文间隔调整:自动处理中英文间的空格间隔,优化阅读体验。

此外,还包括以下特性:

热词功能:在指定的文本文件中添加专有名词或短语,实现动态替换。

日记功能:自动将每次的录音识别结果按日期保存为 Markdown 文件,并将录音文件归档。

关键词日记:根据 keywords.txt 中定义的关键词,将特定记录分类存储。

转录功能:音视频文件转录为字幕文件,支持后续编辑和时间戳校正。

客户端/服务端架构:支持多台客户端连接到同一个服务端,实现资源共享。

灵活配置:通过编辑 config.py 文件,自定义服务端地址、快捷键等配置项。

懒人包安装说明

在开始之前,请确保您的电脑满足以下条件:

操作系统为 Windows 10/11,64位版本。

安装步骤

下载运行库:确保安装了 Microsoft Visual C++ Redistributable 运行库。

服务端要求:需要至少 4G 系统内存,且只能在 64位 操作系统上运行。

客户端兼容性:另外提供 32位 系统兼容的客户端版本,适用于 Windows 7 及以上版本。

模型文件:由于模型文件较大,需单独下载并解压到软件目录下的 models 文件夹中。

模型文件下载后的最终文件夹结构和运行示例如下:

文件夹结构示例功能详细介绍热词替换功能

中文热词:将专有名词或常用短语加入 hot-zh.txt,以拼音作为匹配依据,轻微增加延迟。

英文热词:在 hot-en.txt 中添加英文热词,基于字母拼写进行替换。

规则热词:在 hot-rule.txt 中添加自定义替换规则,格式为 原词 = 替换词。

客户端会动态载入热词文件中的内容,实现即时替换。

热词替换示例日记和关键词功能

默认设置下,语音识别结果将按年月日归档保存,同时录音文件也会被存储。通过 keywords.txt 定义的关键词,可以将特定记录分类存储到单独的 Markdown 文件中。

日记和关键词示例转录文件功能

将音视频文件拖入客户端后,可自动生成包含时间戳的 .srt 字幕文件及其他辅助文件。支持通过编辑 .txt 文件来校正字幕内容,并自动更新 .srt 文件。

修改配置

您可以根据需要编辑 config.py 文件,自定义服务端地址、快捷键等设置。配置项的说明在文件开头部分有详细注释。

配置文件示例

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O5DXjdK4SQnaVw32oZhNX3TQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券