2K star!电脑端离线语音输入工具
CapsWriter-Offline 是一款功能强大的PC端语音输入及字幕转录工具,拥有以下两项主要功能:
使用 大写锁定键(CapsLock) 触发录音,松开即停止录音,并自动将语音转换为文字输入到当前光标位置。
支持音视频文件拖拽,能够自动转录生成 .srt 格式的字幕文件。
CapsWriter-Offline 示意图核心特性
完全离线使用:确保隐私安全,无需联网即可使用。
无限时长录音:不受时间限制,满足长时间录音需求。
低延迟体验:优化后的识别流程保证了输入的即时性。
高准确率识别:准确捕捉语音细节,提升文字转换质量。
中英文混输支持:无缝识别中英文混合语音输入。
自动数字识别:将语音中的数字自动转换为阿拉伯数字形式。
智能中英文间隔调整:自动处理中英文间的空格间隔,优化阅读体验。
此外,还包括以下特性:
热词功能:在指定的文本文件中添加专有名词或短语,实现动态替换。
日记功能:自动将每次的录音识别结果按日期保存为 Markdown 文件,并将录音文件归档。
关键词日记:根据 keywords.txt 中定义的关键词,将特定记录分类存储。
转录功能:音视频文件转录为字幕文件,支持后续编辑和时间戳校正。
客户端/服务端架构:支持多台客户端连接到同一个服务端,实现资源共享。
灵活配置:通过编辑 config.py 文件,自定义服务端地址、快捷键等配置项。
懒人包安装说明
在开始之前,请确保您的电脑满足以下条件:
操作系统为 Windows 10/11,64位版本。
安装步骤
下载运行库:确保安装了 Microsoft Visual C++ Redistributable 运行库。
服务端要求:需要至少 4G 系统内存,且只能在 64位 操作系统上运行。
客户端兼容性:另外提供 32位 系统兼容的客户端版本,适用于 Windows 7 及以上版本。
模型文件:由于模型文件较大,需单独下载并解压到软件目录下的 models 文件夹中。
模型文件下载后的最终文件夹结构和运行示例如下:
文件夹结构示例功能详细介绍热词替换功能
中文热词:将专有名词或常用短语加入 hot-zh.txt,以拼音作为匹配依据,轻微增加延迟。
英文热词:在 hot-en.txt 中添加英文热词,基于字母拼写进行替换。
规则热词:在 hot-rule.txt 中添加自定义替换规则,格式为 原词 = 替换词。
客户端会动态载入热词文件中的内容,实现即时替换。
热词替换示例日记和关键词功能
默认设置下,语音识别结果将按年月日归档保存,同时录音文件也会被存储。通过 keywords.txt 定义的关键词,可以将特定记录分类存储到单独的 Markdown 文件中。
日记和关键词示例转录文件功能
将音视频文件拖入客户端后,可自动生成包含时间戳的 .srt 字幕文件及其他辅助文件。支持通过编辑 .txt 文件来校正字幕内容,并自动更新 .srt 文件。
修改配置
您可以根据需要编辑 config.py 文件,自定义服务端地址、快捷键等设置。配置项的说明在文件开头部分有详细注释。
配置文件示例
领取专属 10元无门槛券
私享最新 技术干货