首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开源的转录音频记录工具,更够设置音频转录语言和 AI 生成内容。可以将所有会议笔记和见解安全地存储在自己的服务器上。

speakr

一个私人、自托管的 Web 应用程序,用于转录音频记录(如会议),生成简洁的总结和标题,并通过聊天界面与内容进行交互。用户可以将所有会议笔记和见解安全地存储在自己的服务器上。

Github地址

https://github.com/murtaza-nasir/speakr

功能特点

核心功能

• 支持多种音频格式(如 MP3、WAV、M4A 等)的上传,可通过拖放或文件选择完成。

• 转录和总结在后台进行,不会阻塞用户界面。

• 支持多语言,用户可以分别设置音频转录语言和 AI 生成内容(如总结和聊天)的语言。

• 使用 OpenAI 兼容的语音转文字(STT)API 进行转录,支持自托管的 Whisper 等。

• 使用 OpenAI 兼容的 API(如 OpenRouter)生成简洁的标题和总结,并允许用户自定义总结提示。

• 提供交互式聊天功能,用户可以向转录内容提问,并结合用户提供的个人/专业背景(如姓名、职位、公司)生成更相关的回答。

• 支持搜索、收件箱和高亮功能,方便用户处理内容。

• 用户可以编辑与录音相关的元数据,如标题、参与者、会议日期、总结和笔记。

用户功能

• 安全的用户注册和登录系统。

• 用户可以在账户页面管理密码和偏好设置,包括设置转录语言、输出语言、自定义总结提示以及添加个人/专业信息。

• 提供录音画廊,用户可以查看、管理和访问所有个人录音。

• 支持在浅色和深色主题之间切换。

管理员功能

• 提供管理员仪表板(/admin),用于集中管理。

• 可以添加、编辑、删除用户,以及授予/撤销管理员权限。

• 查看系统整体使用统计数据,如总用户数、录音数、存储量等。

使用方法

注册/登录:通过浏览器访问应用程序,注册新账户或登录。

设置偏好:在账户页面设置转录语言、输出语言、自定义总结提示以及个人/专业信息。

上传音频:在“新建录音”页面或通过拖放上传音频文件,上传进度和处理状态会显示在左下角的弹出窗口中。

查看录音:在“画廊”视图中查看录音列表,按日期分组。点击录音可以查看详细信息。

交互

• 使用播放器收听音频。

• 查看转录内容(使用用户设置的转录语言)。

• 查看 AI 生成的总结和标题(使用用户设置的输出语言)。

• 编辑元数据(参与者、笔记、会议日期等)。

• 使用“与转录聊天”面板向录音内容提问(回答使用用户设置的输出语言)。

管理:在详细视图或录音列表中编辑详细信息或删除录音。

管理员面板

• 位于/admin,仅限管理员用户访问。

用户管理:查看、添加、编辑(用户名、邮箱、密码、管理员状态)和删除用户。

系统统计:查看应用程序的整体使用数据。

数据库管理

• 提供reset_db.py脚本,用于删除现有数据库和上传目录的内容,并创建一个新的空数据库架构。使用时需谨慎

大佬们,点个关注不迷路

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OAUQ7dtbFObmcZbK0PmCAJ0g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券