speakr
一个私人、自托管的 Web 应用程序,用于转录音频记录(如会议),生成简洁的总结和标题,并通过聊天界面与内容进行交互。用户可以将所有会议笔记和见解安全地存储在自己的服务器上。
Github地址
https://github.com/murtaza-nasir/speakr
功能特点
•核心功能:
• 支持多种音频格式(如 MP3、WAV、M4A 等)的上传,可通过拖放或文件选择完成。
• 转录和总结在后台进行,不会阻塞用户界面。
• 支持多语言,用户可以分别设置音频转录语言和 AI 生成内容(如总结和聊天)的语言。
• 使用 OpenAI 兼容的语音转文字(STT)API 进行转录,支持自托管的 Whisper 等。
• 使用 OpenAI 兼容的 API(如 OpenRouter)生成简洁的标题和总结,并允许用户自定义总结提示。
• 提供交互式聊天功能,用户可以向转录内容提问,并结合用户提供的个人/专业背景(如姓名、职位、公司)生成更相关的回答。
• 支持搜索、收件箱和高亮功能,方便用户处理内容。
• 用户可以编辑与录音相关的元数据,如标题、参与者、会议日期、总结和笔记。
•用户功能:
• 安全的用户注册和登录系统。
• 用户可以在账户页面管理密码和偏好设置,包括设置转录语言、输出语言、自定义总结提示以及添加个人/专业信息。
• 提供录音画廊,用户可以查看、管理和访问所有个人录音。
• 支持在浅色和深色主题之间切换。
•管理员功能:
• 提供管理员仪表板(/admin),用于集中管理。
• 可以添加、编辑、删除用户,以及授予/撤销管理员权限。
• 查看系统整体使用统计数据,如总用户数、录音数、存储量等。
使用方法
•注册/登录:通过浏览器访问应用程序,注册新账户或登录。
•设置偏好:在账户页面设置转录语言、输出语言、自定义总结提示以及个人/专业信息。
•上传音频:在“新建录音”页面或通过拖放上传音频文件,上传进度和处理状态会显示在左下角的弹出窗口中。
•查看录音:在“画廊”视图中查看录音列表,按日期分组。点击录音可以查看详细信息。
•交互:
• 使用播放器收听音频。
• 查看转录内容(使用用户设置的转录语言)。
• 查看 AI 生成的总结和标题(使用用户设置的输出语言)。
• 编辑元数据(参与者、笔记、会议日期等)。
• 使用“与转录聊天”面板向录音内容提问(回答使用用户设置的输出语言)。
•管理:在详细视图或录音列表中编辑详细信息或删除录音。
管理员面板
• 位于/admin,仅限管理员用户访问。
•用户管理:查看、添加、编辑(用户名、邮箱、密码、管理员状态)和删除用户。
•系统统计:查看应用程序的整体使用数据。
数据库管理
• 提供reset_db.py脚本,用于删除现有数据库和上传目录的内容,并创建一个新的空数据库架构。使用时需谨慎
大佬们,点个关注不迷路
领取专属 10元无门槛券
私享最新 技术干货