前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AudioGPT 语音技术全覆盖:语音识别、增强、分离、风格迁移等 | 开源日报 No.114

AudioGPT 语音技术全覆盖:语音识别、增强、分离、风格迁移等 | 开源日报 No.114

作者头像
小柒
发布2023-12-15 13:37:16
2260
发布2023-12-15 13:37:16
举报
文章被收录于专栏:开源服务指南开源服务指南

stevearc/oil.nvim[1]

Stars: 1.7k License: MIT

oil.nvim 是一个类似于 vim-vinegar 的文件浏览器,允许您像普通 Neovim 缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过适配器抽象进行所有文件系统交互以及提供 API 来执行各种操作。该项目的关键特点和核心优势包括:

  • 通过适配器实现跨位置查看和修改文件
  • 支持 SSH 适配器,可在远程服务器上浏览文件
  • 提供丰富的 API 用于执行不同操作

unslothai/unsloth[2]

Stars: 1.2k License: Apache-2.0

这个项目是一个本地 QLoRA 微调工具,主要功能包括手动自动微分引擎、80% 更快的速度和 50% 更少的内存占用。其核心优势和关键特性包括:

  • 所有内核都是使用 OpenAI 的 Triton 语言编写
  • 无需改变硬件支持 NVIDIA GPU (2018 年以后) 及 CUDA 7.5+,适配多种型号 GPU
  • 支持 Flash Attention via Xformers
  • 支持 4bit and 16bit LoRA finetuning
  • 在 260 小时内完全在本地训练 Slim Orca 模型 (原来需要 1301 小时)

该开源版本可以实现 5 倍加速训练或者选择 Unsloth Pro 和 Max 代码路径进行 30 倍加速训练。 同时提供了 Alpaca52K 数据集和 Slim Orca518K 数据集等 Colab 示例以及 LAION OIG Chip2 数据集的 Kaggle 示例,并且还可通过 Discord 获取帮助。

ThePrimeagen/harpoon[3]

Stars: 4.0k License: MIT

Harpoon 是一个为了用最少的按键操作来实现你想要的目标而设计的项目。

  • 通过更改用户界面或者添加热键文件进行指定
  • 可以创建无限数量和列表项数目
  • 需要 neovim 0.8.0+ 版本支持
  • 必须调用 harpoon:setup()
  • 支持自定义 harpoon 列表行为,可以根据需要提供自己的调用函数。

psf/requests[4]

Stars: 50.6k License: Apache-2.0

Requests 是一个简单而优雅的 HTTP 库。

  • 支持 Python 3.7+
  • 可以轻松发送 HTTP/1.1 请求
  • 不需要手动添加查询字符串到 URL,也不需要对 PUTPOST 数据进行表单编码,只需使用 json 方法即可
  • 拥有 30M 次/周的下载量,并被 100 万个以上的仓库所依赖
  • 提供了丰富功能和最佳实践支持,包括连接复用、国际域名与 URLs、会话维护、浏览器风格 TLS/SSL 验证等。

AIGC-Audio/AudioGPT[5]

Stars: 9.4k License: NOASSERTION

AudioGPT 是一个理解和生成语音、音乐、声音和虚拟人的开源项目。

主要功能:

  • 文本转语音
  • 风格迁移
  • 语音识别
  • 语言增强 (Speech Enhancement)
  • 声学分离 (Speech Separation)

该项目具有以下核心优势:

  • 多领域支持:AudioGPT 在多个领域都提供了强大的支持,包括文本到语言合成、风格迁移以及各种与声学相关任务。无论您需要什么样的应用场景,在这个项目中都能找到满足需求的模型。
  • 先进技术实现:AudioGPT 采用最先进的基础模型来实现其功能,如 FastSpeech,SyntaSpeech 等。这些高质量模型经过训练完善调试后发布给用户使用。

TrinityCore/TrinityCore[6]

Stars: 8.7k License: GPL-2.0

TrinityCore 是一个基于 C++ 的 MMORPG 框架,它源自 MaNGOS (Massive Network Game Object Server) 项目的代码,并经过长时间广泛修改优化、改进和清理代码库,同时提高游戏内机制和功能。其核心优势包括:

  • 完全开放源码
  • 高度鼓励社区参与
  • 提供详细的安装指南
  • 可通过 Github 提交修复程序

相关链接

[1]

stevearc/oil.nvim: https://github.com/stevearc/oil.nvim

[2]

unslothai/unsloth: https://github.com/unslothai/unsloth

[3]

ThePrimeagen/harpoon: https://github.com/ThePrimeagen/harpoon

[4]

psf/requests: https://github.com/psf/requests

[5]

AIGC-Audio/AudioGPT: https://github.com/AIGC-Audio/AudioGPT

[6]

TrinityCore/TrinityCore: https://github.com/TrinityCore/TrinityCore

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-12-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • stevearc/oil.nvim[1]
  • unslothai/unsloth[2]
  • ThePrimeagen/harpoon[3]
  • psf/requests[4]
  • AIGC-Audio/AudioGPT[5]
  • TrinityCore/TrinityCore[6]
    • 相关链接
    相关产品与服务
    语音识别
    腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档