暂无搜索历史
引用下我之前写的TTS文章中的话,2023年被大家称为人工智能元年,而在2024年的当下人工智能技术已然在各行各业都展露头角。各种AI工具也层出不穷,其中 语音...
VSR,英文全称 Video-subtitle-remover, 它是一款基于 AI 技术的软件,主要用于去除视频中的硬字幕及水印。
与其他 TTS 模型相反,这款轻量级 TTS 模型将所有数据集、预处理、训练代码和权重来了个一次性大公开。
Morphic 是本周刚在 GitHub 开源的一款由生成式 AI 驱动的搜索引擎。
open-webui 是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作。它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI...
Seal 是一款简单的 Android 视频/音频下载器,使用 Jetpack Compose 进行开发。
在不久前 OpenAI Sora 以其优秀且惊人的视频生成效果迅速走红,更是在一众文生视频模型中脱颖而出,成为了文生视频领域的领头羊。
图像和视频处理技术的发展日新月异,每时每刻都在变化,都在进步,也激发了各大研究人员和AI实验室的创造力和可能性。
大家在使用SD绘画过程中,想必见识到了插件的强大功能,本身纯净版的SD界面是相对简洁的,但是搭配了各种插件后,界面标签栏会增加很多,相应的功能也增加了。
最近,国内各大知名互联网公司,都在发布各自的AI大模型研究成果,这其中不泛有阿里、百度、360、腾讯、华为等,相继在持续‘内卷’。
在如今这个短视频盛行的时代,不管你是自媒体人还是普通人,是否也想过拥有一款能一键生成短视频的工具?
而Python的cachetools库提供了一个简单而强大的接口,用于实现各种缓存策略。
今天要给大家分享一个很Nice的 3D 生成工具集—MVEdit!它不仅可以整合现有模型,还提供了全功能 Demo UI 体验,让你轻松实现文本到 3D、图像到...
ComfyUI-Workflows-ZHO 是一款 ComfyUI 工作流集合,由 AI领域大佬 ZHO 开源出来的,最近深受专家博主和AI绘画爱好者的喜爱。
在这个追求高品质视觉体验的当下,动漫图像和视频的质量要求越来越高,但有时我们面临的是低质量、低分辨率的图像和视频。
当下数字化时代,无论是日常工作还是生活,是互联网从业者还是其他传统行业从业者,对科技工具的依赖也越来越重,文字翻译渠道众多,但图片文字翻译却很少。
AI 技术的飞速发展,正改变着我们生活及工作的方方面面。而在视频领域,近日 字节跳动 新发布了一款令人振奋的新模型: AnimateDiff-Lightning...
开源项目如 ChatGPT/LLMs 等的出现,为开发者提供了强大的聊天应用与开发框架,让人工智能变得更加普及和可定制。
LaVague 是一款用于自动化操作浏览器的大模型,最终将自然语言查询转换为 Selenium 代码。
无论是对于开发者、设计师还是普通用户,寻找适合自己 Mac 系统的免费开源软件一直是一项重要的任务。
暂未填写公司和职称
暂未填写个人简介
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市