首页
学习
活动
专区
工具
TVP
发布

AI技术探索和应用

研究前沿AI技术,并应用到实际业务场景。
专栏作者
20
文章
37972
阅读量
15
订阅数
浅析SORA视频生成原理
OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。
Luoyger
2024-03-13
3230
ChatGLM模型微调
ChatGLM3: https://github.com/THUDM/ChatGLM3
Luoyger
2024-02-02
7010
带你快速了解大模型微调原理
大模型微调(Fine-tuning)是指在已经预训练好的大型语言模型基础上,使用特定的数据集进行进一步的训练,以使模型适应特定任务或领域。
Luoyger
2024-02-02
1.1K0
文档和图片的OCR解析实践
文档中的图片或图片本身的OCR识别可以通过第三方工具如PaddleOCR和CNOCR来实现,如下是两个识别过程的实践,以及使用Streamlit构建可视化页面的示例。
Luoyger
2024-01-16
2980
多模态信息提取和问答
经过分幕后,内容理解的难度降低。我们可以通过MLLM + 问答的方式来将视频中的内容,提取成为文本形式的信息。最简单的例子是,直接让MLLM来描述视频中画面的内容。比较常用的MLLM:video-llama、minigpt4、vision-glm、mPLUG-Owl等。
Luoyger
2024-01-16
2790
常见的大模型评测数据集
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
Luoyger
2024-01-16
1.4K0
StableDiffusion-WebUI安装
在webui.py文件77行左右如下代码前加入cmd_opts.listen = True,可以让外部地址访问服务。
Luoyger
2023-12-12
4950
OpenAI模型微调快速入门
官方文档:https://platform.openai.com/docs/guides/fine-tuning
Luoyger
2023-12-11
7370
一文带你了解OpenAI近期更新开放的API功能
OpenAI近期召开了开发者大会,同时也发布和开放了一些新的功能特性,比如新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放,GPTs商店已经对Plus账户开放。
Luoyger
2023-12-07
5950
AI换脸FaceFusion的安装和使用
FaceFusion是一款可以直接换脸的项目,支持图片换脸和视频换脸,且不需要进行模型训练,是roop项目的迭代项目。
Luoyger
2023-11-03
2.5K0
使用AI生成背景音乐
开源项目地址:https://github.com/facebookresearch/audiocraft
Luoyger
2023-11-03
3820
快速上手chatglm.cpp模型量化工具
chatglm.cpp可以对ChatGLM系列的模型进行量化,满足在低性能的机器上进行推理,其使用的教程如下。
Luoyger
2023-10-08
2.5K0
ChatGLM2-6B使用入门
ChatGLM2-6B模型的中文效果较好,相比ChatGLM-6B模型有了进一步的优化,可以本地部署尝试。
Luoyger
2023-10-08
8650
教你快速上手Xinference分布式推理框架
Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。
Luoyger
2023-09-12
5.1K0
使用vLLM加速大语言模型推理
vLLM 是一个快速且易于使用的库,用于 LLM 推理和服务,和 HuggingFace 无缝集成。区别于 chatglm.cpp 和 llama.cpp,仅是在 GPU 上的模型推理加速,没有 CPU 上的加速。
Luoyger
2023-09-12
6.5K0
AIGC之文本和图片生成向量
文本和图片生成向量的方式一般是通过已有的模型进行生成,在流行的模型托管平台上已有大量开源的Embedding模型,如国外的HuggingFace平台和国内的ModelScope平台。
Luoyger
2023-08-01
1.3K0
Nginx代理ChatGPT流式访问
当ChatGPT无法直接访问时,需要某个地方设置一个代理服务,如Nginx代理,接下来介绍如何设置API代理并保持流式输出的能力。
Luoyger
2023-07-04
2.5K0
ChatGPT的API调用方式总结
OPENAI的ChatGPT API调用方式有多种,有基于SDK和HTTP的调用方式,也有流式和非流式的调用方式,接下来将分别举例说明。
Luoyger
2023-07-04
3K0
LangChain对象关系梳理
BaseModel是python中用于数据接口定义检查与设置管理的库(pydantic库)。pedantic在运行时强制执行类型提示,并在数据无效时提供友好的错误。参考:https://www.cnblogs.com/dyl0/articles/16896330.html
Luoyger
2023-05-15
2.4K0
LangChain Agent执行原理分析
agent的类型是AgentExecutor,继承自Chain,调用agent.run()方法会调用Chain的run()方法。
Luoyger
2023-05-15
5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档