暂无搜索历史
Craft 是 CodeBuddy 的核心智能体,支持通过自然语言指令进行多文件代码生成、修改和重构。无论是创建新项目、重构旧代码,还是生成可执行应用,Craf...
腾讯 | 后台策略工程师 (已认证)
今年AI视频生成技术非常火爆,于是我便有了一个想法:能不能直接用AI生成一个好看的微信红包封面呢?
OpenAI正式向免费用户推出轻量版 Deep Research 功能。该功能由 o4-mini 模型提供支持,虽然性能略逊于完整版,但成本更低,用户可享受更高...
最近我一直在使用Qwen2-VL模型进行多模态数据集的微调。实际上,这套方法不仅适用于Qwen2-VL模型,其他的大模型,如Llama3,同样可以用此方法进行微...
智谱早前发布的GLM-PC在功能和用户体验上明显更胜一筹。GLM-PC由智谱AI推出,基于其多模态大模型CogAgent打造,是全球首款面向公众的即用型电脑智能...
近年来,大语言模型可谓是“井喷式”爆发,尤其是 ChatGPT 和 GPT-4 的发布,掀起了整个 AI 圈的技术热潮。各家厂商纷纷卷入其中,而我也抱着“白嫖大...
如今,通过AI技术克隆声音已经变得非常简单。仅使用开源的代码,几分钟内即可完成快速声音克隆。
GPT-4o 新的绘图功能上线之后,又开始爆火起来。最近各种自媒体公众号都在吹爆这个新的功能。
其实 AI Agent 本质上还是要依赖于背后的大模型能力,如果大模型能力本质上效果不佳,就算Agent 再怎么去设计,其最后的效果还是很难达到“好用”的程度。
如今我们越来越明显地感受到,“Scaling Law 规模扩展”似乎走到了尽头。即使投入了庞大的算力资源,Grok-3 的性能也只略高于 GPT-4o,这让人不...
Agent(智能体)本质上是建立在大语言模型(LLM)基座之上的系统。随着近年来大模型推理能力的显著提升,Agent 的实现变得更为可行和高效。在多个领域中,从...
Operator 背后的核心是 OpenAI 新研发的 Computer-Using Agent (CUA) 模型。CUA 结合了 GPT-4o 的视觉理解能力...
Meta最新发布了原生多模态大模型 Llama 4,一经亮相即登上LMSYS大模型排行榜第二名,仅次于Google的Gemini-2.5-pro,分差仅为22分...
ChatGPT 的这种能力,有点类似于一个基于我们历史对话数据自动构建的 RAG(Retrieval-Augmented Generation)架构。
就我个人体验来看,知乎上接入的DeepSeek-R1模型效果非常不错。知乎直答不仅支持个人知识库管理,还能借助DeepSeek-R1实现对知乎内容的搜索与深度分...
OpenAI最近在周四宣布,想免费用户也开始推送轻量版的Deep Research。这个功能由o4-mini 模型版本提供支持。虽然其能力不及“完整版”深度研究...
在最新公开榜单中,Grok-3 成为首个综合得分突破 1400的大模型,可谓风头无两。不过,拆开各分项指标后,我们可以看到更细致的差异。
百度终于在面对 DeepSeek 的爆火之后,重新发布新一代大模型。分别包括了文心大模型 4.5 和文心大模型 X1。同时在官网上已经上线了这两款模型,而且已经...
Meta 终于发布了一个原生多模态大模型 Llama4。而且一经发布,在大模型LMSYS排行榜上,Llama 4 Maverick冲上第二。仅仅比 Gemini...
除了之前 Sora 曾经公布过能够生成 1 分钟的视频之外(这个功能目前还没有看到 OpenAI 开放出来),目前的一些视频生成软件还是很难够生成 1 分钟超长...
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址