发布

技术人生黄勇

专栏成员
65
文章
42785
阅读量
12
订阅数
聊一聊五种智能体模式
随着 AI 驱动型应用程序的快速发展,开发人员越来越多地利用大语言模型(LLM)构建智能体,以高效执行复杂任务。然而,最有效的实现并非依赖于复杂的框架,而是采用简单且可组合的设计模式。
技术人生黄勇
2025-03-04
280
太震撼了!梁文锋带领DeepSeek团队发表注意力新机制重磅论文,网友:这才是真正的OpenAI
就在马斯克发布grok3,sam altman 还在犹豫要不要开源时,刚刚梁文锋作为co-authors携deepseek研究团队丢出重磅研究论文成果,DeepSeek 发布了最新的研究成果——原生稀疏注意力(Native Sparse Attention, NSA)! 这项技术有望大幅提升下一代大语言模型处理长文本的能力,同时还能兼顾效率,可谓是 LLM 领域又一里程碑式的进展!
技术人生黄勇
2025-02-19
1170
DeepSeek真的有那么强?|特朗普执政对中美关系以及中国经济的影响
“ 这两天DeepSeek大火破圈,成了现象级,服务器经常出现无法回答的情况。”
技术人生黄勇
2025-02-04
2270
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹实录(三)
不懂硬件却一头热地扎进AI硬件领域的我,发起桌面机器人项目后,这段时间捣鼓下来,有了一点进展,跟朋友们汇报。
技术人生黄勇
2025-01-16
690
把ChatGPT装进二次元手办,你来吗?手搓AI桌面机器人实录(二)
即使是开源项目,如果要自己动手采购,打板,焊接,3D打印,烧录,组装,调试,也是一项不小的工程。
技术人生黄勇
2025-01-03
480
把ChatGPT装进二次元手办,你来吗?手搓AI桌面机器人实录(一)
上次众筹桌面机器人的文章《把ChatGPT装进二次元手办,我想造一台会聊天的AI桌面机器人,你来吗?》发出来后,不少朋友加了众筹的群,表示做出来后想要一个,机器人长下面这样。
技术人生黄勇
2024-12-27
1400
仅4B参数!面壁端侧模型MiniCPM 3.0达到GPT-3.5水平
“ 端侧模型正成为一个备受关注的技术前沿。面壁智能发布的MiniCPM 3.0,以其4B参数量在性能上逼近GPT-3.5,更在端侧部署上实现了技术突破。这款小而强大的模型,不仅为移动设备智能化提供了全新可能,也为人工智能的轻量化和普及性开辟了更广阔的想象空间。”
技术人生黄勇
2024-12-09
2400
目前最大最好的MoE开源模型,腾讯开源了混元Hunyuan-large和3D模型
“ 混元大模型(Hunyuan-large)正式发布,可免费商用。基于MoE架构,拥有389B参数规模,支持256K的上下文。在多项评测中超越了LLama3.1。混元大模型采用了高质量合成数据增强训练、专家特定的规模定律等创新技术。”
技术人生黄勇
2024-11-07
2380
又又又史上最强?OpenAI的草莓:OpenAI-o1,推理更难的科学、编码和数学模型
“ OpenAI的o1模型的发布带来了超凡的推理能力,但它在实际使用中表现如何?从一个用户角度出发,我们来看看“草莓” o1的实际应用效果。看看它不同推理任务中的表现,包括语言理解、问题解答等,实现原理等等。”
技术人生黄勇
2024-09-17
1830
ChatGLM-4-9b-chat本地化|天翼云GPU上vLLM本地部署开源模型完整攻略
“ 拥有一个私有化的领先国产开源大模型?本文详细介绍了如何在天翼云GPU上使用vLLM部署ChatGLM-4-9b-chat本地化模型的完整攻略,助您快速上手。”
技术人生黄勇
2024-08-19
1.1K1
AI人工智能大模型失守!ChatGPT、BARD、BING、Claude 相继被"提示攻击"攻陷!
“ 提示攻击,一种利用巧妙的技巧和迷惑性的指令,让这些顶尖的语言模型产生混乱或错误的回答的方法。”
技术人生黄勇
2024-07-19
1950
Claude 2 解读 ChatGPT 4 的技术秘密:细节:参数数量、架构、基础设施、训练数据集、成本
“ 解密 ChatGPT 4的模型架构、训练基础设施、推理基础设施、参数计数、训练数据集组成、令牌计数、层数、并行策略、多模态视觉适应、不同工程权衡背后的思维过程、独特的实施技术。”
技术人生黄勇
2024-07-19
4980
又一家顶级的大模型开源商用了!Meta(Facebook)的 Llama 2 搅动大模型混战的格局
今年2月24日,Meta推出大语言模型Llama(羊驼),按参数量分为7B、13B、33B和65B四个版本。它凭借一己之力,引导了开源大模型的发展,由其演变而来的家族模型非常庞大,庞大到羊驼家族的名词都被用光了,而且有些模型和 ChatGPT 3.5 都有一战之力。
技术人生黄勇
2024-07-19
4710
工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功
“ 之前尝试过在各种不同的云平台、云算力,部署清华大模型 ChatGLM2-6B,有失败有成功,但不是很理想。这次使用免费的阿里云机器学习GPU资源,终于成功了。”
技术人生黄勇
2024-07-19
1680
工程落地实践|基于 ChatGLM2-6B + LangChain 搭建专属知识库初步完成
“ 经过前期的探索和准备,我们终于迈出了第一步:使用 ChatGPT 和 LangChain这些强大的工具,初步完成了专属知识库的搭建。”
技术人生黄勇
2024-07-19
1400
教程|使用免费GPU 资源搭建专属知识库 ChatGLM2-6B + LangChain
“ 搭建私人定制化AI知识库!详解如何使用云计算资源,部署ChatGLM和LangChain模型,打造专属智能问答工具。”
技术人生黄勇
2024-07-19
2560
AI巨头对决:ChatGPT、Bard、Claude 同台竞技:解析一段相同的人工智能代码
(知识库项目介绍见这篇文章:教程|使用免费GPU 资源搭建专属知识库 ChatGLM2-6B + LangChain)‍‍‍‍‍‍‍‍‍‍
技术人生黄勇
2024-07-19
1220
为什么你在用 ChatGPT 的提示词 Prompt 似乎效果不如人意?
“ 在使用ChatGPT的神奇提示词Prompt时,或许你会发现它的效果并不总是如人所愿。让我们看看其中的原因,以及如何避免这类问题
技术人生黄勇
2024-07-19
1740
ChatGPT 官方安卓版正式发布!两种下载安装详细教程
继ChatGPT 苹果手机版推出后,OpenAI官方最近宣布推出了安卓版本。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
技术人生黄勇
2024-07-19
23.4K1
ChatGLM 更新:LongBench—评测长文本理解能力的数据集,支持 32k 上下文的 ChatGLM2-6B-32K
“ ChatGLM这次推出了两大更新!一个是长文理解能力测试集LongBench,让我们可以检验 ChatGLM 阅读长篇文章的水平。另一个是全新支持32K上下文的ChatGLM2-6B-32K模型!这无疑将会带来更连贯、合理的长篇对话体验。”
技术人生黄勇
2024-07-19
3060
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档