首页
学习
活动
专区
工具
TVP
发布

深度学习与python

公众号[深度学习与Python]文章同步更新
专栏作者
3718
文章
2288530
阅读量
43
订阅数
月之暗面Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿
上周,月之暗面(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。去年 10 月发布时,Kimi 仅支持 20 万字的无损上下文输入长度。而在此前,GPT-4Turbo-128k 公布的数字约 10 万汉字,百川智能发布的 Baichuan2-192K 能够处理约 35 万个汉字。
深度学习与Python
2024-03-26
1910
技术领导力:四招教你让团队高效运转
无论团队或组织的规模有多大,要做的事情总会比能做完的事情更多,所以让工作有条不紊是非常重要的。在本文中,我们将讨论实现运营流程和提高技术团队质量的四个步骤。
深度学习与Python
2024-03-26
660
预计容纳 35 万颗 H100!训练 Llama 大模型的基础设施是如何搭建的
作者 | Kevin Lee、Adi Gangidi、Mathew Oldham
深度学习与Python
2024-03-26
680
从 HPC 到 AI:探索文件系统的发展及性能评估
随着 AI 技术的迅速发展,模型规模和复杂度以及待处理数据量都在急剧上升,这些趋势使得高性能计算(HPC)变得越来越必要。HPC 通过集成强大的计算资源,比如 GPU 和 CPU 集群,提供了处理和分析大规模数据所需的算力。
深度学习与Python
2024-03-26
690
eBay 在软件开发生产率方面使用生成式AI的经验
最近,eBay 披露了在开发过程中使用生成式 AI 的经验教训。eBay 在通过 AI 提高开发人员的工作效率方面发现了三个关键途径,即集成商业产品、微调现有的大语言模型(Large Language Models,LLMs) 以及利用内部的知识网络。
深度学习与Python
2024-03-26
560
Transformer 框架论文作者:AI行业被困在了六七年前的原型上
编者按: 3 月 21 日,GTC AI 大会,黄仁勋对话 7 位 Transformer 框架论文作者。他们认为,AI 行业被困在了六七年前的原型上,这个世界需要更好的模型。 “我认为世界需要比 Transformer 更好的东西。我觉得现在与六七年前的情况相似。”“所以尽管原始模型可能不是现在可拥有的最强大的东西,但我们仍然固守在原来的模型上。” Transformer 架构的诞生源于自然语言处理(NLP)领域的迫切需求。在过去,传统的循环神经网络(RNN)和卷积神经网络(CNN)在处理序列数据时面临一些挑战。RNN 虽然能够捕捉序列中的依赖关系,但由于其顺序处理的方式,导致计算效率低下,并且难以处理长距离依赖。而 CNN 虽然可以并行计算,但在处理变长序列时不够灵活。 为了克服这些挑战,2017 年,谷歌的 8 名研究人员联合发表了名为《你所需要的是注意力》(Attention Is All You Need)的论文,并在这篇论文中提出了 Transformer 架构,它能真正地解决 RNN 和 CNN 在处理序列数据时存在的问题。 Transformer 采用了自注意力机制(Self-Attention Mechanism),使得模型能够同时关注序列中的所有位置,从而捕捉长距离依赖关系。此外,Transformer 还采用了多头注意力(Multi-Head Attention)和位置编码(Positional Encoding)等技术,进一步提高了模型的性能。这项具有划时代意义的技术变革彻底改变了技术发展路径。技术背后,这 8 位一同提出该理论的研究人员有的已经离开了谷歌,有的已经创办了自己的公司或是加入了新团队。 近日,国外知名杂志《连线》的资深编辑史蒂文·利维(Steven Levy)近期撰写了一篇文章,为我们揭秘了 Transformer 架构诞生背后的故事。
深度学习与Python
2024-03-26
560
“感觉 GPT Store 被放弃了!” 发布才 2 个月就被 OpenAI 搞成了烂尾项目?
OpenAI GPT Store 发布,被视为人工智能领域的“革命性时刻”,不少人预测它将颠覆 App Store 的模式,带来全新的应用生态系统。
深度学习与Python
2024-03-26
1070
领导力要务:在不断变化的环境中,成倍放大工程效率
从初创公司到大型科技公司,在领导团队经历了各种环境之后,我的使命变得非常明确,那就是创造最好的环境,让人们能够全力以赴地工作。
深度学习与Python
2024-03-26
840
Spring Boot 3.2 和 Spring Framework 6.1添加对 Java 21、虚拟线程和 CRaC 的支持
Spring Framework 6.1(2023 年 11 月 16 日 发布)和 Spring Boot 3.2(2023 年 11 月 23 日 发布)支持运行在 Java 21 之上。这些版本将通过虚拟线程使并发编程更简单、更高效,并改进了反应式编程和 Kotlin 协程。为了缩短“缩容至零(Scale to Zero)”的启动时间,这两个版本对 OpenJDK 的检查点协调恢复(Coordinated Restore at Checkpoint,CRaC) 项目提供了初步支持,而现有的 GraalVM Native Image 支持也通过新发布的 GraalVM 版本得到了显著的性能提升。Spring Framework 6.2 和 Spring Boot 3.4 计划在 2024 年 11 月份发布,将支持即将发布的 Jakarta EE 11,并与 Leyden 项目的 premain 优化保持一致。
深度学习与Python
2024-03-26
910
Stable Diffusion核心团队全部离职!Kimi大面积宕机,月之暗面已扩容5次;Redis不再“开源”引争议 |Q资讯
Kimi 流量持续暴增,月之暗面已连续 5 次扩容;B 站股价大跌遭阿里减持,B 站股价 3 年跌 90% 拼多多、腾讯控股、快手年报发布;苹果 CEO 库克在中国首谈生成式 AI;知乎发布“AI 搜索”功能 ;英伟达黄仁勋回应 AI 芯片定价问题;多方起诉:状告苹果规避反垄断禁令!英伟达推出“全球最强”AI 芯片;马斯克履约开源 Grok;苹果正与谷歌洽谈,将谷歌 Gemini 嵌入“AI 版 iPhone”;OpenAI 有望在年中发布 GPT—5;Oracle 正式发布 Java 22;Stable Diffusion 核心团队被曝集体离职 ……
深度学习与Python
2024-03-26
1350
把大模型装进手机,小米、OPPO、vivo 卷起来了!
随着人工智能技术迅速发展,大模型这把“火”已经烧到了越来越多的领域,手机正是其中之一。有评论甚至认为,“大模型将重新定义手机”。可以预见未来五年,AI 对手机行业的影响,完全可以比肩当年智能手机替代功能机。那么,大模型加持的智能手机会长什么样?大模型如何颠覆手机影像、交互体验?对于程序员来讲,手机操作系统和开发相关技术栈大概会是怎样?
深度学习与Python
2024-03-26
490
持续移动开发如何从测试自动化中获益
测试自动化可以减少手工测试工作、最小化人为错误并加速发布周期,从而为持续移动软件开发提供支持。Burak Ergören 在 QA Challenge Accepted 2023 大会上分享了他在移动软件自动化测试方面的经验。
深度学习与Python
2024-03-26
650
没有App,也没有 App Store,未来的手机会干掉全部应用开发人员吗?
在上个月的 WMC2024 上,德国电信联合高通、Brain.ai 推出了一款突破性创新的概念 AI 手机 T phone。与传统智能手机不同,这款手机主打一个“无 App”,它清除了屏幕上的密密麻麻的 App 图标,只留有一个按钮用来激活手机里的 AI 助手,让用户通过类似 ChatGPT 的操作界面来交互。
深度学习与Python
2024-03-26
420
Sora很难跟进?微调就不是一个岗位?大力出奇迹将继续适用?大模型将对软件生态带来哪些变化?
年初,Sora 爆火,其带来的视觉冲击让我们不禁期待国内企业是否能给我们带来更多惊喜?谷歌发布的 Gemma 首次提出开放模型的概念,这是否是开源、闭源之外的第三条路线?智能编码工具的快速普及是否会带来全新的编程模式?被誉为生成式 AI 最先看到商业落地价值的“Agent”是否能在 2024 年给我们一些冲击?“大力出奇迹”的规律还将继续适用吗?
深度学习与Python
2024-03-26
940
使用 BigDL-LLM 加速 Intel ® 数据中心 GPU 上的 LLM 推理
导读:本文探讨了在 Intel® 数据中心 GPU 上采用 BigDL-LLM INT4 和 FP16 (使用 Self-Speculative Decoding) 进行大型语言模型推理的性能评估。文章介绍了 BigDL LLM 的 Self-Speculative Decoding,通过测量下一个 Token 延迟,分析了不同配置下的推理性能,并提供了性能测试所采用的工具包和硬件环境。结果显示,在 Intel® 数据中心 GPU Max 1100C 上利用 BigDL LLM 进行 FP16 (Self-Speculative Decoding)的大语言模型推理,可以显著改善推理的延迟。这篇文章将为对大型语言模型推理性能感兴趣的读者提供有益的参考和启示。
深度学习与Python
2024-03-26
790
微软开抢年收入上亿美元的 Redis 饭碗?开源性能遥遥领先的 Garnet:无需修改,Redis 客户端可直接接入
近日,微软正式开源缓存存储系统 Garnet。据微软研究院数据库小组高级首席研究员 Badrish Chandramouli 介绍,Garnet 项目是从零开始构建而成,且以性能为核心考量(特别是吞吐量中的线程可扩展性与更高比例的低延迟水平)。
深度学习与Python
2024-03-26
840
Java 22 正式发布
今天,Oracle 发布了 JDK 22,包含 12 项新特性,可以分为四类,即核心 Java 库、Java 语言规范、HotSpot 和 Java 工具。该公司还热衷于吸引新开发人员的关注,部分方法是改进对 Visual Studio Code (VS Code) 的支持。
深度学习与Python
2024-03-26
760
重磅!英伟达官宣全球最强AI芯片:性能提升 30 倍,并将重新设计整个底层软件堆栈
北京时间凌晨 4:00,大洋彼岸的美国加利福尼亚州圣何塞的圣何塞会议中心,被称为英伟达技术盛宴的 GTC 2024 大会正如火如荼地进行着。作为英伟达 2024 的开年大戏,身着标志性皮夹克的万亿富豪黄教主站在舞台中央,平静地甩出继 H100、A100 后的又一系列“核弹”级超级芯片。
深度学习与Python
2024-03-20
770
Nginx 核心开发者发布新分支 Freenginx
最近,F5 前雇员、Nginx 项目主要贡献者发布了 Nginx 的分支 Freenginx。这个新项目是为了解决一个安全争议,并希望成为 Nginx 的可替代方案,由开发人员而不是企业实体负责运营。前 F5 首席软件工程师 Maxim Dounin 发表了对这个分支的见解:
深度学习与Python
2024-03-20
800
刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。
深度学习与Python
2024-03-18
1560
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档