首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8963
文章
6290331
阅读量
277
订阅数
长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale AI数据库正式开源
大模型(LLM)的浪潮已经涌动一年多了,尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场,成为当之无愧的风口。在 LLM 这条赛道上,有的研究专注于增加模型参数,有的疯狂卷多模态…… 这当中,LLM 处理上下文长度的能力成为了评估模型的一个重要指标,更强的上下文意味着模型拥有更强的检索性能。例如有些模型一口气可以处理高达 100 万 token 的能力让不少研究者开始思考,RAG (Retrieval-Augmented Generation,检索增强生成)方法还有存在的必要吗?
机器之心
2024-04-12
2490
专为数据库打造:DB-GPT用私有化LLM技术定义数据库下一代交互方式
2023 年 6 月,蚂蚁集团发起了数据库领域的大模型框架 DB-GPT。DB-GPT 通过融合先进的大模型和数据库技术,能够系统化打造企业级智能知识库、自动生成商业智能(BI)报告分析系统(GBI),以及处理日常数据和报表生成等多元化应用场景。DB-GPT 开源项目发起人陈发强表示,“凭借大模型和数据库的有机结合,企业及开发者可以用更精简的代码来打造定制化的应用。我们期望 DB-GPT 能够构建大模型领域的基础设施,让围绕数据库构建大模型应用更简单,更方便”。据悉,DB-GPT 社区自成立以来,已汇聚了京东、美团、阿里巴巴、唯品会、蚂蚁集团等众多互联网企业的开发者共同参与,短短半年时间便迅速成长为一个近万星的开源社区,受到了行业和开发者的认可。期间也多次登上 GitHub Trending、Hacker News 首页。
机器之心
2024-01-11
5330
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布|SIGGRAPH Asia
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 SVBRDF)。它是视觉计算中不可或缺的组成部分,在文化遗产、电子商务、电子游戏和视觉特效等领域中有着广泛的应用。
机器之心
2023-11-27
1850
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布|SIGGRAPH Asia
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 SVBRDF)。它是视觉计算中不可或缺的组成部分,在文化遗产、电子商务、电子游戏和视觉特效等领域中有着广泛的应用。
机器之心
2023-11-27
1480
ICCV 2023 | 重塑人体动作生成,融合扩散模型与检索策略的新范式ReMoDiffuse来了
人体动作生成任务旨在生成逼真的人体动作序列,以满足娱乐、虚拟现实、机器人技术等领域的需求。传统的生成方法包括 3D 角色创建、关键帧动画和动作捕捉等步骤,其存在诸多限制,如耗时较长,需要专业技术知识,涉及昂贵的系统和软件,不同软硬件系统之间可能存在兼容性问题等。随着深度学习的发展,人们开始尝试使用生成模型来实现人体动作序列的自动生成,例如通过输入文本描述,要求模型生成与文本要求相匹配的动作序列。随着扩散模型被引入这个领域,生成动作与给定文本的一致性不断提高。
机器之心
2023-09-08
3700
Apache IoTDB:更适合工业物联网场景的新型数据库,存、查、用不再是难题
随着步入工业 4.0 时代,数字化和自动化的引入,生产环境变得更加高效。同时智能设备带来的海量数据的潜在价值被人们关注,可如何高效地存储智能设备产生的数据,如何更好地对海量数据进行分析成为了难题。传统的数据库模型和存储方式俨然已经无法适应这样的需求。于是有了时序数据库,旨在实现高效地存储、查询数据,帮助更好地发掘数据潜在的价值。
机器之心
2023-09-08
2580
OceanBase进军公有云这一年:在最激烈的赛道,杀出来
2022 年,中国公有云数据库市场规模首次过半[1],预计未来占比将进一步扩大。许多中国的数据库厂商也抓住了云计算的发展趋势,积极进军云数据库。
机器之心
2023-09-08
2580
15B模型单项能力锤得过GPT3.5,开源SQLCoder已上岗
就在他发布了这张图后的两周内,又有三位新成员加入了这个大家庭,它们分别是 DeciCoder、OctoCoder 以及最新的成员 SQLCoder。
机器之心
2023-09-08
3110
MIT打造实验科学家的大模型助手,语音聊天就能开展实验
目前,人工智能以及自主实验室主要由 Python 等语言编写,然而,并非所有实验科学工作者都擅长使用这类编程语言,因而其在真实世界实验中的影响力还是比较有限。
机器之心
2023-08-07
3040
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
随着大语言模型(Large Language Models)的爆火,例如 ChatGPT,GPT-4,PaLM,LLaMA 等,如何让大语言模型更好的应对有很长的上下文信息(超出其最大处理长度)的场景并利用相关历史信息做复杂的推理,成为一个热点研究话题。现有的主流做法是给大语言模型增加记忆(memory)模块,在需要的时候从记忆模块中提取相关的历史信息帮助大语言模型。
机器之心
2023-08-07
2320
当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准​
大模型(LLM)为通用人工智能(AGI)的发展提供了新的方向,其通过海量的公开数据,如互联网、书籍等语料进行大规模自监督训练,获得了强大的语言理解、语言生成、推理等能力。然而,大模型对于私域数据的利用仍然面临一些挑战,私域数据是指由特定企业或个人所拥有的数据,通常包含了领域特定的知识,将大模型与私域知识进行结合,将会发挥巨大价值。
机器之心
2023-08-04
4180
一天自动发现四大数据库100+漏洞,浙大研究获SIGMOD 2023最佳论文
机器之心专栏 机器之心编辑部 本文中,浙大的研究者提出了一种名为 Transformed Query Synthesis(TQS)的方法。在运行了 24 小时后,TQS 成功找到了 115 个漏洞,包括 MySQL 中 31 个、MariaDB 中 30 个、TiDB 中 31 个、PolarDB 中 23 个。 2023 年度的 ACM SIGMOD/PODS 国际数据管理大会(SIGMOD 2023)将于当地时间 6 月 18-23 日在美国西雅图举办。近日,该会议公布了最佳论文名单,微软研究院的《Pr
机器之心
2023-05-22
4280
两年之后,微软「海底数据中心」被打捞出水,故障率仅为陆地1/8
机器之心报道 作者:张倩 「我们的水下数据中心故障率只有陆地的 1/8」,在微软的实验成功之后,将数据中心沉入海底或成为未来的一大趋势。 近日,微软宣布,他们从苏格兰的一处海域打捞起了一个数据中心: 这个巨大的圆柱形数据中心包裹着 864 台服务器,可以存储 27.6PB 的数据,2018 年被沉入了苏格兰奥克尼群岛的一片海域。 两年之后的打捞结果表明,该数据中心的故障率仅为陆地上的 1/8。这一结果非常重要,因为对于这个密封在海底容器中的数据中心来说,服务器的维修要比在陆地上困难得多。超低的故障率表明
机器之心
2023-03-29
6460
这是波士顿动力机器狗「他爸」?美军80年代机器狗「考古」,身高3米,人机联合操作
机器之心报道 编辑:张倩 这个 3 米高的庞然大物诞生于 80 年代,比波士顿动力机器狗还早 20 多年。 前段时间,波士顿动力机器狗 Spot 正式开售,而且已经有买家晒出了首个开箱视频。波士顿动力机器狗项目由美国国防高等研究计划局(DARPA)资助,初衷是研制一种能够负重的机械骡,和士兵一起在传统机械车辆无法行驶的粗糙地形上作战。2005 年,Spot 的前辈——「Big Dog」机器狗的发布让波士顿动力声名远播。 波士顿动力发布的「Big Dog」机器狗。 但很多人不知道的是,波士顿动力 Spo
机器之心
2023-03-29
3700
周博磊自述5年研究经历:一个神经元的价值和一个神经病的坚持
机器之心转载 作者:周博磊 一个神经元能够催生多少故事?香港中文大学信息工程系助理教授周博磊近日撰文介绍了他自 2015 年开始至今对神经元的研究经历。最近,他与 David Bau、朱俊彦等人合作的神经元研究论文发表在了 PNAS 杂志上。 以下是周博磊的原帖内容: 憋了好久的一个工作,终于发表在九月份的 PNAS 杂志上。David 大叔还专门做了一个课题网站,数据和代码也一并公布了。感谢 MIT 团队的合作,算是终于达到圆满状态。论文目的,是为了理解一个神经元的价值。 论文:Understanding
机器之心
2023-03-29
2410
这门「没落」语言时薪451元,自由职业平台Upwork公布兼职语言薪资排行
机器之心报道 编辑:张倩 海外知名自由职业平台 Upwork 的一份调查显示,在众多编程语言中,Objective-C 成为该网站时薪最高的语言,掌握该语言的程序员每小时可以赚 66 美元(约合 451 元人民币)。 对于程序员来说,如果你的工作不是 996 或 007,那么兼职也是一个很好的创收途径,比如在 Upwork 这种兼职网站上。 在最新的一份调查中,Upwork 公布了 15 种兼职收入最高的编程语言,Objective-C 以时薪 66 美元位居榜首。 Objective-C 是扩充 C 的
机器之心
2023-03-29
8820
独家 | 以国家战略科学家身份,顶级AI学者朱松纯回国,筹建北京通用AI研究院
机器之心报道 机器之心编辑部 今日,知乎热帖称顶级 AI 华人学者、UCLA 教授朱松纯拟加入清华自动化系,职务为教研系列教授。经机器之心求证,此次朱松纯教授以国家战略科学家的身份回国,受邀筹建北京通用人工智能研究院并担任院长。同时,朱教授也将与北京大学、清华大学在相关领域开展研究合作。 根据知乎上的一则帖子,近日清华大学人力资源开发办公室发布公示,加州大学洛杉矶分校(UCLA)统计学与计算机科学教授,UCLA 计算机视觉、认知、学习与自主机器人中心主任朱松纯拟加入清华大学自动化系工作,职务为教研系列教授。
机器之心
2023-03-29
1.2K0
加入谷歌AI,Uber首席科学家Zoubin Ghahramani离职
机器之心报道 编辑:魔王 在担任 Uber 首席科学家职位三年多后,Zoubin Ghahramani 宣布加入谷歌 AI。 今日,Uber 前首席科学家 Zoubin Ghahramani 宣布加入 Google AI,领导谷歌大脑团队。 谷歌 AI 负责人 Jeff Dean、谷歌 AI 成员纷纷转发评论,欢迎 Zoubin 的加入。 此时,距离 Zoubin Ghahramani 就任 Uber 首席科学家已经过去了三年多。但 Zoubin Ghahramani 的标签从来不只是 Uber 首席科学
机器之心
2023-03-29
2980
NeurIPS 2020注册即将开启:25美元进场,Keynote全免费,今年不用抢票了
机器之心报道 编辑:泽南 NeurIPS 2020 的注册将于 9 月 15 日开启,准备好了吗?今年不用抢票抽奖了。 因为疫情原因,今年 6 月神经信息处理系统大会 NeurIPS 2020 组委会发布了公告,决定将 2020 年大会举办为一届纯线上会议。 作为人工智能领域最热门的全球学术会议,NeurIPS 最近几年不断刷新参会人员记录,去年的大会现场参与人数高达 1.3 万人。今年来到线上,自然不需要希望前来参会的研究者们抢票,花费时间预定行程。 刚刚,NeurIPS 组委会发布了最新通知,本届大会主
机器之心
2023-03-29
3870
GPT自动证明数学题,结果被专业数据库收录,数学家点赞
机器之心报道 参与:魔王、小舟、杜伟 继 GPT-3 之后,OpenAI 推出用于数学问题的 GPT-f,利用基于 Transformer 语言模型的生成能力进行自动定理证明。由 GPT-f 发现的 23 个简短证明已被 Metamath 主库接收。 大名鼎鼎的 Transformer 架构不仅在 NLP 领域呼风唤雨,还能用于计算机视觉,比如目标检测。但仅仅这样就足够了吗?最近,OpenAI 研究者尝试用基于 Transformer 的语言模型做自动定理证明(ATP)! 论文一作 Stanislas P
机器之心
2023-03-29
4830
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档