首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2138
文章
1929923
阅读量
188
订阅数
独家 | 何时微调大语言模型?
领英(LinkedIn)账号的fork中向我提出了这样一个问题:如何微调诸如LLaMA的开源模型。公司正在寻找销售LLM托管和部署解决方案的业务案例,将人工智能和LLM应用于具体的产品。我问他们为什么不使用像ChatGPT这样的非开源模型时,他们没有给出正确的答案。所以我决定写这篇文章来解答如何利用llm解决日常业务问题。
数据派THU
2023-08-08
3060
独家 | 开始使用LangChain:帮助你构建LLM驱动应用的新手教程
自从ChatGPT发布以来,大型语言模型 (LLMs) 已经获得了很大的普及。尽管你可能没有足够的资金和计算资源在你的地下室从头开始训练一个LLM,但你仍然可以使用预先训练的LLMs来构建一些很酷的东西,例如:
数据派THU
2023-08-08
7440
训练提速17%,第四范式开源强化学习研究框架,支持单、多智能体训练
来源:机器之心本文约4000字,建议阅读10分钟强化学习研究框架 OpenRL 是基于 PyTorch 开发的,已经在 GitHub 上开源。 OpenRL 是由第四范式强化学习团队开发的基于 PyTorch 的强化学习研究框架,支持单智能体、多智能体、自然语言等多种任务的训练。 OpenRL 基于 PyTorch 进行开发,目标是为强化学习研究社区提供一个简单易用、灵活高效、可持续扩展的平台。目前,OpenRL 支持的特性包括: 简单易用且支持单智能体、多智能体训练的通用接口 支持自然语言任务(如对话任务
数据派THU
2023-05-18
3980
收藏!大型语言模型(LLMs)大盘点,含源码及Demo地址(附链接)
来源:AINLPer 本文约4000字,建议阅读8分钟 本文作者盘点了一些组织或者个人开源的模型。 ChatGPT爆火出圈,国内很多高校、研究机构和企业都发出类似ChatGPT的发布计划。ChatGPT没有开源,复现难度极大,即使到现在GPT3的完全能力也没有任何一个单位或者企业进行了复现。刚刚,OpenAI又官宣发布了图文多模态的GPT4模型,能力相对ChatGPT又是大幅提升,似乎闻到了以通用人工智能主导的第四次工业革命的味道。 无论是国外还是国内,目前距离OpenAI的差距越来越大,大家都在紧锣密鼓的
数据派THU
2023-05-11
1.5K0
熔岩羊驼LLaVA来了:像GPT-4一样可以看图聊天,无需邀请码,在线可玩
来源:机器之心本文约2500字,建议阅读5分钟尽管 LLaVA 是用一个小的多模态指令数据集训练的,但它在一些示例上展示了与多模态模型 GPT-4 非常相似的推理结果。 GPT-4 的识图能力什么时候能上线呢?这个问题目前依然没有答案。 但研究社区已经等不及了,纷纷自己上手 DIY,其中最火的是一个名为 MiniGPT-4 的项目。MiniGPT-4 展示了许多类似于 GPT-4 的能力,例如生成详细的图像描述并从手写草稿创建网站。此外,作者还观察到 MiniGPT-4 的其他新兴能力,包括根据给定的图像
数据派THU
2023-05-11
2690
笔记本就能运行的ChatGPT平替来了,附完整版技术报告
来源:机器之心本文约4300字,建议阅读8分钟初步的技术报告简要描述了 GPT4All 的搭建细节。 GPT4All 是基于大量干净的助手数据(包括代码、故事和对话)训练而成的聊天机器人,数据包括~800k 条 GPT-3.5-Turbo 生成数据,基于 LLaMa 完成,M1 Mac、Windows 等环境都能运行。或许就像它的名字所暗示的那样,人人都能用上个人 GPT 的时代已经来了。 自从 OpenAI 发布 ChatGPT 后,最近几个月聊天机器人热度不减。 虽然 ChatGPT 功能强大,但 Op
数据派THU
2023-04-12
9230
中文对话大模型BELLE全面开源!
来源:高能AI本文约1000字,建议阅读5分钟模型调优仅使用由ChatGPT生成的数据,为中文指令提供更好的支持。 中文对话大模型开源社区迎来了一名浓眉大眼的新成员!最新项目BELLE(BE Large Language model Engine)基于BLOOM和LLAMA针对中文做了优化,模型调优仅使用由ChatGPT生成的数据,为中文指令提供更好的支持。 开源地址:https://github.com/LianjiaTech/BELLE 该项目目前已经开源了如下内容,并且在持续更新中: 150万中文指令
数据派THU
2023-04-05
7010
创建可微物理引擎Nimble,开源SOTA人体骨骼模型,斯坦福腿疾博士生用AI「助跑」人生
来源:机器之心 本文约2000字,建议阅读5分钟 身残志坚,斯坦福大学的这位人工智能 + 机器人博士生想用技术克服身体缺陷。 有一位研究者,他身患残疾,出生时便患有退行性神经疾病,该疾病一直攻击着他的外周运动神经元(进行性神经性腓骨肌萎缩症, 2A 型)。他就是来自斯坦福大学的博士生 Keenon Werling。 为了走路,Werling 不得不带上腿支架,可能随着病情的恶化,还会坐上轮椅。 不能像正常人一样行走,但可以通过技术来帮助自己。因此,Werling 对设计、构造和控制外骨骼以帮助恢复行动不便
数据派THU
2023-03-29
1960
炸裂!VSCode 摸鱼神器!!!
来源:玩转Github 本文约1600字,建议阅读5分钟 除了开发插件外,有哪些可以上班摸鱼的插件呢?这里给大家写一个渔夫指南,汇总一些在VSCode中可以“摸鱼”的好玩插件! 现在使用VsCode编码的人越来越多,凭借着免费,开源,轻量,跨平台的特点收货了一大批忠实粉丝。 以其可支持扩展程序(通过安装扩展程序,VS Code 可以支持更多新的语言、界面主题、测试器,以及更多的增值服务),而备受广大开发者追捧。 除了开发插件外,有哪些可以上班摸鱼的插件呢?这里给大家写一个渔夫指南,汇总一些在VSCode
数据派THU
2023-03-29
1.7K0
​两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~
来源:量子位(ID:QbitAI) 本文约2000字,建议阅读8分钟 我们的成果可以帮助整个科学界,为生物学研究加速。 喜大普奔!近日一波Nature、Science齐发文,可把学术圈的嗑盐人们高兴坏了。 一边是“AI界年度十大突破”AlphaFold2终于终于开源,登上Nature。 另一边Science又出报道:华盛顿大学竟然还搞出了一个比AlphaFold2更快更轻便的算法,只需要一个英伟达RTX2080 GPU,10分钟就能算出蛋白质结构! 要知道,当年AlphaFold2横空出世,那是真·沸腾
数据派THU
2023-03-29
3040
快手八卦!突破TensorFlow、PyTorch并行瓶颈的开源分布式训练框架来了!
来源:AI前线 本文约5200字,建议阅读8分钟 本文介绍了专门针对分布式场景设计了特定的优化算法同比,性能较同类提升60%。 近日,快手和苏黎世理工宣布开源分布式训练框架 Bagua(八卦),相比于 PyTorch、TensorFlow 等现有深度学习开源框架仅针对系统层面进行优化,Bagua 突破了这一点,专门针对分布式场景设计了特定的优化算法,实现了算法和系统层面的联合优化,性能较同类提升 60%。 研发背景 随着摩尔定律的失效,单个计算单元的能力已经远远无法满足数据的指数级增长。比如,快手每天上传
数据派THU
2023-03-29
3410
自动驾驶资料合集:视频、书籍与开源项目
来源:深蓝前沿教育 本文约1500字,建议阅读5分钟 本文为你分享自动驾驶资料合集。 这是2021最新的自动驾驶资料合集,对于正在学习或者计划入门自动驾驶领域的同学来说,相信会有很大帮助。 课程及公开视频 一、无人驾驶综合 1. 百度与Udacity合作免费课程 课程链接: https://apollo.auto/devcenter/coursetable_cn.html 推荐原因:课程通过7小节概述了自动驾驶的6个核心模块,即高精度地图、定位、感知、预测、规划、控制,每小节通过10-15分钟视频概述了核
数据派THU
2023-03-29
3070
开源方案复现ChatGPT流程!1.62GB显存即可体验,单机训练提速7.73倍
来源:潞晨科技 本文约4000字,建议阅读8分钟Colossal-AI 快速跟进,首个开源低成本复现 ChatGPT 完整流程。 火爆全网的 ChatGPT,仿佛开启了第四次工业革命,让微软、谷歌等全球科技巨头打得昏天黑地,引得各路玩家纷纷入局,抢占赛道。 然而由于 OpenAI 没有开源 ChatGPT,如何有效复现 ChatGPT 已成为摆在大家面前的头号难题,急需可靠的开源共建方案。 Colossal-AI 快速跟进,首个开源低成本复现 ChatGPT 完整流程。作为当下最火热的开源 AI 大模型解决
数据派THU
2023-03-29
1.2K0
推荐20个开源的前端低代码项目
来源:低代码一哥本文约2500字,建议阅读9分钟本文分享几个值得学习和使用的前端低代码开源项目,更深入地了解什么是低代码。 近几年,在技术领域低代码是比较热门的话题,比如阿里云推出了钉钉低代码,通过简单的拖拽、配置,即可完成业务应用的搭建,腾讯云则是推出了微搭,通过行业化模板、拖放式组件和可视化配置快速构建多端应用。 低代码是基于可视化和模型驱动理念,结合云原生与多端体验技术,它能够在多数业务场景下实现大幅度的提效降本,为专业开发者提供了一种全新的高生产力开发范式。下面就来分享几个值得学习和使用的前端低代码
数据派THU
2023-03-29
2.9K0
15年封神,GitHub开发者破亿!这个滋养了全世界码农的网站,已成传奇
来源:新智元本文约1300字,建议阅读8分钟2008年,三位开发者共同创立了GitHub。历经15年,GitHub的开发者数量已经超过一亿。 2008年,三位开发者共同创立了GitHub。历经15年,GitHub的开发者数量已经超过一亿。 封神15年,GitHub用户现如今破了1亿! 2019年,GitHub曾设定了一个目标:到2025年使用GitHub的开发人员达到1亿。 现如今,这个目标提前2年实现了。 15年封神之路 2008年,当无数人在为代码协作感到头疼时,GitHub横空出世。 自
数据派THU
2023-03-29
2910
OpenAI开源Point-E,可在Nvidia V100 GPU上1-2分钟生成3D模型
来源:AI科技大本营本文约800字,建议阅读5分钟OpenAI的Point-E是3D模型的DALL-E,这个速度极快的系统可以从文本中生成3D点云。 在推出针对文本和图像的生成人工智能模型之后,OpenAI现在展示了下一步可能出现的东西:一个从文本到三维模型的生成器。通过文本描述,Point-E生成了3D点云,可以作为虚拟环境中的模型。除OpenAI之外,已经有其他用于3D生成的工智能模型,如谷歌的Dreamfusion或Nvidia的Magic3D。 Point-E生成展示 然而,据说OpenAI的开源
数据派THU
2023-03-29
2800
“科创中国”开源产业科技服务团荣获2022年度中国科协优秀科技服务团
2月20日,中国科协召开2023“科创中国”年度会议。会议深入贯彻党的二十大精神和中央经济工作会议精神,以“创新提振发展信心 科技激发产业活力”为主题,总结2022年“科创中国”建设成效,对全面完成“科创中国”三年行动计划进行再动员再部署再落实。 由中国通信学会、清华软件学院和大数据系统软件国家工程研究中心申报组建的“科创中国”开源产业科技服务团获得2022年优秀科技服务团。 中国通信学会副理事长兼秘书长张延川应邀参会,欧阳武副秘书长(正局级)参加2022年度优秀科技服务团授牌仪式。 中国通信学会副理事长
数据派THU
2023-02-28
4280
干货 | 数字经济创新创业——软件研究
下文整理自清华大学大数据能力提升项目能力提升模块课程“Innovation & Entrepreneurship for Digital Economy”(数字经济创新创业课程)的精彩内容。
数据派THU
2022-12-16
3980
​原创 | AI顶会论文很多附带源代码?不少是假开源!
作者:林嘉亮审校:陈之炎 本文约3500字,建议阅读10分钟相当多的作者没有向用户提供足够详细的文档,导致了一些重要信息的缺失。
数据派THU
2022-12-16
8420
干货 | 数字经济创新创业——数据是数字经济的基础
下文整理自清华大学大数据能力提升项目能力提升模块课程“Innovation & Entrepreneurship for Digital Economy”(数字经济创新创业课程)的精彩内容。
数据派THU
2022-12-16
2690
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档