首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏成员
516
文章
778690
阅读量
78
订阅数
《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!
我们希望成为 LLM 与普罗大众的阶梯,以自由、平等的开源精神,拥抱更恢弘而辽阔的 LLM 世界。
Datawhale
2024-09-12
1240
Datawhale出品:《GLM-4 大模型部署微调教程》发布!
就在昨天,智谱 AI 发布了最新开源模型 GLM4,通过 10T 高质量多语言数据与更先进的训练技术,达到了更加出色的生成效果。
Datawhale
2024-06-08
1.2K0
GLM-4最新开源版本硬核测评!Datawhale成员万字测评(一)
智谱今天新推出了一个 glm-4-9b 模型,支持 120k 左右的上下文与 8192 的输出长度,在拿到测试资格的时候我就立马开始了上手评测。
Datawhale
2024-06-08
7530
达到1k stars后🥂,我对大模型开源教程的反思!
“五·一”节后第一个开心的消息是我们开源的大模型基础项目(https://github.com/datawhalechina/so-large-lm)已经达到1k stars⭐️了。这个开源项目是为了提供浅显易懂且前沿的大模基础知识而打造的,能收获1k个stars⭐️也是对这个项目的肯定。我为一起付出努力的贡献者感到开心,也为这个课程的核心贡献者表达谢意。
Datawhale
2024-05-18
1490
AI顶会 ICLR 最新演讲:“The ChatGLM's Road to AGI”,首个中国大模型团队!
北京时间5月9日晚,第十二届国际学习表征会议(International Conference on Learning Representations,ICLR) 在奥地利维也纳展览会议中心举办。
Datawhale
2024-05-18
1530
一个开源的轻量级agent框架-Agere
agere是一个开源的轻量级agent框架,主要特点是通用性和完全的可定制性。它通过将一个复杂流程拆解为一系列独立的小步骤,来简化构建具有复杂逻辑的agent的流程。
Datawhale
2024-04-24
3390
WanJuan-CC数据集:为大型语言模型训练提供高质量Webtext资源
如何在参差不齐的海量网页数据中提炼高质量内容?如何保证模型训练数据的质量和安全性,如何构建高效的处理策略?上海人工智能实验室的这篇论文提供了一种不错的参考方案。
Datawhale
2024-04-24
6740
AI + X 组队学习来了!一起学Sora
AI+X系列:和学习生态伙伴联合发起,将人工智能(AI)与各个学科、领域、行业(X)结合, 激发无限潜力和创造力(X),让学习者拥有更多可能性(X)。
Datawhale
2024-04-24
1390
《开源大模型食用指南》发布,7个小时,一杯奶茶速通大模型!
《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。项目的主要内容包括:
Datawhale
2024-04-24
1.1K0
【独家】万字长文带你梳理Llama开源家族:从Llama-1到Llama-3
北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。
Datawhale
2024-04-24
12.4K0
文本智能校对大赛冠军方案!已落地应用,来自苏州大学、达摩院团队
近期参加了2022 蜜度中文文本智能校对大赛,经过2个月的比赛,在600余名参赛者中取得了第一名的成绩,相关技术也已在钉钉文档等产品落地应用。借此机会,笔者想和大家分享下对中文文本纠错任务的一些看法。
Datawhale
2022-10-31
1.5K0
AI拿下艺术大奖,它离文学奖还有多远?
如果你是一位画家,正兴奋而焦急地等待着一次颁奖结果。这时,主办方宣布,获奖作品来自……一个人工智能(AI)。你会……?
Datawhale
2022-10-31
3870
我们做了一个智能零售结算平台
目前在零售行业的实际运营过程中,会产生巨大的人力成本,例如导购、保洁、结算等,而其中,尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中,并且在此过程中,顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低,二来也使得顾客的购物体验下降。
Datawhale
2022-10-31
9040
Datawhale 社区黑板报(第1期)
“for the learner,和学习者一起成长” 是我们聚在一起的初心,构建良性、开放、互助的开源社区是 Datawhale 一直追求的目标。为了让更多学习者了解 Datawhale 在做什么,并参与到 Datawhale 社区中,我们设计了 Datawhale 社区黑板报,意在帮助更多学习者集中的了解 Datawhale,一起参与开源学习社区建设。
Datawhale
2022-10-31
3310
《Datawhale推荐系统教程》来了!
FunRec开源项目从第一次提交到现在已经快两年了,为了让帮助更多同学入门推荐算法,我们开源了《FunRec-推荐系统》教程,并在组队学习中,帮助学习者成长。
Datawhale
2022-10-31
5580
从上海财经大学硕士到京东算法
本文作者是《Datawhale面经项目》的核心贡献者,一直有热心帮助就业迷茫的同学:面经分享、简历指导、模拟面试等,秋招拿到了ssp offer。
Datawhale
2022-05-29
4350
Python环境配置保姆教程(Anaconda、Jupyter、GPU环境)!
1. 写在前面 搞算法的同学也都明白,一个比较完美的python环境是多么的重要。这篇文章打算把一些必备的python环境配置过程记录下来,这样不管是新到了公司实习或者就职,还是新换了电脑,都可以借鉴这篇快速把环境搭建起来啦 😉 由于我也是重装了系统,所以算是从0开始搭建python环境,这次从anaconda安装开始, 然后到cuda的相关安装配置,再到cudnn的安装配置,然后从anaconda中建立虚拟tensorflow和pytorch的虚拟环境,再各自的虚拟环境里面安装jupyter noteb
Datawhale
2021-10-13
2.9K0
Datawhale SQL教程来了!
随着大数据技术迅猛发展,SQL 能力日趋重要,而学校系统性讲授 SQL 的课程却较少。笔者发现一本很好的教材《SQL基础教程》作者:MICK,美中不足的是教材主要以数据库PostgreSQL 为工具,普及度与易用性较低。
Datawhale
2021-09-23
4040
在一家开源公司工作的体验!
“PingCAP 获得2.7亿美元融资”,“TiDB 全新一栈式实时 HTAP 数据库”,“PingCAP DevCon 2021成功举办,相信开源开放的力量”...
Datawhale
2021-09-22
6090
我用《觉醒年代》做数据分析!
最近有同学和我说《觉醒年代》好好看,于是我后知后觉地查了一下,不查不知道,这部剧豆瓣评分9.3,微博讨论度26亿+。《觉醒年代》都是哪些人在看?不如给受众群体做一个用户画像分析。
Datawhale
2021-07-30
8651
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档