首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏作者
506
文章
705675
阅读量
75
订阅数
一个开源的轻量级agent框架-Agere
agere是一个开源的轻量级agent框架,主要特点是通用性和完全的可定制性。它通过将一个复杂流程拆解为一系列独立的小步骤,来简化构建具有复杂逻辑的agent的流程。
Datawhale
2024-04-24
1440
WanJuan-CC数据集:为大型语言模型训练提供高质量Webtext资源
如何在参差不齐的海量网页数据中提炼高质量内容?如何保证模型训练数据的质量和安全性,如何构建高效的处理策略?上海人工智能实验室的这篇论文提供了一种不错的参考方案。
Datawhale
2024-04-24
2750
AI + X 组队学习来了!一起学Sora
AI+X系列:和学习生态伙伴联合发起,将人工智能(AI)与各个学科、领域、行业(X)结合, 激发无限潜力和创造力(X),让学习者拥有更多可能性(X)。
Datawhale
2024-04-24
1030
《开源大模型食用指南》发布,7个小时,一杯奶茶速通大模型!
《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。项目的主要内容包括:
Datawhale
2024-04-24
6490
【独家】万字长文带你梳理Llama开源家族:从Llama-1到Llama-3
北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。
Datawhale
2024-04-24
9360
文本智能校对大赛冠军方案!已落地应用,来自苏州大学、达摩院团队
近期参加了2022 蜜度中文文本智能校对大赛,经过2个月的比赛,在600余名参赛者中取得了第一名的成绩,相关技术也已在钉钉文档等产品落地应用。借此机会,笔者想和大家分享下对中文文本纠错任务的一些看法。
Datawhale
2022-10-31
1.3K0
AI拿下艺术大奖,它离文学奖还有多远?
如果你是一位画家,正兴奋而焦急地等待着一次颁奖结果。这时,主办方宣布,获奖作品来自……一个人工智能(AI)。你会……?
Datawhale
2022-10-31
3620
我们做了一个智能零售结算平台
目前在零售行业的实际运营过程中,会产生巨大的人力成本,例如导购、保洁、结算等,而其中,尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中,并且在此过程中,顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低,二来也使得顾客的购物体验下降。
Datawhale
2022-10-31
8180
Datawhale 社区黑板报(第1期)
“for the learner,和学习者一起成长” 是我们聚在一起的初心,构建良性、开放、互助的开源社区是 Datawhale 一直追求的目标。为了让更多学习者了解 Datawhale 在做什么,并参与到 Datawhale 社区中,我们设计了 Datawhale 社区黑板报,意在帮助更多学习者集中的了解 Datawhale,一起参与开源学习社区建设。
Datawhale
2022-10-31
2900
《Datawhale推荐系统教程》来了!
FunRec开源项目从第一次提交到现在已经快两年了,为了让帮助更多同学入门推荐算法,我们开源了《FunRec-推荐系统》教程,并在组队学习中,帮助学习者成长。
Datawhale
2022-10-31
4920
从上海财经大学硕士到京东算法
本文作者是《Datawhale面经项目》的核心贡献者,一直有热心帮助就业迷茫的同学:面经分享、简历指导、模拟面试等,秋招拿到了ssp offer。
Datawhale
2022-05-29
4180
Python环境配置保姆教程(Anaconda、Jupyter、GPU环境)!
1. 写在前面 搞算法的同学也都明白,一个比较完美的python环境是多么的重要。这篇文章打算把一些必备的python环境配置过程记录下来,这样不管是新到了公司实习或者就职,还是新换了电脑,都可以借鉴这篇快速把环境搭建起来啦 😉 由于我也是重装了系统,所以算是从0开始搭建python环境,这次从anaconda安装开始, 然后到cuda的相关安装配置,再到cudnn的安装配置,然后从anaconda中建立虚拟tensorflow和pytorch的虚拟环境,再各自的虚拟环境里面安装jupyter noteb
Datawhale
2021-10-13
2.5K0
Datawhale SQL教程来了!
随着大数据技术迅猛发展,SQL 能力日趋重要,而学校系统性讲授 SQL 的课程却较少。笔者发现一本很好的教材《SQL基础教程》作者:MICK,美中不足的是教材主要以数据库PostgreSQL 为工具,普及度与易用性较低。
Datawhale
2021-09-23
3760
在一家开源公司工作的体验!
“PingCAP 获得2.7亿美元融资”,“TiDB 全新一栈式实时 HTAP 数据库”,“PingCAP DevCon 2021成功举办,相信开源开放的力量”...
Datawhale
2021-09-22
5820
我用《觉醒年代》做数据分析!
最近有同学和我说《觉醒年代》好好看,于是我后知后觉地查了一下,不查不知道,这部剧豆瓣评分9.3,微博讨论度26亿+。《觉醒年代》都是哪些人在看?不如给受众群体做一个用户画像分析。
Datawhale
2021-07-30
8161
2021语言与智能技术竞赛上线!百度飞桨提供平台算力支持
人工智能是让机器像人一样感知和认识世界,而理解和运用自然语言是人工智能的核心问题之一,语言智能的发展将推动人工智能技术加快落地。
Datawhale
2021-04-20
4290
北航学长:DCIC 2021的算法方案讲解
DCIC 作为每年具有重要影响力的政府赛事,除了高认可,高奖金,最重要的是开放了政府和企业的真实数据,具有研究和落地价值,但对于刚参加赛事的同学,还是有难度的,希望通过分享让更初学者也能参与学习实践和研究。
Datawhale
2021-02-05
5430
田云:我眼中的开源和Datawhale
开源最初是起源于软件开发中,指的是一种开发软件的特殊形式。但到今天,「开源」已经泛指一组概念,这些概念包括开源项目、产品,或是自发倡导并欢迎开放变化、协作参与、快速原型、公开透明、精英体制以及面向社区开发的原则。
Datawhale
2021-01-07
4820
《动手学数据分析》开源教程完整发布!
对于任何一个将来要实际运用的技能,通过实战,自己亲自将一行行代码敲出来,然后达到自己想要的效果,这个过程是最好的学习方式。
Datawhale
2020-09-03
6730
机器学习算法专题(附组队学习)
这一年多来,Datawhale已经分享了数百篇学习干货。根据大家反馈,学习的问题主要有,一是不清楚怎么入门,二是感觉不够成体系。 所以后面打算把开源的内容逐步体系化,形成数学基础,python基础,机器学习,深度学习,数据分析,数据挖掘等多个知识专题,再结合专题组织学习活动。其中机器学习见下图。
Datawhale
2020-08-12
8640
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档