首页
学习
活动
专区
工具
TVP
发布

数据社

专栏作者
126
文章
170588
阅读量
35
订阅数
“ChatGPT 之父”奥特曼被 OpenAI解雇
美国时间11月17日,人工智能公司OpenAI突发声明,宣布公司首席执行官山姆·奥特曼将离开公司,公司现首席技术官米拉·穆拉蒂被任命为临时首席执行官。OpenAI称,接任CEO的人选仍在确认过程中。
数据社
2023-11-22
1420
腾讯混元大模型文生图操作指南.doc
今天上午,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
数据社
2023-10-30
5480
腾讯混元大模型文生图操作指南.doc
今天上午,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
数据社
2023-10-30
5480
Prompt Engineering
在这里,我们讨论了几个撰写提示(输入模型的内容)的原则和技巧,这些提示将帮助您为您的任务获得最佳的生成结果。选择正确的温度也会对生成质量产生很大的影响,我们会在这里单独讨论温度。
数据社
2023-10-22
990
Prompt Engineering
在这里,我们讨论了几个撰写提示(输入模型的内容)的原则和技巧,这些提示将帮助您为您的任务获得最佳的生成结果。选择正确的温度也会对生成质量产生很大的影响,我们会在这里单独讨论温度。
数据社
2023-10-22
1200
使用ChatGPT与Hadoop集成进行数据存储与处理
Hadoop是一个开源的分布式存储和分布式计算框架,主要用于处理大量非结构化或半结构化的数据。它最初是由Apache基金会开发的,灵感来自于Google的MapReduce和GFS(Google文件系统)论文。Hadoop的核心是Hadoop Distributed File System(HDFS,Hadoop分布式文件系统)和MapReduce编程模型,如图1所示。
数据社
2023-09-11
2150
2022年度数据人的书单盘点
这一年,数据圈口碑炸裂的好书,今天给大家做个大盘点。也希望大家能多了解一些领域,或许还能从中培养出新的兴趣。
数据社
2023-01-04
5090
复盘一件关于数据的糟心事!
最近郑州的疫情挺严重的,已经居家一个月了,错过了整个秋天。从10月初小区封控到月末小区有几十例异常,上周才刚刚解封,可以下楼。
数据社
2023-01-04
2940
大数据应用型产品设计方法及行业案例介绍(附110页PPT)
最近有不少读者问数据产品的一些知识,昨天分享了一篇文章,大家可以看下,今给大家分享一个干货材料
数据社
2023-01-04
5161
漫谈实时数仓
数据仓库大家非常熟悉,在1991年出版的“Building the Data Warehouse”,数据仓库之父比尔·恩门首次提出数据仓库的概念,数据仓库是一个面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。
数据社
2023-01-04
6460
数据仓库的下一阶段该是什么?
在大数据时代,大家都意识到数据已经成为了公司宝贵的资产,但如何让数据发挥价值,一直困扰着大家。数据技术人员需要长时间去理解某一个业务,业务人员也很难使用现代化数据分析工具赋能业务。那么,如何让公司数据能够快速和业务融合起来成为了广大数据从业者和数据服务厂家一直以来思考的问题。
数据社
2022-11-01
2710
浅谈数仓的数据治理
绝大数公司建立数仓之初是没有考虑好数据治理怎么做的,因为数据部门刚开始成立,必然要有一些“数据驱动”的成果,而数据治理不能很好的体现这些业绩。所以,都是在业务发展的过程中,逐渐遇到了一些数据问题,才考虑做这件事的。
数据社
2022-05-26
4960
漫谈未来数仓架构如何设计
大家好,我是峰哥,夏天已经来了,小麦马上要丰收了,今天分享一篇关于未来数仓架构发展方向的文章。
数据社
2022-05-26
3930
漫谈数据仓库的分层架构与演进
分层架构很容易在各种书籍和文档中去理解,但是把建模方法和分层架构放在一起就会出现很多困惑了。接下来,我会从数据研发与建模的角度,演进一下分层架构的设计原因与层次的意义。
数据社
2022-05-26
2510
Apache Airflow 2.3.0 在五一重磅发布!
大家好,我是一哥,在这个五一假期,又一个Apache项目迎来了重大版本更新——Apache Airflow 2.3.0 在五一重磅发布!
数据社
2022-05-26
1.7K0
搞数仓也得懂几个常用机器学习算法
首先讲回归模型,回归模型研究的是因变量(目标)和自变量(预测器)之间的关系,因变量可以是连续也可以离散,如果是离散的就是分类问题。思考房价预测模型,我们可以根据房子的大小、户型、位置、南北通透等自变量预测出房子的售价,这是最简单的回归模型,在初中里面回归表达式一般这样写,其中x是自变量,y是因变量,w是特征矩阵,b是偏置。
数据社
2022-04-08
4040
「原创」大数据岗位总结和相关书籍推荐
最近有几个群友问我大数据怎么入门,作为一个零基础大数据入门学习者该看哪些书呢?我结合自己看过的书和了解到的比较好的数据,给大家分享一下。
数据社
2022-04-08
3950
你真的了解ELT和ETL吗?
ETL 和 ELT 有很多共同点,从本质上讲,每种集成方法都可以将数据从源端抽取到数据仓库中,两者的区别在于数据在哪里进行转换。 接下来,我们一起详细地分析一下 ETL 和 ELT各自的优缺点,看看在你们现在的业务中用哪种方式处理数据比较合适。
数据社
2022-04-08
8940
为什么要做数仓分层,不做行吗?
ODS:抽取的原始业务数据,结构一般和原始业务数据库表结构或者抽取的业务日志数据结构保持一致。一句话:从业务系统增量抽取,数据不做清洗转换,与业务系统数据模型保持一致。
数据社
2022-04-08
7400
2022年始,这家大数据公司融资2.5亿美元,估值33.5亿美元!
2022年数据平台的风口到底在哪?今天看到了一个消息,Starburst 这家公司上周融资了2.5亿美元,最新估值达到33.5亿美元!
数据社
2022-02-17
7570
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档