首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1949695
阅读量
188
订阅数
ChatGPT 能为计算材料科学做些什么?未来会取代计算材料科学家吗?
来源:ScienceAI本文约2600字,建议阅读5分钟本文简要讨论了 ChatGPT 可能应用于计算材料科学的 3 个方面,即生成结构、计算材料软件编程,数据可视化等。 ChatGPT 已火爆全球,它可以完成一系列具有挑战性的任务,比如撰写论文、编程、作曲、绘画等。 但 ChatGPT 在计算材料科学中的潜在应用还有待讨论。 近日,浙江大学材料科学与工程学院洪子健在《Energy Material Advances》发表题为「ChatGPT for Computational Materials Sci
数据派THU
2023-05-11
3550
原创 | R的基础及进阶数据可视化功能包介绍
R 作为入门级编程语言,被经常运用在数据整理、数据可视化、以及机器学习中。 本篇文章将主要介绍在R中如何可视化数据 (基础+进阶)。 R绘图的原理 使用R绘图,我们需要在脑海中明确几个必要元素。首先,需要有一张空白的画布, 如下图所示。其次,我们需要根据数据确定X轴、Y轴,以及X轴Y轴的取值范围,因为一个平面直角坐标系在R绘图过程中是必不可少的。接下来,我们就可以选择适当的图表类型(折线图、柱状图、点状图等),并根据数据坐标在坐标系中描绘数据。最后,我们还可以在画布上添加额外信息,例如图表名称,图例等,当然
数据派THU
2023-03-29
3.6K0
28个数据可视化图表的总结和介绍
来源:DeepHub IMBA本文约3800字,建议阅读10+分钟本文是一篇关于数据可视化的完整文章,尤其是展示了地理位置可视化的一些方法。 数据可视化本身就是一种通用语言。我们这里通用语言的意思是:它能够向各行各业的人表示信息。它打破了语言和技术理解的障碍。数据是一些数字和文字的组合,但是可视化可以展示数据包含的信息。 “数据可视化有助于弥合数字和文字之间的差距”——Brie E. Anderson。 有许多无代码/少代码的数据可视化工具,如tableau、Power BI、Microsoft Excel
数据派THU
2023-03-29
2K0
【2022新书】数据可视化与Python和JavaScript
来源:专知本文为书籍介绍,建议阅读5分钟本指南教你如何利用最佳Python和JavaScript库的力量。 如何将原始的、未经处理的或格式不正确的数据转换为动态的、交互式的web可视化?在这本实用的书
数据派THU
2023-03-29
4800
美化Matplotlib的3个小技巧
来源:DeepHub IMBA 本文约2300字,建议阅读5分钟 本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧 Matplotlib是Python的数据可视化库的基础。它是其他可视化工具(如Seaborn)的基础。 Matplotlib提供了很大的灵活性,因此您可以自定义或调整几乎所有的图表。但是想要完全控制可视化就需要编写更多的代码。 在本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧: 减少x轴或y轴上的刻度数 添加一个辅助y轴 共享x轴的子图坐标对齐 本文中我们将
数据派THU
2022-10-09
2.1K0
原创 | 一文读懂主成分分析
文:王佳鑫审校:陈之炎 本文约6000字,建议阅读10+分钟本文带你了解PCA的基本数学原理及工作原理。 概述 主成分分析PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。 本文用直观和易懂的方式叙述PCA的基本数学原理,不会引入严格的数学推导。希望读者在看完这篇文章后能更好地明白PCA的工作原理。 一、降维概述 1.1 数组和序列(Series)的维度
数据派THU
2022-09-01
6500
独家 | 如何比较两个或多个分布形态(附链接)
作者:Matteo Courthoud 翻译:陈超校对:赵茹萱本文约7700字,建议阅读15分钟本文从可视化绘图视角和统计检验的方法两种角度介绍了比较两个或多个数据分布形态的方法。 从可视化到统计检验全方位分布形态比较指南: 图片来自作者 比较同一变量在不同组别之间的经验分布是数据科学当中的常见问题,尤其在因果推断中,我们经常在需要评估随机化质量时遇到上述问题。 我们想评估某一政策的效果(或者用户体验功能,广告宣传,药物,……),因果推断当中的金标准就是随机对照试验,也叫作A/B测试。在实际情况下,我们会
数据派THU
2022-08-29
1.4K0
如何比较两个或多个分布:从可视化到统计检验的方法总结
来源:DeepHub IMBA本文6400字,建议阅读12分钟我们看到了很多不同的方法来比较两个或多个分布,无论是在可视化上还是在统计上。 比较一个变量在不同组中的分布是数据科学中的一个常见问题。当我们想要评估一项策略(用户体验功能、广告活动、药物等)的因果效应时,因果推断的黄金标准便是随机对照试验,也就是所谓的A /B测试。在实践中,我们为研究选择一个样本,并将其随机分为对照组(control group)和实验组(treatment group)比较两组之间的结果。随机化确保了两组之间的唯一差异,这样我
数据派THU
2022-07-25
1.4K0
原创 | 支持向量机在金融领域的应用
作者:金一鸣审校:陈之炎 本文约4400字,建议阅读8分钟本文选择一个简单直观的应用实战——根据股价基本 历史数据来预测股市涨跌。 支持向量机(Support Vector Machine, SVM)是一种通过监督学习方式来进行学习的分类和回归模型,在多数情况下,人们都会用这个模型来进行较小规模的二分类任务的求解。支持向量机主要的思想是在特征空间上找到一个与正负样本边界最大的线性分类器,而求解边界最大化的问题从数学的角度来看即是求解凸二次规划(Convex Quadratic Programming)的最优
数据派THU
2022-07-19
6070
【2022新书】数据可视化手册
来源:专知本文为书籍,建议阅读5分钟这本入门书教你如何为你的网站设计交互式图表和定制地图。 使用免费且易于学习的网络工具,用数据讲述你的故事并展示出来。这本入门书教你如何为你的网站设计交互式图表和定制地图,从简单的拖放工具开始,如谷歌Sheets、Datawrapper和Tableau Public。你也将逐渐学会如何编辑开源代码模板,如图表.js, Highcharts,和在GitHub上的传单。 动手数据可视化将通过教程,现实世界的例子和在线资源逐步带您。这本实用指南对于学生、非营利组织、小企业主、地
数据派THU
2022-05-12
5980
赠书 | 数据,新式胡扯的杀手锏
文中有数据派THU福利哦 早间新闻说上个月的消费指数上升了n个点; 手机上跳出实时的股票涨跌,顺便可以看一下上市公司的年报以判断股票前景; 工作例会上,你使用的数据PPT模板让展示更加美观有趣,获得老板好评; 你心情不错想听听音乐,音乐APP跳出你的上周听歌时长统计,再听n首便可升级; 一把游戏结束,系统自动送上战力统计,你的队友明显拖了后腿,下次不要和ta组队了; 此时手机又提醒你视屏时间过长,建议休息一下,因为科学研究表明,连续视屏超过x小时便会使视力下降y%……
数据派THU
2022-04-11
2110
提高EDA(探索性数据分析)效率的 3 个简单工具
来源:DeepHub IMBA本文约1000字,建议阅读5分钟本文简单的介绍 3 个非常好用的的数据可视化和分析工具。 数据对于当今的每个行业都很重要,几乎每家公司都在收集数据并使用它们来做出数据驱动的业务决策。在这个过程中最重要的步骤之一是分析数据。有许多专门用于数据可视化的 python 库。例如 Matplotlib、Seaborn 等,但是他们只提供了图标的功能,如果我们需要进行EDA则需要手动编写代码。在本文中将介绍3个工具,这些工具可以使我们的探索性数据分析几乎自动化。 1、pandas_pro
数据派THU
2022-03-24
3460
独家 | 探索性文本数据分析的新手教程(Amazon案例研究)
本文利用Python对Amazon产品的反馈对数据文本进行探索性研究与分析,并给出结论。
数据派THU
2020-07-22
1.5K0
大数据战略:从数据大国到数据强国
[ 导读 ]海量数据空前集聚和计算力指数级增长释放了深度学习算法的生产力,推动人工智能应用大发展。大数据技术和大数据产业蓬勃发展为线上互联网和线下实体经济带来了新的增长点。
数据派THU
2020-04-16
6690
《囧妈》口碑扑街?Python告诉你观众这次为何不买账了
[ 导语 ]今天我们就来聊聊另类春节档的唯一一部电影《囧妈》,Python技术部分可以直接看第三部分。
数据派THU
2020-02-20
6110
独家 | 为什么Python是数据科学领域最受欢迎的语言之一?(附链接)
为什么大多数数据科学家都喜欢Python?这篇文章会让你了解到,Python有很多完善的工具包可以协助你完成重要的数据科学任务。
数据派THU
2020-02-20
4720
独家 | AutoVis大数据可视化设计框架:让大数据可视化容易点
本文从大数据应用出发,讨论数据可视化在大数据时代所面临的一系列挑战,并重点介绍AutoVis针对这些挑战所做尝试及其体系架构、关键技术和功能特点。
数据派THU
2020-02-13
1.1K0
如何在北京买房?【数据故事计划最佳创意奖】
Kevin Maher 马腾飞,美术学院视觉传达设计系,硕士一年级。创办了清华学生数据可视化社团。创办了DIATOM设计公司,致力于从设计的角度实现更有效的数据可视化,曾经客户包括Kantar、 Danone、中国平安等。
数据派THU
2019-07-08
4400
独家 | 基于Python实现交互式数据可视化的工具(用于Web)
这学期(2018学年春季学期)我教授了一门关于数据可视化的数据科学硕士课程。我们的数据科学硕士项目是一个为期15个月的强化项目,这个项目已经成功地培养了许多优秀的数据科学家。
数据派THU
2019-05-15
2K0
数据科学研究院第四届“院长接待日”成功举办
为给学生提供和院长面对面交流的机会,清华-青岛数据科学研究院(以下简称:数据院)院长接待日于2018年12月18日成功举办。数据院院长俞士纶出席了这场别开生面的院长接待日,并聆听来自不同学校、院系的十余名同学对于大数据学习、未来技术发展、职业规划等方面的问题,也针对目前学生所处的情境和遇到的问题给出了悉心的指导和答疑。本次院长接待日主要分为两个部分,包括专项汇报以及自由交流。
数据派THU
2018-12-29
5510
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档