hvplot -如何通过分类变量对点数据进行着色，并使用`ds.count_cat(.)`进行聚合 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

WebGL：从 2D 开始

Python实践：seaborn的散点图矩阵（Pairs Plots）可视化数据

如何快速创建强大的可视化探索性数据分析，这对于现在的商业社会来说，变得至关重要。今天我们就来，谈一谈如何使用python来进行数据的可视化！

让AI帮助黑白影像焕发色彩

该项目基于Richard Zhang，Phillip Isola和Alexei A. Efros在加州大学伯克利分校开发的研究工作：彩色图像着色

一文讲解特征工程 | 经典外文PPT及中文解析

“More data beats clever algorithms, but better data beats more data.”——名人名言哈哈哈哈，更多的数据打败聪明的算法，更好的数据打败更多的数据。

一文讲解特征工程 | 经典外文PPT及中文解析

“More data beats clever algorithms, but better data beats more data.”——名人名言哈哈哈哈，更多的数据打败聪明的算法，更好的数据打败更多的数据。

一文讲解特征工程 | 经典外文PPT及中文解析

“More data beats clever algorithms, but better data beats more data.”——名人名言哈哈哈哈，更多的数据打败聪明的算法，更好的数据打败更多的数据。

fast.ai 深度学习笔记（二）

learn — 这将显示我们在末尾添加的层。这些是我们在precompute=True时训练的层

MADlib——基于SQL的数据挖掘解决方案（7）——数据转换之其它转换

seaborn从入门到精通03-绘图功能实现02-分类绘图Categorical plots

本文主要是seaborn从入门到精通系列第3篇，本文介绍了seaborn的绘图功能实现，本文是分类绘图，同时介绍了较好的参考文档置于博客前面，读者可以重点查看参考链接。本系列的目的是可以完整的完成seaborn从入门到精通。重点参考连接

数据可视化：浅谈热力图如何在前端实现

当我们需要用更直观有效的形式来展现各类大数据信息时，热力图无疑是一种很好的方式。作为一种密度图，热力图一般使用具备显著颜色差异的方式来呈现数据效果，热力图中亮色一般代表事件发生频率较高或事物分布密度较大，暗色则反之。值得一提的是，热力图最终效果常常优于离散点的直接显示，可以在二维平面或者地图上直观地展现空间数据的疏密程度或频率高低。

Unity高级开发-Shader开发（1）-渲染管线

学习Shader（着色器）必须先要了解渲染管线。如果不了解，那么就不能说你了解Shader

【笔记】《计算机图形学》(17)——使用图形硬件

这一章介绍了计算机与图形硬件和实际编程相关的内容, 其中主要利用OpenGL简单介绍了实际的图形编程部分, 但是如果想要真正开始OpenGL编程, 查阅其它资料是必不可少的. 注意这一章最新的英文版和中文版由于时代不同所以内容差别非常大, 建议还是阅读英文版本.

学习用Pandas处理分类数据！

分类数据(categorical data)是按照现象的某种属性对其进行分类或分组而得到的反映事物类型的数据，又称定类数据。直白来说，就是取值为有限的，或者说是固定数量的可能值。例如：性别、血型等。

GPU渲染之OpenGL的GPU管线

GPU渲染流水线，是硬件真正体现渲染概念的操作过程，也是最终将图元画到2D屏幕上的阶段。GPU管线涵盖了渲染流程的几何阶段和光栅化阶段，但对开发者而言，只有对顶点和片段着色器有可编程控制权，其他一律不可编程。如下图：

数据可视化(11)-Seaborn系列 | 小提琴图violinplot()

小提琴形图(violin plot)的作用与盒形图(box plot)和whidker plot的作用类似，它显示了一个或多个分类变量的几个级别的定量数据的分布，我们可以通过观察来比较这些分布。与盒形图不同，因为盒形图的所有绘图组件都对应于实际数据点,小提琴形图具有底层分布的核密度估计。

十个技巧，让你成为“降维”专家

在分析高维数据时，降维（Dimensionality reduction，DR）方法是我们不可或缺的好帮手。

太赞了！30 个 Python 函数，加速你的数据分析处理速度！

Pandas 是 Python 中最广泛使用的数据分析和操作库。它提供了许多功能和方法，可以加快「数据分析」和「预处理」步骤。

OpenGL 系列---基础绘制流程

OpenGL 是一种应用程序编程接口，它是一种可以对图形硬件设备特性进行访问的软件库。

springboot第65集：字节跳动一面经，一文让你走出微服务迷雾架构周刊

如今要考虑做分库分表时，可首先选用当当网的Sharding-Sphere框架，早些年原本只有Sharding-JDBC驱动层的分库分表，但到了后续又推出了代理层的Sharding-Proxy中间件，最终合并成立了Sharding-Sphere项目。

用纹理增加细节

OpenGL中的纹理可以用来表示照片，图像。每个二维的纹理都由许多小的纹理元素组成，他们是小块的数据，类似于我们前面讨论的片段和像素。要使用纹理，最直接的方式是从图像文件加载数据。我们现在要加载下面这副图像作为空气曲棍球桌子的表面纹理：

老旧黑白片修复机——使用卷积神经网络图像自动着色实战（原文附PyTorch代码）

人工智能和深度学习技术逐渐在各行各业中发挥着作用，尤其是在计算机视觉领域，深度学习就像继承了某些上帝的功能，无所不能，令人叹为观止。照片承载了很多人在某个时刻的记忆，尤其是一些老旧的黑白照片，尘封于脑海之中，随着时间的流逝，记忆中对当时颜色的印象也会慢慢消散，这确实有些可惜。但随着科技的发展，这些已不再是比较难的问题。在这篇文章中，将带领大家领略一番深度学习的强大能力——将灰度图像转换为彩色图像。文章使用PyTorch从头开始构建一个机器学习模型，自动将灰度图像转换为彩色图像，并且给出了相应代码及图像效果图。整篇文章都是通过iPython Notebook中实现，对性能的要求不高，读者们可以自行动手实践一下在各自的计算机上运行下，亲身体验下深度学习神奇的效果吧。 PS：不仅能够对旧图像进行着色，还可以对视频（每次对视频进行一帧处理）进行着色哦！闲话少叙，下面直接进入正题吧。

OpenGL 实现视频编辑中的转场效果

现在拍摄 vlog 的玩家越来越多，要是视频没有一两个炫酷的转场效果，都不好意思拿出来炫酷了。

Python 项目实践二（生成数据）第二篇

接着上节继续学习，在本节中，我们将使用Python来生成随机漫步数据，再使用matplotlib以引人瞩目的方式将这些数据呈现出来。随机漫步是这样行走得到的路径：每次行走都完全是随机的，没有明确的方向，结果是由一系列随机决策决定的。你可以这样认为，随机漫步就是蚂蚁在晕头转向的情况下，每次都沿随机的方向前行所经过的路径。一随机漫步 1 创建RandomWalk()类为模拟随机漫步，我们将创建一个名为RandomWalk的类，它随机地选择前进方向。这个类需要三个属性，其中一个是存储随机漫步次数的变量，其他

增加颜色和着色

我们已经知道，在OpenGL中，我们只能画点，直线和三角形，并且所有物体都是以他们为基础构建的。既然受限于这三个基本图元，那么我们如何用许多不同的颜色和着色表达更复杂的场景呢？我们能使用的一个方法就是使用上百万个小三角形，每个三角形的颜色都不同，这样就可以看到一副美丽，复杂，有丰富颜色变化的场景。尽管，这在技术上是可行的，但性能和内存的开销是十分庞大的。所以，OpenGL提供了另外一种技术，平滑着色。举例来说，就是有一个三角形，每个顶点的颜色都是不同的，我们可以在三角形表面混合这些颜色，最终得到一个平滑着色的三角形。我们要使用这种类型的着色让桌子中央更加明亮，而桌子的边缘显得比较暗淡。

初学者使用Pandas的特征工程

Pandas是用于Python编程语言的开源高级数据分析和处理库。使用pandas，可以轻松加载，准备，操作和分析数据。它是用于数据分析操作的最优选和广泛使用的库之一。

机器学习之分类问题实战(基于UCI Bank Marketing Dataset)

导读：分类问题是机器学习应用中的常见问题，而二分类问题是其中的典型，例如垃圾邮件的识别。本文基于UCI机器学习数据库中的银行营销数据集，从对数据集进行探索，数据预处理和特征工程，到学习模型的评估与选择，较为完整的展示了解决分类问题的大致流程。文中包含了一些常见问题的处理方式，例如缺失值的处理、非数值属性如何编码、如何使用过抽样和欠抽样的方法解决分类问题中正负样本不均衡的问题等等。作者：llhthinker 1. 数据集选取与问题定义本次实验选取UCI机器学习库中的银行营销数据集（Bank Ma

015

3D绘图小帮手WebGL入门与进阶（中）——着色器的基本编程

程序创建完之后，我们需要需要对着色器进行动态控制才能达到我们所需要的功能。（如不知道怎么创建WebGL，可参考上篇文章）。首先让我来介绍2个变量，我们需要借助这2个变量搭建的桥梁才能使JavaScript与GLSL ES之间进行沟通。 attribute：用于顶点点着色器（Vertex Shader）传值时使用。 uniform：可用于顶点着色器（Vertex Shader）与片元着色器（Fragment Shader）使用。将顶点动态化先在顶点着色器代码中，将对应的vec4的固定值变成变量。 v

Python Seaborn (5) 分类数据的绘制

我们之前探讨了如何使用散点图和回归模型拟合来可视化两个变量之间的关系，以及如何在其他分类变量的层次之间进行展示。当然，还有一大类问题就是分类数据的问题了？在这种情况下，散点图和回归模型方法将不起作用。当然，有几个观察可视化这种关系的选择，我们将在本章中讨论。

深度 | 拓扑数据分析TDA，有望打破人工智能黑箱的神奇算法

选自Ayasdi 作者：Gunnar Carlsson 机器之心编译参与：陈韵竹、刘晓坤本文介绍了拓扑数据分析（TDA）的基本原理，给出了案例展示，并指出该方法可以高效地进行可视化分析，有望为人工智能黑箱提供可解释性。近日，中科大潘建伟团队在光量子处理器上成功运行了 TDA 方法，量子版本的 TDA 能够实现对经典最优 TDA 算法的指数级加速。机器学习和人工智能都是「黑箱」技术——这是使用机器学习、人工智能进行数据研究遭受的批评之一。虽然它们能自动提供有用的答案，但是却不能给人类提供可解读的输出。因

013

再见，Excel数据透视表；你好，pd.pivot_table

Excel作为Office常用办公软件之一，其在一名数据分析师的工作日常中也占有一定地位，比如个人就常常倾向于依赖Excel完成简单的数据处理和可视化作图，其中数据处理部分则主要是运用内置函数+数据透视表两大部分。

10 种常用 Matplotlib 图的 Python 代码

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

资源 | 用自注意力GAN为百年旧照上色：效果惊艳，多图预警！

项目地址：https://github.com/jantic/DeOldify/blob/master/README.md

入门 | 从结构到性能，一文概述XGBoost、Light GBM和CatBoost的同与不同

选自Medium 机器之心编译参与：刘天赐、黄小天尽管近年来神经网络复兴并大为流行，但是 boosting 算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。本文从算法结构差异、每个算法的分类变量时的处理、算法在数据集上的实现等多个方面对 3 种代表性的 boosting 算法 CatBoost、Light GBM 和 XGBoost 进行了对比；虽然本文结论依据于特定的数据集，但通常情况下，XGBoost 都比另外两个算法慢。最近，我参加了 kaggle 竞赛 WID

OpenGL4.3 新特性: 计算着色器 Compute Shader

算着色器是一个完全用于计算任意信息的着色器阶段(Stage) 。虽然它可以渲染，但它通常用于与绘制三角形和像素无关的任务。概述计算着色器与其他着色器阶段的操作不同。所有其他着色器阶段都有一组明

OpenGL ES 之attribute

attribute是GLSL中特殊的变量类型，用于从“外部”到顶点着色器的通信，只能用于Vertex Shader（顶点着色器），不能用于其他Shader中，attribute 通常用来存储位置坐标、法向量、纹理坐标和颜色等，定义如下：

使用PyTorch进行表格数据的深度学习

使用表格数据进行深度学习的最简单方法是通过fast-ai库，它可以提供非常好的结果，但是对于试图了解幕后实际情况的人来说，它可能有点抽象。因此在本文中，介绍了如何在Pytorch中针对多类分类问题构建简单的深度学习模型来处理表格数据。

可视化实战，Python绘制出来的数据大屏真的太惊艳了！！

今天我们在进行一个Python数据可视化的实战练习，用到的模块叫做Panel，我们通过调用此模块来绘制动态可交互的图表以及数据大屏的制作，而本地需要用到的数据集，可在kaggle上面获取

机器学习实战 | 数据探索

数据的输入质量决定了输出的最后结果，数据的探索、预处理、特征选择、降维等特征工程占了项目的70%的时间。那么如果我们确定了商业目的，该如何一步一步渐进式进行特征工程呢？各位看官不急，请小的慢慢给你道来。在建立模型前，我们大致需要顺序经过以下几步： 1、变量识别 2、单变量分析 3、双变量分析 4、缺失值处理 5、异常值处理 6、变量变化 7、变量创建其中第4-7步在模型优化中会重复进行。 1、变量识别首先，识别Predictor（即feature、输入）和Target（输出）变量。接下来，确定变量的

独家 | 机器学习中的四种分类任务（附代码）

分类是一项需要使用机器学习算法去学习如何根据问题域为示例分配类标签的任务。一个简单易懂的例子是将电子邮件分为“垃圾邮件”或“非垃圾邮件”。

《数据可视化基础》：使用颜色的常见陷阱

颜色是增强数据可视化的一种非常有效的工具。与此同时，糟糕的颜色选择也会破坏原本优秀的视觉效果。颜色的使用必须是基于某一个目的的，而不是用来分散注意力的。

主成分分析PCA谱分解、奇异值分解SVD预测分析运动员表现数据和降维可视化

本文描述了如何使用R执行主成分分析 ( PCA )。您将学习如何使用 PCA_预测_ 新的个体和变量坐标。我们还将提供 _PCA 结果_背后的理论。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐