如何使用js以多次使用1个数据的顺序对数据进行混洗_如何使用指定的列顺序保存对R中的数据框进行排序？_如何使用meteor JS对夏季笔记中的数据进行收费？ - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

Pytest（16）随机执行测试用例pytest-random-order[通俗易懂]

python执行测试用例_平台测试用例

Pytest（16）随机执行测试用例pytest-random-order「建议收藏」

Pyspark学习笔记（五）RDD的操作

PySpark RDD 转换操作(Transformation) 是惰性求值，用于将一个 RDD 转换/更新为另一个。由于RDD本质上是不可变的，转换操作总是创建一个或多个新的RDD而不更新现有的RDD，因此，一系列RDD转换创建了一个RDD谱系（依赖图）。

为了不让GPU等CPU，谷歌提出“数据回波”榨干GPU空闲时间，训练速度提升3倍多

因为通用计算芯片不能满足神经网络运算需求，越来越多的人转而使用GPU和TPU这类专用硬件加速器，加快神经网络训练的速度。

pytest文档58-随机执行测试用例(pytest-random-order)

在keras中model.fit_generator()和model.fit()的区别说明

首先Keras中的fit()函数传入的x_train和y_train是被完整的加载进内存的,当然用起来很方便，但是如果我们数据量很大，那么是不可能将所有数据载入内存的，必将导致内存泄漏，这时候我们可以用fit_generator函数来进行训练。

基于自监督的联合时间域迁移，轻松解决长视频的时空差异问题 |CVPR 2020

本文解读的是 CVPR 2020 论文《Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation》，作者来自百度。针对长视频上不同动作的时空巨大差异性，这篇论文提出了基于自监督的局部和全局混合时间域迁移新方法来解决这一挑战。在三个非常具有挑战性的公开数据集上，本文提出的新方法都实现了大幅度的性能提升。

卷积神经网络学习路线（十九） | 旷世科技 2017 ShuffleNetV1

这是卷积神经网络学习路线的第19篇文章，主要为大家介绍一下旷世科技在2017年发表的ShuffleNet V1，和MobileNet V1/V2一样，也是一个轻量级的卷积神经网络，专用于计算力受限的移动设备。新的架构利用两个操作：逐点组卷积(pointwise group convolution)和通道混洗(channel shuffle)，与现有的其他SOTA模型相比，在保证精度的同时大大降低了计算量。ShuffleNet V1在ImageNet和MS COCO上表现出了比其他SOTA模型更好的性能。论文原文见附录。

Keras之fit_generator与train_on_batch用法

关于Keras中，当数据比较大时，不能全部载入内存，在训练的时候就需要利用train_on_batch或fit_generator进行训练了。

26秒训练ResNet，用这些技巧一步步压缩时间，Jeff Dean都称赞：干得漂亮

现在，谷歌AI掌门人Jeff Dean转发推荐了一个训练ResNet的奇技淫巧大礼包，跟着它一步一步实施，训练9层ResNet时，不仅不需要增加GPU的数量，甚至只需要1/8的GPU，就能让训练速度加快到原来的2.5倍，模型在CIFAR10上还能达到94%的准确率。

如何在Python和numpy中生成随机数

随机性的使用是机器学习算法配置和评估的重要部分。从神经网络中的权重的随机初始化，到将数据分成随机的训练和测试集，再到随机梯度下降中的训练数据集的随机混洗（random shuffling），生成随机数和利用随机性是必需掌握的技能。

论文研读-用于处理昂贵问题的广义多任务优化GMFEA

论文研读-用于处理昂贵问题的广义多任务优化GMFEA Generalized Multitasking for Evolutionary Optimization of Expensive Problems GMFEA 此篇文章为 J. Ding, C. Yang, Y. Jin, T. Chai, Generalized Multitasking for Evolutionary Optimization of Expensive Problems, IEEE Transactions on Evolu

Spark如何读取一些大数据集到本地机器上

最近在使用spark处理分析一些公司的埋点数据，埋点数据是json格式，现在要解析json取特定字段的数据，做一些统计分析，所以有时候需要把数据从集群上拉到driver节点做处理，这里面经常出现的一个问题就是，拉取结果集过大，而驱动节点内存不足，经常导致OOM，也就是我们常见的异常: 这种写法的代码一般如下：上面的这种写法，基本原理就是一次性把所有分区的数据，全部读取到driver节点上，然后开始做处理，所以数据量大的时候，经常会出现内存溢出情况。（问题一）如何避免这种情况？分而治之，每次只拉取一个

算法研习：机器学习中的K-Fold交叉验证

在我们训练机器学习模型时，为提高模型拟合效果，经常使用K-Fold交叉验证，这是提高模型性能的重要方法。在这篇文章中，我们将介绍K-Fold交叉验证的基本原理，以及如何通过各种随机样本来查看数据。

Spark学习之RDD编程（2）

本文介绍了Spark中的RDD编程，包括创建RDD、转换操作、行动操作以及常见的转换操作和行动操作。此外，还介绍了如何向Spark传递函数以及常见的伪集合操作。

Pyspark学习笔记（四）弹性分布式数据集 RDD（上）

RDD（弹性分布式数据集）是 PySpark 的基本构建块，它是容错、不可变的分布式对象集合。

谷歌大脑新算法，不折腾TPU就能加快AI训练速度

GPU和像谷歌TPU这样的硬件加速器大大加快了神经网络的训练速度，推助AI迅速成长，在各个领域发挥超能力。

Pyspark学习笔记（四）弹性分布式数据集 RDD 综述（上）

RDD（弹性分布式数据集）是 PySpark 的基本构建块，是spark编程中最基本的数据对象；它是spark应用中的数据集，包括最初加载的数据集，中间计算的数据集，最终结果的数据集，都是RDD。从本质上来讲，RDD是对象分布在各个节点上的集合，用来表示spark程序中的数据。以Pyspark为例，其中的RDD就是由分布在各个节点上的python对象组成，类似于python本身的列表的对象的集合。区别在于，python集合仅在一个进程中存在和处理，而RDD分布在各个节点，指的是【分散在多个物理服务器上的多个进程上计算的】这里多提一句，尽管可以将RDD保存到硬盘上，但RDD主要还是存储在内存中，至少是预期存储在内存中的，因为spark就是为了支持机器学习应运而生。一旦你创建了一个 RDD，就不能改变它。

DPOS 共识算法 - 缺失的白皮书

这篇“缺失的白皮书”是对委托权益证明(Delegated Proof of Stake, DPOS)的分析，旨在分析 DPOS 的工作原理及其鲁棒性（robust）的根源。DPOS 的早期描述可以在 bitshares.org 找到；不过，那个描述里包含了很多与实际共识不大相关的内容。

keras 实现轻量级网络ShuffleNet教程

ShuffleNet是由旷世发表的一个计算效率极高的CNN架构，它是专门为计算能力非常有限的移动设备(例如，10-150 MFLOPs)而设计的。该结构利用组卷积和信道混洗两种新的运算方法，在保证计算精度的同时，大大降低了计算成本。ImageNet分类和MS COCO对象检测实验表明，在40 MFLOPs的计算预算下，ShuffleNet的性能优于其他结构，例如，在ImageNet分类任务上，ShuffleNet的top-1 error 7.8%比最近的MobileNet低。在基于arm的移动设备上，ShuffleNet比AlexNet实际加速了13倍，同时保持了相当的准确性。

PyTorch进阶之路（二）：如何实现线性回归

这篇文章将讨论机器学习的一大基本算法：线性回归。我们将创建一个模型，使其能根据一个区域的平均温度、降雨量和湿度（输入变量或特征）预测苹果和橙子的作物产量（目标变量）。训练数据如下：

【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令

《Learning Spark》这本书算是Spark入门的必读书了，中文版是《Spark快速大数据分析》，不过豆瓣书评很有意思的是，英文原版评分7.4，评论都说入门而已深入不足，中文译版评分8.4，评论一片好评，有点意思。我倒觉得这本书可以作为官方文档的一个补充，刷完后基本上对Spark的一些基本概念、码简单的程序是没有问题的了。这本书有一个好处是它是用三门语言写的，Python/Java/Scala，所以适用性很广，我的观点是，先精通一门语言，再去学其他语言。由于我工作中比较常用的是Python，所以就

人工神经网络之Python 实战

其过程为：首先在z轴坐标为20 的上方生成n个随机点作为正类，在z轴坐标为10 的下方生成n个随机点作为负类。此时在平面z= 10, z= 20 作为隔离带。然后45度旋转x坐标轴，再返回这些点在新坐标轴中的坐标。注意这里混洗了数据，否则会发现数据集的前半部分都是正类，后半部分都是负类，需要混洗数据从而让正负类交叉出现。

MapReduce中shuffle阶段概述及计算任务流程

在小菌上一篇博客《什么是MapReduce(入门篇)》中,小菌已经为大家介绍了MapReduce的相关概念介绍。其中谈到了MapReduce主要由Map和Reduce两个过程组成!事实上,为了让Reduce可以并行处理Map的结果,需要对Map的输出进行一定的分区(Partition),排序(Sort),合并(Combine),分组(Group)等操作,得到<key,value-list>形式的中间结果,再交给对应的Reduce 进行处理,这个过程也就是小菌需要为大家介绍的,叫做Shuffle(混洗)!

学界 | 新型实时形义分割网络ShuffleSeg：可用于嵌入式设备

选自arXiv 作者：Mostafa Gamal等机器之心编译参与：Panda 表现优良的卷积神经网络往往需要大量计算，这在移动和嵌入式设备以及实时应用上是一个很不利的因素。近日，开罗大学和阿尔伯塔大学的研究者提出了一种能实现实时形义分割的框架 ShuffleSeg。这种方法能在保证分割准确度的同时显著降低对计算资源的需求。机器之心在本文中对该项目进行了简要编译介绍，相关研究的 TensorFlow 代码已发布在 GitHub 上。论文地址：https://arxiv.org/abs/1803.038

深度学习中的12种卷积网络，万字长文一文看尽

深度学习中的各种卷积网络大家知多少？对于那些听说过却又对它们没有特别清晰的认识的小伙伴们，Kunlun Bai 这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、物体学以及工程学领域的研究型科学家，在本文中，他详细地介绍了 2D、3D、1x1 、转置、空洞（扩张）、空间可分离、深度可分离、扁平化、分组等十二种卷积网络类型。

学界 | 谷歌开发全新监督学习模型区分讲话者声音，准确率达92.4％

AI 科技评论消息，将含有多人语音的音频流分割为与每个人相关联的同类片段的过程，是语音识别系统的重要部分。通过解决“谁在讲话”的问题，区分讲话者的能力可以应用于许多重要场景，例如理解医疗对话和视频字幕等。

特征工程系列：特征筛选的原理与实现（下）

我们在《特征工程系列：特征筛选的原理与实现（上）》中介绍了特征选择的分类，并详细介绍了过滤式特征筛选的原理与实现。本篇继续介绍封装式和嵌入式特征筛选的原理与实现。

特征工程系列：特征筛选的原理与实现（下）

Golang Map底层实现简述

Go的map是一种高效的数据结构，用于存储键值对。其底层实现是一个哈希表（hash table），下面是有关map底层实现的详细介绍：

统一批处理流处理——Flink批流一体实现原理

实现批处理的技术许许多多，从各种关系型数据库的sql处理，到大数据领域的MapReduce，Hive，Spark等等。这些都是处理有限数据流的经典方式。而Flink专注的是无限流处理，那么他是怎么做到批处理的呢？

特征工程系列：特征筛选的原理与实现（下）

我们在上篇中介绍了特征选择的分类，并详细介绍了过滤式特征筛选的原理与实现。本篇继续介绍封装式和嵌入式特征筛选的原理与实现。

特征工程系列：特征筛选的原理与实现（下）

万字长文带你看尽深度学习中的各种卷积网络

AI 科技评论按：深度学习中的各种卷积网络大家知多少？对于那些听说过却又对它们没有特别清晰的认识的小伙伴们，Kunlun Bai 这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、物体学以及工程学领域的研究型科学家，在本文中，他详细地介绍了 2D、3D、1x1 、转置、空洞（扩张）、空间可分离、深度可分离、扁平化、分组等十多种卷积网络类型。AI 科技评论编译如下。

猿学－Tensorflow中的数据对象Dataset

Dataset可以用来表示输入管道元素集合（张量的嵌套结构）和“逻辑计划“对这些元素的转换操作。在Dataset中元素可以是向量，元组或字典等形式。另外，Dataset需要配合另外一个类Iterator进行使用，Iterator对象是一个迭代器，可以对Dataset中的元素进行迭代提取。

万字长文带你看尽深度学习中的各种卷积网络

Pyspark学习笔记（五）RDD操作(一)_RDD转换操作

Pyspark学习笔记（一）—序言及目录 Pyspark学习笔记（二）— spark-submit命令 Pyspark学习笔记（三）— SparkContext 与 SparkSession Pyspark学习笔记（四）弹性分布式数据集 RDD（上） Pyspark学习笔记（四）弹性分布式数据集 RDD（下）

Boruta 和 SHAP ：不同特征选择技术之间的比较以及如何选择

当我们执行一项监督任务时，我们面临的问题是在我们的机器学习管道中加入适当的特征选择。只需在网上搜索，我们就可以访问讨论特征选择过程的各种来源和内容。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐