如何从生成集创建矩阵_如何从数据集创建邻接矩阵_从csv数据集创建nxm矩阵 - 腾讯云开发者社区

CNN中的混淆矩阵 | PyTorch系列（二十三）

原标题：CNN Confusion Matrix With PyTorch - Neural Network Programming

您找到你想要的搜索结果了吗？

是的

没有找到

【翻译】A New Approach for Sparse Matrix Classification Based on Deep Learning Techniques

2018 IEEE International Conference on Cluster Computing

在SAS里玩穿越 | 【SAS Says·扩展篇】IML：穿越 | 数说·语言

一直以来，大众了解的SAS都是数据集操作，使用的方法是数据步和过程步。但其实，SAS这个庞大的系统中还隐藏了另一个平行世界——IML，在这个世界里，你需要一个像操作MATLAB一样的矩阵思维。今天我们将介绍如何在SAS里玩穿越，将数据从矩阵变成SAS数据集，从SAS数据集再变成矩阵。它将大大方便我们的使用。 ---- 在SAS里玩穿越 | 【SAS Says·扩展篇】IML：穿越本文要解决三个问题：第一个问题：如何把SAS数据集转换为矩阵来处理？把数据集转换成矩阵来，在很多情况下处理起来会

在SAS里玩穿越 | 【SAS Says·扩展篇】IML：5.穿越

单细胞分析之质控（四）

[机器学习|理论&实践] 机器学习中的数学基础

机器学习作为一门复杂而强大的技术，其核心在于对数据的理解、建模和预测。理解机器学习的数学基础对于深入掌握其原理和应用至关重要。本文将深入介绍机器学习中的数学基础，包括概率统计、线性代数、微积分等内容，并结合实例演示，使读者更好地理解这些概念的实际应用。

在Python中实现你自己的推荐系统

现今，推荐系统被用来个性化你在网上的体验，告诉你买什么，去哪里吃，甚至是你应该和谁做朋友。人们口味各异，但通常有迹可循。人们倾向于喜欢那些与他们所喜欢的东西类似的东西，并且他们倾向于与那些亲近的人有相似的口味。推荐系统试图捕捉这些模式，以助于预测你还会喜欢什么东西。电子商务、社交媒体、视频和在线新闻平台已经积极的部署了它们自己的推荐系统，以帮助它们的客户更有效的选择产品，从而实现双赢。两种最普遍的推荐系统的类型是基于内容和协同过滤（CF）。协同过滤基于用户对产品的态度产生推荐，也就是说，它使用“人群的智慧

010

借助 TensorFlow 工具来学习 CNN 和计算机视觉

卷积神经网络（CNN）是计算机视觉应用的基础框架。在这篇文章中，你将会学到 CNNs 的基础和计算机视觉的基础（例如卷积，填充，卷积步长和池化层）。我们将使用TensorFlow 来建立CNN做图片识别。

ECCV2022 | PCLossNet：不进行匹配的点云重建网络

为了重建一系列数据，通常采用自动编码器之类的网络来尽可能预测类似于原始数据的输出，这种方式通常利用原始数据和网络输出之间的重建误差来训练输出。二维图像或一维信号的重建误差非常容易用元素化均方误差（MSE）直接计算，因为它们的元素（例如像素）以一定的顺序排列。然而，当计算点云的重建误差时，需要匹配算法来同步不同的数据，因为重建网络中输入和输出点集的排列可能不同。

语言生成实战：自己训练能讲“人话”的神经网络（上）

在过去的几个月里，我在个人博客上写了100多篇文章。这是相当可观的内容量。我突然想到一个主意：

机器学习入门 8-2 scikit-learn中的多项式回归与pipeline

本系列是《玩转机器学习教程》一个整理的视频笔记。在上一小节介绍了多项式回归的基本思想，本小节主要介绍sklearn是如何对多项式进行封装的，之后介绍一种类似Linux中"|"管道的Pipeline类。

PyTorch进阶之路（二）：如何实现线性回归

这篇文章将讨论机器学习的一大基本算法：线性回归。我们将创建一个模型，使其能根据一个区域的平均温度、降雨量和湿度（输入变量或特征）预测苹果和橙子的作物产量（目标变量）。训练数据如下：

调教LLaMA类模型没那么难，LoRA将模型微调缩减到几小时

最近几个月，ChatGPT 等一系列大语言模型（LLM）相继出现，随之而来的是算力紧缺日益严重。虽然人人都想打造专属于自己的大模型，但是能负担得起上亿参数模型训练的机构却寥寥无几。

Micapipe：一个用于多模态神经成像和连接组分析的管道

多模态磁共振成像（MRI）通过促进对大脑跨多尺度和活体大脑的微结构、几何结构、功能和连接组的分析，加速了人类神经科学。然而，多模态神经成像的丰富性和复杂性要求使用处理方法来整合跨模态的信息，并在不同的空间尺度上整合研究结果。在这里，我们提出了micapipe，一个开放的多模态MRI数据集的处理管道。基于符合bids的输入数据，micapipe可以生成i)来自扩散束造影的结构连接组，ii)来自静息态信号相关性的功能连接组，iii)量化皮层-皮层邻近性的测地线距离矩阵，以及iv)评估皮层髓鞘代理区域间相似性的微观结构轮廓协方差矩阵。上述矩阵可以在已建立的18个皮层包裹（100-1000个包裹）中自动生成，以及皮层下和小脑包裹，使研究人员能够轻松地在不同的空间尺度上复制发现。结果是在三个不同的表面空间上表示(native, conte69, fsaverage5)。处理后的输出可以在个体和组层面上进行质量控制。Micapipe在几个数据集上进行了测试，可以在https://github.com/MICA-MNI/micapipe上获得，使用说明记录在https://micapipe.readthedocs.io/，并可封装作为BIDS App http://bids-apps.neuroimaging.io/apps/。我们希望Micapipe将促进对人脑微结构、形态、功能、和连接组的稳健和整合研究。

Greenplum 实时数据仓库实践（10）——集成机器学习库MADlib

MADlib是一个基于SQL的数据库内置的开源机器学习库，具有良好的并行度和可扩展性，有高度的预测精准度。MADlib最初由Pivotal公司与伯克利大学合作开发，提供了多种数据转换、数据探索、概率统计、数据挖掘和机器学习方法，使用它能够简易地对结构化数据进行分析和学习，以满足各行各业的应用需求。用户可以非常方便地将MADlib加载到数据库中，从而扩展数据库的分析功能。2015年7月MADlib成为Apache软件基金会的孵化器项目，经过两年的发展，于2017年8月毕业成为Apache顶级项目。最新的MADlib 1.18.0可以与PostgreSQL、Greenplum和HAWQ等数据库系统无缝集成。Greenplum MADlib扩展提供了在Greenplum数据库中进行机器学习和深度学习工作的能力。

Python 谱聚类算法从零开始

谱聚类算法是一种常用的无监督机器学习算法，其性能优于其他聚类方法。此外，谱聚类实现起来非常简单，并且可以通过标准线性代数方法有效地求解。在谱聚类算法中，根据数据点之间的相似性而不是k-均值中的绝对位置来确定数据点属于哪个类别下。具体区别可通过下图直观看出：

PyTorch学习系列教程：何为Tensor？

本文继续PyTorch学习系列教程，来介绍在深度学习中最为基础也最为关键的数据结构——Tensor。一方面，Tensor之于PyTorch就好比是array之于Numpy或者DataFrame之于Pandas，都是构建了整个框架中最为底层的数据结构；另一方面，Tensor又与普通的数据结构不同，具有一个极为关键的特性——自动求导。今天，本文就来介绍Tensor这一数据结构。

OpenAI新研究补齐Transformer短板，将可预测序列长度提高30倍

现在，AI 研究中的一项挑战是在图像、视频或声音等复杂数据中进行长序列的精细相关性建模。Sparse Transformer 合并了 O（N^2）Transformer 自注意力机制的 O(N√N) 重组以及其他一些改进，从而直接用于这些丰富的数据类型。以前，这些数据上所使用的模型是专为某个领域制作的，或者很难将序列扩展到包含几千个元素。

R语言分布滞后非线性模型（DLNM）研究发病率，死亡率和空气污染示例|附代码数据

最近我们被客户要求撰写关于分布滞后非线性模型（DLNM）的研究报告，包括一些图形和统计输出。

综述：高维单细胞RNA测序数据分析工具（中）

当你的才华还撑不起你的野心时，请潜下心来，脚踏实地，跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了，通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进，一起成长。

python︱numpy、array——高级matrix（替换、重复、格式转换、切片）

先学了R，最近刚刚上手python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python，对应写一句R。

利用协方差，Pearson相关系数和Spearman相关系数确定变量间的关系

数据集中的变量之间可能存在复杂且未知的关系。重要的是发现和量化数据集的变量相关的程度。这些知识可以帮你更好地准备数据，以满足机器学习算法的预期，例如线性回归，其性能会随着这些相关的出现而降低。

J Cheminform｜使用具有自适应训练数据的GANs搜索新分子

今天给大家介绍的是美国橡树岭国家实验室的Andrew E. Blanchard等人于2021.2.23发表在Journal of Cheminformatics上的文章Using GANs with adaptive training data to search for new molecules。药物发现的过程涉及到对所有可能的化合物的空间进行搜索，生成对抗网络(GAN)为探索化学空间和优化已知化合物提供了一个有力工具。然而，训练GANs的标准方法可能导致模式崩溃，其中生成器主要产生与训练数据的一小部分密切相关的样本。相反，寻找新化合物需要超越原始数据的探索。在本文中，作者提出了一种训练GANS的方法，它促进增量探索，并利用遗传算法的概念限制模式崩溃的影响。在此方法中，来自生成器的有效样本被用来替换来自训练数据的样本。在替换过程中，作者考虑随机和引导选择以及重组。通过跟踪训练过程中产生的新化合物的数量，结果表明，对训练数据的更新大大优于传统的方法，增加了GANs在药物发现中的潜在应用。

k-近邻算法实现数字识别

总体来说这本书是不错的，对于算法的原理概述的比较准确，就是实战的代码过于简略，入门机器学习的话还是值得一看的

R语言的数据结构与转换

任何数据分析的第一步都是按照所需要的格式创建数据集。在 R 中，这个任务包括两个步骤：首先选择一种数据结构来存储数据，然后将数据输入或者导入这个数据结构中。下面介绍 R 中用于存储数据的多种数据结构。

「知识图谱」领域近期值得读的 6 篇顶会论文

论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Bases

调教LLaMA类模型没那么难，LoRA将模型微调缩减到几小时

选自Lightning AI 作者：Sebastian Raschka 机器之心编译编辑：赵阳 LoRA 微调方法，随着大模型的出现而走红。最近几个月，ChatGPT 等一系列大语言模型（LLM）相继出现，随之而来的是算力紧缺日益严重。虽然人人都想打造专属于自己的大模型，但是能负担得起上亿参数模型训练的机构却寥寥无几。在快速发展的人工智能领域，以高效和有效的方式使用大型语言模型正变得越来越重要。 LoRA（Low-Rank Adaption，低秩自适应）作为微调 LLMs 一种比较出圈的技术，其额外

机器学习系列（八）K均值（kMeans）

K均值算法是一种聚类算法，自动的将数据组成聚类。该算法采用距离作为数据之间相似性的评价指标，认为两个数据距离越近，相似度越大。算法步骤： 1）从数据样本中随机选择K个数据作为聚类的中心（质心），初始化簇。 2）计算每个数据样本到每个质心的距离，并划分到最近质心所在的类里。 3）重新计算划分之后的每个类的质心 4）重复迭代步骤（2）-（3），直到前后两次结果的质心相等或者距离小于给定阈值，结束聚类。 K均值的迭代过程如图，+为质心，经过3次迭代之后数据被分成三类。

一文教会你三维网格物体识别

本文由「图普科技」（微信公众号 tuputech）编译，原作者 Vladimir Tsyshnatiy，链接：https://medium.com/@vtsyshnatiy

图数据表征学习，绝不止图神经网络一种方法

近年来，图神经网络掀起了将深度学习方法应用于图数据分析的浪潮。不过其作为一门古老的认识世界的方法论，人们对于图数据表征技术的研究从很早以前就开始了。

干货 | 三维网格物体识别的一种巧妙方法

AI 科技评论按：本文由「图普科技」编译自 Medium - 3D body recognition using VGG16 like network

R学习数据结构和简单处理

scikit-learn Cookbook 01

I will again implore you to use some of your own data for this book, but in the event you cannot,we'll learn how we can use scikit-learn to create toy data.

R语言教程(2)—— 数据结构

这一节话不多说，这一期直接进入主题，开始介绍R中的数据结构。这是学习R语言强大的统计分析功能的基础。R中自带了大量的数据集供大家在学习中联系。在开始介绍数据结构之前，先简单介绍以下如何查看及使用这些数据集，之后在介绍数据结构时，也会大量使用到这些数据集。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐