腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(24)
视频
沙龙
2
回答
R-
连续变量
标
题上
的
Group
by,
分类
变量
因子
为
行
,聚
合为
最小
、
最大
、
平均
r
、
group-by
我希望通过将连续
的
列作为
行
,将
分类
因子
作为列标题进行分组,并将聚合记录作为
平均
值、
最小
值或
最大
值。这是一个基本
的
问题,也是我无法找到
的
答案。以虹膜数据
为
例。我想得到每个物种类别的sepal.width和sepal.length
的
平均
值。library(dplyr)
浏览 23
提问于2021-11-22
得票数 1
13
回答
混合数值和
分类
数据
的
K-均值
聚
类
data-mining
、
clustering
、
octave
、
k-means
、
categorical-data
我
的
数据集包含许多数字属性和一个
分类
。., NumericAttrN, CategoricalAttr, 其中CategoricalAttr采用三个可能
的
值之一:CategoricalAttrValue1、CategoricalAttrValue2我使用默认
的
八阶K均值
聚
类算法
的
实现。它只适用于数字数据。因此,我
的
问题是:将CategoricalAttr
分类
属性拆分为三个数值(二进制)
变量
(如IsCategoricalAttrValu
浏览 0
提问于2014-05-14
得票数 200
回答已采纳
4
回答
数据挖掘中
的
孤立点检测
data-mining
、
svm
、
outliers
关于离群点
的
检测,我有几个问题: 我们可以使用支持向量机或任何其他监督学习算法来检测离群点吗?每种方法
的
优缺点是什么?
浏览 7
提问于2011-05-17
得票数 12
1
回答
将相似数据分组,使组内相关性
最大
化,组间相关性
最小
化。
r
、
time-series
、
classification
、
cluster-analysis
、
correlation
所以这是我
的
问题。我有2000只股票
的
每日回报数据,下面是一个小样本(s1 to s8,day1 to day15)。然后,我得到了每一组中每一
行
的
平均
值,并计算了两组均值
的
相关矩阵之和,并将其命名为cor_sum_mean。最后,我计算了:cor_sum_ME
平均
值/cor_sum
浏览 2
提问于2017-10-19
得票数 0
1
回答
Adobe /Analytics和Demandbase属性映射
adobe
、
adobe-analytics
有人知道DTM中
的
Demandbase属性是如何映射到Analytics
变量
的
吗?我已经在网上搜索过了,还找不到任何东西!我得到
的
只是一张表9--见图)。我已经完成了集成部分,我现在需要映射这些属性,但是无法找到任何关于如何实现
的
信息?
浏览 1
提问于2018-04-16
得票数 0
回答已采纳
5
回答
高维二进制稀疏数据
的
聚
类算法
machine-learning
、
clustering
、
unsupervised-learning
我有一个包含10,000个基因
的
数据集,如下所示 1 0 1 1asian每一
行
都意味着一个人
的
DNA中是否有一个基因。我们正试图根据上述数据对不同
的
族裔群体进行
分类
。但是首先,我们想要使用一些
聚
类算法来可视化集群对于不同种族群体
的
样子。我们不打算使用这种<e
浏览 0
提问于2017-10-07
得票数 7
2
回答
是否有一个很好
的
系统方法来探索和分析数据(在建模之前)?
methodology
我在Kaggle上发现了几个关于Kaggle
的
内核
的
例子,他们似乎遵循了某种方法,以便系统地分析和探索数据,确保找到所有的异常值、缺失
的
值等等。它们只是一些实际
的
例子,留下了很多问题。我只是假设必须有一个或几个食谱/方法/流程图,我可以学习/使用,以便有一个好
的
清单,系统地工作在我
的
数据,抓住所有的数据质量问题,并注意到它们以一个明确
的
方式。我该查些什么才能找到这样
的
东西?我无法想象这是不存在
的
。这看起来
浏览 0
提问于2020-12-03
得票数 1
回答已采纳
1
回答
SQL组在使用时不工作,没有out,SQL可以正常工作
mysql
、
sql
WHERE d.vampID = $vampID 但是,当我按特性添加一个组时,我什么也得不到(下面是包含组
的
内容) SELECT * LEFT JOIN vtm5eDisciplinePowers p ONd.ID = p.disciplineID
GROUP
BY d.I
浏览 9
提问于2022-11-06
得票数 0
7
回答
从羊群中快速找到动物
的
算法
algorithm
、
geometry
、
machine-learning
、
spatial-index
、
outliers
这里有成群
的
动物(牛羚),在牛群中,我需要找到一只远离牛群
的
动物。 当然,有一个简单
的
算法来解决这个问题。数一数每个点
的
邻域中
的
点数,然后如果那个邻域是空
的
(它中
的
0点),那么我们就知道这个点是远离羊群
的
。有更快
浏览 8
提问于2012-12-27
得票数 15
回答已采纳
3
回答
将距离和
最小
化
的
区域划分算法
algorithm
、
geometry
、
2d
、
cluster-analysis
、
mathematical-optimization
问题是将其划分为4个区域--(具有一条水平和一条垂直线),以便将每个区域中
的
度量和
最小
化。 我不知道是否有任何
聚
类算法可以帮助我解决这个问题,或者例如,它是否可以被描述
为
一个简单
的
优化问题。其中决策
变量
是“轴”。
浏览 3
提问于2017-03-02
得票数 0
10
回答
机器学习.日期/时间数据
的
特性工程
machine-learning
、
time-series
、
feature-selection
为
机器学习应用程序处理时间数据
的
常见/最佳实践是什么?提前感谢!
浏览 0
提问于2014-10-29
得票数 63
回答已采纳
12
回答
如何找到数据点集群
的
中心?
algorithm
、
geocoding
、
cluster-analysis
、
data-mining
、
markerclusterer
假设在过去
的
一年里,我每天都绘制直升机
的
位置,并绘制出以下地图:任何看过这架直升机的人都能告诉我,这架直升机是从芝加哥出发
的
。 // magic} 更新:示例数据集下面是一个包含150个地理代码
的
pastebin前50位是在芝加哥附近
的
几个集群中。其余
的
浏览 22
提问于2013-06-14
得票数 32
回答已采纳
3
回答
如何估计科学学习中回归者
的
方差?
python
、
scikit-learn
、
regression
、
variance
科学学习中
的
每一个
分类
器都有一种方法predict_proba(x)来预测x
的
类概率。如何为回归者做同样
的
事情?我知道如何估计预测方差
的
唯一回归者是高斯过程回归,我可以这样做:在一维中,我甚至可以画出高斯过程回归器对不同数据点
的
预测有多自信📷 如何估计其他回归者
的
预测方差?例如,对于核脊回归器,多层感知器,集成回归器?
浏览 0
提问于2018-05-17
得票数 9
回答已采纳
32
回答
编写一个程序,在10亿个数字数组中找到100个
最大
的
数字。
algorithm
、
sorting
、
max
、
quickselect
我最近参加了一次采访,在采访中我被要求“编写一个程序,在10亿个数字数组中找到100个
最大
的
数字。”我只能给出一个蛮力
的
解决方案,在O(nlogn)时间复杂度中对数组进行排序,并取最后100个数字。Arrays.sort(array); 面试官在寻找一个更好
的
时间复杂性,我尝试了几个其他解决方案,但没有回答他。有没有更好
的
时间复杂性解决方案?
浏览 11
提问于2013-10-07
得票数 311
回答已采纳
10
回答
手写圆圈、钻石和矩形
的
识别
android
、
algorithm
、
neural-network
、
handwriting-recognition
我想找一些关于识别三种手写形状
的
建议-圆圈,钻石和矩形。我试过不同
的
方法,但是失败了,所以也许你可以为我指明另一个更好
的
方向。1)基于点积
的
手写体形状点与理想形状点之间
的
简单算法。对于Kohonen,它总是将所有数据(用于训练
的
事件)
分类
为
同一类别。用点
的
前馈更好(但在与aproach 1和2相同
的
水平上),而且对于光栅化
的
图像,它是非常慢
的
(我至
浏览 0
提问于2013-11-27
得票数 6
回答已采纳
2
回答
d3.v3所有圆半径相同
的
散射图
javascript
、
d3.js
、
scatter-plot
、
nvd3.js
我发现
的
每一个例子都显示了所有散点图点都是随机半径。能让它们都一样大小吗?如果我尝试静态地设置半径,所有的圆圈都会很小(假设是默认半径)。我希望所有的圆圈都是大
的
。有办法吗?下面是使用Math.random()形成图形数据
的
代码片段(由于某种原因,它工作得很好):{ size: Math.random() } } Math.r
浏览 0
提问于2014-01-03
得票数 2
回答已采纳
2
回答
如何在计数数据上创建密度图/曲线?
r
、
ggplot2
我想在R中使用带数据
的
ggplot创建像这样
的
密度图。Year Month Crop Incidence2015 Feb Maize 10.00附言:请原谅我。我刚从excel中复制粘贴了数据。无法对其进行矢量化。
浏览 3
提问于2021-03-21
得票数 0
20
回答
如何在从左到右、从上到下排序
的
2d数组中搜索一个数字?
algorithm
、
search
、
multidimensional-array
我最近被问到这个面试问题,我很好奇这个问题有什么好
的
解决方案。 搜索和确定目标数是否在数组中
的
最佳方法是什么?现在,我
的
第一个倾向是利用二进制搜索,因为我
的
数据是排序
的
。我可以在O(log )时间内确定一个数字是否在一
行
中。然而,是这两个方向把我甩了。 另一个我认为可能有效
的
解决方案是从中间
的
某个地方开始。如果中间值小于我
的
目标值,那么我可
浏览 15
提问于2010-03-16
得票数 95
111
回答
乘二数
code-golf
、
math
、
number
这些可以作为程序或函数
的
参数,或作为列表提供给标准输入中
的
代码。限制:请不要有标准漏洞。这是密码-高尔夫,回答以最少
的
字节数获胜。 注:布局被盗,从我以前
的
挑战,加两个数字。
浏览 0
提问于2017-01-09
得票数 31
69
回答
将数组拆分为块
javascript
、
arrays
、
split
什么方法适合将数组分块(拆分)成许多较小
的
数组,比如说,最多10个元素?
浏览 36
提问于2011-12-14
得票数 736
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
当今最火10大统计算法,你用过几个?
一文综述数据科学家必备的10大统计技术:线性回归、分类、无监督学习……
从线性回归到无监督学习,数据科学家需要掌握的十大统计技术
40个问题测试你的机器学习聚类技术
数据科学家常用的10项统计技术
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券