腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
大数
据分析
参考文献
我正在寻找一个好的入门书或课程的
大数
据分析
。在实际应用方面,我对在R中使用
大数
据工具特别感兴趣。谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
1
回答
如果我的数据不能存储在内存中,执行EDA并将其可视化?我的数据集大小是200 G
、
、
、
、
执行探索性数
据分析
是任何机器学习项目的第一步,我主要是用熊猫来使用内存中的数据集进行数据探索。熊猫很容易用Python进行数
据分析
。但是,由于
系统
内存有限,我发现在Pandas中处理多个更大的数据文件很困难。对于大于RAM大小的数据集.千兆字节 我看过一些教程,其中他们使用星星之火过滤出基于规则的数据,并生成一个适合于内存的数据格式.最终,总有完全驻留在内存中的数据,但我想知道如何使用
大数
据集并执行探索性数
据分析
另一个挑战是可视化
大数
据进行探索性数
据分析
.如果它适合内存
浏览 0
提问于2018-08-03
得票数 0
回答已采纳
1
回答
深层神经网络与
大数
据分析
、
、
、
现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和
大数
据分析
。然而,我必须选择一个作为我未来的工作领域。 深层神经网络与
大数
据分析
相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
2
回答
天蓝色水滴存储与天蓝色数据湖存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝数据湖存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝数据湖存储更适合,反之亦然?
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
2
回答
如何将两台独立的ubuntu机器连接到同一个hadoop集群
、
、
我正在使用Hadoop为一个大学项目做一些数
据分析
。我的大学好心给了我一台机器,
系统
正在运行Ubuntu。在我把任何东西放到这个
系统
上之前,我先在我自己的笔记本电脑上测试一下。由于我的“主要工作”是在我的虚拟机上完成的,到目前为止,我在单个集群上使用Hadoop (无视我项目中“
大数
据分析
”部分的全部要点)。
浏览 1
提问于2014-04-14
得票数 1
1
回答
数
据分析
中的数据量是否重要?
、
、
、
、
因此,我想知道数
据分析
是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数
据分析
吗?有人说,如果你分析的是少量的数据,那根本就不是数
据分析
。我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
9
回答
R语言是否适合
大数
据
、
R有许多针对数
据分析
(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,进行贝叶斯数
据分析
;B.Lantz,“机器学习与R”。我已经看到了5TB的指南,将数据集视为
大数
据。 我的问题是:R是否适合在
大数
据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
我可以在Azure HDInsight中使用WebHDFS吗?
、
、
我已经创建了一个以Azure存储作为HDFS的HDInisght。我想知道是否可以使用webHDFS apis将二进制文件上传到HDFS。同时,我检查了hdfs-site.xml,发现 <name>dfs.webhdfs.enabled</name> <final>true</
浏览 0
提问于2020-07-14
得票数 0
回答已采纳
2
回答
大数
据分析
# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt
浏览 0
提问于2018-11-20
得票数 0
回答已采纳
2
回答
处理
大数
据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的
大数
据和数据可视化项目。所以请让我知道有没有最好的软件来处理
大数
据和数据可视化,即数
据分析
。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
3
回答
可以使用哪种工具来生成此图?
、
我在
大数
据分析
的图形工具方面是新手。尽管以下内容不是来自
大数
据,但我想知道是使用什么工具来创建这种复杂的图形: 与论文相关
浏览 5
提问于2013-01-11
得票数 0
回答已采纳
2
回答
为什么NoSQL应该执行得更快?
、
、
让我们想象一下在服务器上完成的非常简单的任务。有许多用户在我们的网站上聊天,我们想知道他们中的每一个人是否在线。但是为什么memcached应该执行得更快呢?如果我理解正确,MySQL还将从内存中读取数据,而不是从磁盘中读取数据(如果设置和调整正确)。用于持久化的资源很少,但也不是太多--只需在磁盘上刷新几个内存页面即可。
浏览 0
提问于2013-05-23
得票数 3
2
回答
大数
据分析
、
、
、
、
我正试图分析大量的GitHub存档数据,并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本,但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个
浏览 6
提问于2014-08-02
得票数 1
回答已采纳
7
回答
如何利用
大数
据技术整治药品网络制假售假?
、
、
、
2月1 号阿斯利康与腾讯达成战略合作,共同为“健康中国”保驾护航,其中腾讯将以
大数
据为驱动的互联网技术,精准打击药品网络制假售假,那么这是如何实现的呢?
浏览 546
提问于2018-03-30
1
回答
NAS与CFS的优势区别及应用?
NAS与CFS的优势区别及应用
浏览 804
提问于2018-08-04
1
回答
如何使用Java框架处理
大数
据?
、
我对数据科学相当陌生,现在刚刚开始开发一个
系统
,要求我分析大量数据(例如,每个DB中有500万到600万条记录)。总的来说,我想知道当前处理
大数
据的技术/趋势是什么(即使用java框架)。
浏览 2
提问于2016-11-29
得票数 0
回答已采纳
1
回答
Zookeeper需要有自己的HAMR服务器吗?
、
、
这与发布的
大数
据分析
引擎有关 Zookeeper必须在自己的服务器上安装HAMR吗?
浏览 2
提问于2014-09-16
得票数 0
1
回答
数据库中的多个单元格
我是数据库新手。问题是为什么笔记本中有多个单元格,当我们可以在一个单元格中编写完整的指令/程序时?
浏览 2
提问于2022-04-10
得票数 0
2
回答
BigData分析选择技术栈
、
、
、
我想编写一个应用程序,该应用程序能够从大型生产
系统
的监视数据中生成报表并启用交互式数
据分析
(OLAP)。(我知道,前面有一些有问题的权衡决定,但让我们暂时搁置它们。)我确定了基本技术栈的下列可能性: 使用数据库值得吗
浏览 6
提问于2013-06-24
得票数 1
回答已采纳
1
回答
度量收集和分析体系结构
、
、
、
、
因此,该
系统
每天将收到17.28亿条记录。这里有很多问题。 首先,不需要存储所有数据,因为用户只需要指定时间段的图表,因此需要一些聚合。什么样的数据库解决方案适合它?
浏览 0
提问于2018-11-26
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
恒扬时空大数据分析系统
智慧展厅特色功能之客流大数据分析系统
大数据分析
大数据分析经典案例:无缝整合OA、ERP、MES等系统
大数据分析领域
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券