腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
大数
据分析
参考文献
bigdata
我正在寻找一个好的入门书或课程的
大数
据分析
。在实际应用方面,我对在R中使用
大数
据工具特别感兴趣。谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
1
回答
如果我的数据不能存储在内存中,执行EDA并将其可视化?我的数据集大小是200 G
pyspark
、
data-visualization
、
plotly
、
dask
、
holoviews
执行探索性数
据分析
是任何机器学习项目的第一步,我主要是用熊猫来使用内存中的数据集
进行
数据探索。但是我想知道如何
进行
数据清理,如何处理丢失的数据和数据离群点,单变量图,特征如何影响标签的密度图,相关性等等。我看过一些教程,其中他们使用星星之火过滤出基于规则的数据,并生成一个适合于内存的数据格式.最终,总有完全驻留在内存中的数据,但我想知道如何使用
大数
据集并执行探索性数
据分析
另一个挑战是可视化<e
浏览 0
提问于2018-08-03
得票数 0
回答已采纳
9
回答
R语言是否适合
大数
据
bigdata
、
r
R有许多针对数
据分析
(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,
进行
贝叶斯数
据分析
;B.Lantz,“机器学习与R”。我已经看到了5TB的指南,将数据集视为
大数
据。 我的问题是:R是否适合在
大数
据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
寻找规模较小的类似Hadoop的解决方案
sql
、
database
、
hadoop
、
infinispan
我们有一个大约1000 GB (千兆字节)的数据库,我们正在考虑使用Hadoop来执行时间序列分析。问题是Hadoop需要一些时间才能进入,而且对于我们的数据库大小来说,Hadoop实际上是一个超大的解决方案。我的问题是,是否有人知道更小规模的Hadoop类似的解决方案。它还需要一些类似SQL的查询语言。我脑海中唯一浮现的就是JBoss Infinispan.但我想看看是否有其他已知的解决方案。
浏览 1
提问于2013-11-20
得票数 2
1
回答
深层神经网络与
大数
据分析
neural-network
、
deep-learning
、
anomaly-detection
、
bigdata
现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和
大数
据分析
。然而,我必须选择一个作为我未来的工作领域。 深层神经网络与
大数
据分析
相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
3
回答
Kibana、Logstash用于
大数
据环境
hadoop
、
elasticsearch
、
bigdata
、
logstash
、
kibana
我们可以使用Logstash和Kibana
进行
大数
据分析
吗? 我将使用Hadoop来存储我的数据。在尝试任何东西之前,我想知道是否有人已经尝试过了。
浏览 0
提问于2013-12-12
得票数 1
2
回答
天蓝色水滴存储与天蓝色数据湖存储的区别
azure-data-lake
、
azure-blob-storage
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝数据湖存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝数据湖存储更适合,反之亦然?
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
7
回答
如何利用
大数
据技术整治药品网络制假售假?
大数据
、
互联网
、
腾讯
、
网络
2月1 号阿斯利康与腾讯达成战略合作,共同为“健康中国”保驾护航,其中腾讯将以
大数
据为驱动的互联网技术,精准打击药品网络制假售假,那么这是如何实现的呢?
浏览 620
提问于2018-03-30
1
回答
数
据分析
中的数据量是否重要?
dataset
、
bigdata
、
analytics
、
data-science
、
data-analysis
因此,我想知道数
据分析
是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数
据分析
吗?有人说,如果你分析的是少量的数据,那根本就不是数
据分析
。我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
2
回答
大数
据分析
bigdata
# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt
浏览 0
提问于2018-11-20
得票数 0
回答已采纳
2
回答
处理
大数
据和数据可视化的最佳工具
data-visualization
、
bigdata
、
data-analysis
我目前正在做(开始)我的
大数
据和数据可视化项目。所以请让我知道有没有最好的软件来处理
大数
据和数据可视化,即数
据分析
。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
3
回答
可以使用哪种工具来生成此图?
graphics
、
matplotlib
我在
大数
据分析
的图形工具方面是新手。尽管以下内容不是来自
大数
据,但我想知道是使用什么工具来创建这种复杂的图形: 与论文相关
浏览 5
提问于2013-01-11
得票数 0
回答已采纳
4
回答
Google Dataflow对Apache Spark
apache-spark
、
google-cloud-dataflow
、
distributed-computing
、
google-cloud-ml
我正在调查、Google、Dataflow、和Apache ,以决定哪种解决方案更适合我们的
大数
据分析
业务需求。我发现在spark平台中有Spark SQL和MLlib来
进行
结构化数据查询和机器学习。 我想知道谷歌数据流平台中是否有相应的解决方案?
浏览 2
提问于2015-11-04
得票数 32
回答已采纳
1
回答
PermissionError:[Errno 13]权限被拒绝
python
、
amazon-web-services
、
amazon-ec2
、
jupyter-notebook
我在最后一年的项目中使用AWS EC2,我开始设置来
进行
大数
据分析
。当我执行步骤13并在我的终端中键入jupyter notebook时,我无法访问该网站?
浏览 1
提问于2019-02-26
得票数 0
2
回答
大数
据分析
python
、
database
、
bigdata
、
google-bigquery
、
data-analysis
我正试图分析大量的GitHub存档数据,并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本,但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个
浏览 6
提问于2014-08-02
得票数 1
回答已采纳
1
回答
NAS与CFS的优势区别及应用?
文件存储
NAS与CFS的优势区别及应用
浏览 923
提问于2018-08-04
1
回答
谷歌云DataProc的性能监控
google-cloud-platform
、
google-cloud-dataproc
我们正在使用GoogleCloudPlatform
进行
大数
据分析
。对于处理,我们目前使用的是google cloud dataproc & spark-streaming。
浏览 0
提问于2016-06-13
得票数 0
1
回答
使用dbplyr
进行
数据库内处理与直接编写SQL代码
r
、
dbplyr
问题是,在企业级应用程序中使用dbplyr
进行
大数
据分析
是有意义的吗?
浏览 2
提问于2022-11-05
得票数 1
回答已采纳
1
回答
Dataproc :通过REST API提交Spark作业
google-cloud-platform
、
google-cloud-dataproc
我们正在使用GoogleCloudPlatform
进行
大数
据分析
。对于处理,我们目前使用的是google cloud dataproc & spark-streaming。
浏览 2
提问于2016-06-13
得票数 0
1
回答
分区拼花文件需要更多的空间和更多的时间来查询。
parquet
理论上,Parquet文件所占用的空间比CSV要小,并且应该能更快地提供结果。我的实验正好相反。这项活动需要700万英镑。使用“城市”过滤标准查询Parquet需要350 CSV,而CSV需要111 CSV。PDF格式的执行笔记簿在这里
浏览 1
提问于2021-07-26
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券