大数据研究分析_研究数据分析_数据分析研究 - 腾讯云开发者社区

我目前正在研究算法和数据结构。经过近两个月的学习，我仍然觉得时间的复杂性非常令人困惑。我现在真的质疑到目前为止我学到的一切。我将以BubbleSort为例，用大-omega(N)，大θ(n^2)和大-O(n^2)。大θ确实存在(当我分析它时，它是有意义的)。有人能向我解释我的教授是错的还是我误解了什么吗？

浏览 2提问于2018-04-17得票数 2

回答已采纳

2回答

hadoop中的分析实现

、、

目前，我们已经有了基于mysql的分析。我们每隔15分钟读取日志，对其进行处理并添加到mysql数据库中。随着我们的数据不断增长(在一种情况下，到目前为止增加了900万行&每月增加50万行)，我们计划将分析转移到无sql数据库。根据我的研究，Hadoop似乎更适合我们处理日志&它可以处理非常大的数据集。然而，如果我能从专家那里得到一些建议，那就太好了。

浏览 0提问于2014-04-12得票数 0

1回答

在电信cdr数据中计算用户的影响

、

下面是一个示例参考：在类似的线路上，有没有其他算法可以使用用户的CDR数据来计算用户在电信网络上的影响力得分？

浏览 2提问于2012-08-22得票数 1

1回答

ESRI提供了谷歌BigQuery无法提供的功能，以及如何将这两种工具结合使用？

、、、

目前，我正在寻找支持大数据地球空间分析的大数据技术。我来到ESRI，发现它主要支持地球空间数据分析和可视化。然而，目前，除了需要许可的ArcGIS GeoAnalytics服务器之外，它们还没有对大数据地理空间分析的广泛支持。同时，我发现Google BigQuery是多么强大，它最近提供了对地理空间处理和分析的支持(为您使用的东西付费，每秒)。我想知道的是:我应该选择哪个工具进行地理空间大数据处理、分析和可视化？

浏览 5提问于2019-10-28得票数 0

回答已采纳

2回答

导入大型SQL文件

、

我是一名学生，正在进行一些研究，这涉及到一种数据挖掘。我有几个自愿的“节点”服务器，它们为我收集和生成SQL文件，以便在我的服务器上导入和分析。我想知道是否有更好的方法来导入非常大的文件-每个文件的重量约为100MB。我试过“.myfile.sql”，但它太慢了，PHPMyAdmin不会处理那么大的文件。有什么想法吗？谢谢!

浏览 3提问于2012-11-09得票数 3

回答已采纳

1回答

带有IdeaBlade的

、、、、

我想问您，是否有任何方法使用来发现和改进IdeaBlade ORM的性能？或者可能将IdeaBlade查询转换为SQL，然后抛出到MS。

浏览 6提问于2013-11-13得票数 0

回答已采纳

1回答

Cassandra :孤立的工作负载

按rest服务共享数据的DATACENTER1 .流吞食有人已经试过了吗？在datacenter2装载期间，datacenter1上的数据可用性好吗？

浏览 0提问于2017-03-28得票数 1

回答已采纳

1回答

设置20 or存储:使用普通文件系统或hadoop

、、

我是一名年轻的研究人员，计划购买一台用于(可能是“大”)数据分析的计算服务器。服务器将有一个20 The的硬盘空间。我当前的问题是，我应该使用普通的linux文件系统还是hadoop作为系统。

浏览 5提问于2016-09-24得票数 0

回答已采纳

2回答

如何研究静态分析？

我读过很多关于静态分析的论文和教程，但我仍然觉得自己在静态分析方面还没有达到中等水平。我想一步一步地开始，对这个问题有一个深刻的认识。我真的很希望这个问题能够在每年出版的几十个静态分析材料中收集到为数不多的珍珠。

浏览 2提问于2014-07-11得票数 3

回答已采纳

2回答

Clojure时间序列分析

、

我有一个大的数据集(200 9GB未压缩，9GB在bz2 -9压缩)股票滴答数据。我的机器有16 My内存。我宁愿：现在，我认为这里有很好的交互，可以使用Clojure的懒惰和未来的对象(也就是说，我可以定义对象s.t )。当我试图访问它们时，我会即时解压它们。)问:在Clo

浏览 5提问于2012-09-10得票数 4

回答已采纳

2回答

贝尔曼-福特与迪克斯特拉的图表密度

、、、、

我在测试这两种算法，Bellman在稀疏图上的表现更好，并查看了对两种算法的大O分析，对Bellman的O(VE)和Dijkstra的O(E + V lg V)的分析。我相信这是正确的。我做了一些研究说真的是这样吗？

浏览 11提问于2022-03-28得票数 0

1回答

Movesense 1.6.2 send_ble_nus_data B/s？

、、、、

我假设数据包长度为20是最优的。50 Hz * 20 B/s = 1000 B/s，在Windows10和Android8.1上使用Xamarin Forms 组件收听时没有损失。在100 Hz * 20 B/s = 2000 B/s的情况下，一些(Window 10 <1%，Android 8.1 <0.1%)数据包丢失。

浏览 1提问于2018-07-04得票数 1

3回答

大数据实时机器学习应用的生产体系结构？

、、、、

我开始学习一些关于大数据的东西，重点放在预测分析上，为此，我想实施一个案例研究：我研究了一些相关的技术

浏览 6提问于2012-12-06得票数 11

回答已采纳

1回答

SnowFlake Vs.GCP (大型查询)作为DWH

、、、

在选择一个DWH的过程中，一个小的启动有很小的数据，但希望增长到中等大小的数据(我怀疑我们会达到“大数据”大小)。此外，我还有几个问题：，我可以导入嵌套的Google数据，然后在雪花中轻松地处理/扁平吗？

浏览 3提问于2022-08-14得票数 -1

1回答

正在尝试查找java swing代码中的内存泄漏

、、

我有一个相当大的Java应用程序，它可以创建描述绘图的复杂数据结构，从原始的带时间戳的数据点开始，然后显示绘图、分析绘图等。我得到了一个内存转储，并使用Eclipse内存分析器和YourKit进行了分析。已经花了相当长的时间来深入研究这个问题。我意识到如果不能深入研究代码就很难判断，但如果有任何关于在哪里查找的一般性建议/警告，那就太好了。

浏览 1提问于2015-10-29得票数 0

2回答