腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
1
回答
深层神经网络与大数据分析
、
、
、
我是一名准PhD (CS)学生。在我的MS研究期间,我在异常检测领域工作过。现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和大数据分析。然而,我必须选择一个作为我未来的工作领域。 我想把其中一个领域和我以前的工作联系起来,那就是异常检测。此外,我还要问两个问题: 深层神经网络与大数据分析,哪一种更适合异常检测? 深层神经网络与大数据分析相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
1
回答
数据分析中的数据量是否重要?
、
、
、
、
因此,我想知道数据分析是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数据分析吗? 有人说,如果你分析的是少量的数据,那根本就不是数据分析。 所以我把数据分析和大数据混淆了。有人能回答我这个问题吗? 我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
1
回答
大数据分析参考文献
我正在寻找一个好的入门书或课程的大数据分析。在实际应用方面,我对在R中使用大数据工具特别感兴趣。 我想要一本书,但欢迎其他参考资料。 谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
9
回答
R语言是否适合大数据
、
R有许多针对数据分析(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,进行贝叶斯数据分析;B.Lantz,“机器学习与R”。 我已经看到了5TB的指南,将数据集视为大数据。 我的问题是:R是否适合在大数据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
长时间运行的进程和托管提供商?
、
、
、
我有一个运行了好几个小时的python数据分析脚本,当它在我的桌面上运行时,随着粉丝们的狂热,我意识到我可以在bkgnd中的一个托管账户上远程运行它,然后让它破解。 但我想知道--托管提供商通常不赞成这样的做法吗?他们是否假设我所有的CPU/内存使用都是突发性的--来自我的Apache2实例的使用率,一个运行了12小时的进程会被他们的sysop杀死? 或者他们会认为我是在为使用付费,所以你自己动手吧?我的脚本及其数据是自包含的,没有使用任何网络或数据库资源。 有这方面的经验吗?
浏览 8
提问于2015-11-12
得票数 0
1
回答
如何在大数据和网络分析中起步
、
、
、
、
我目前对大数据分析和网络分析感兴趣,但我不知道如何开始和从哪里开始。我试着上网看看,但有些对我来说是先进的。走这条路之前,我首先需要的是统计学和数学方面的技能和知识吗? 我目前的计划是每个周末参加在线课程,因为我目前在工作日做软件助理工程师,练习大数据所需的编程语言,比如R。我已经获得了计算机科学学位,所以熟悉一些统计和数学方法并不是个问题。任何建议和意见都是非常感谢的! 对于那些已经有经验的人来说,你的经验是怎样的,你最擅长的是什么?
浏览 3
提问于2016-04-01
得票数 0
回答已采纳
1
回答
500G 在哪儿能找到资料?
、
、
、
、
500G python web、爬虫、数据分析、机器学习、大数据、前端实战项目视频代码免费分享 在哪儿能下载到资料,在线等,挺急的~, 感谢各位大佬~
浏览 231
提问于2019-05-10
1
回答
将物联网数据存储在MongoDb中
、
我目前正在向我的MongoDB传输物联网数据,它运行在Docker Container(托管在亚马逊网络服务中)中。每天我都会得到几千个数据点。 我将使用这些收集的数据进行一些密集的数据分析和ML,这将每天运行。 那么,大数据通常就是这样存储的吗?行业标准和最佳实践是什么?
浏览 3
提问于2021-03-12
得票数 2
1
回答
神经网络能被认为是一种数据分析方法吗?
、
我正在写论文。在本文中,我认为神经网络是一种数据分析的方法。经过一段时间后,我现在不确定这一说法是否合理。 维基百科说: 数据分析是一个检查、清理、转换和建模数据的过程,目的是发现有用的信息、提供结论和支持决策。 因此,前馈网络确实对数据进行建模,但由于其黑匣子性质,发现有用信息的用处要小得多。然而,由于它的抢夺能力,它肯定可以支持裂变制造。然而,使用神经网络的主要目标仍然是做出简单的预测,而不一定支持离职。 你对此有何看法?前馈神经网络能被认为是一种数据分析方法吗?
浏览 0
提问于2021-02-06
得票数 3
2
回答
最佳编程语言
、
、
我精通纯粹的统计学。我不懂任何编程语言。这是我应该学习的最好的编程语言,它将有助于提高我在数据分析方面的职业生涯。 我对概念只有理论知识。请推荐一项技能,我应该发展成为一名数据分析员。
浏览 0
提问于2018-07-06
得票数 1
2
回答
NoSQL数据库在数据科学中的应用
、
、
如何使用NoSQL数据库(如MongoDB )进行数据分析?它们中有哪些特性可以使数据分析更快、更强大?
浏览 0
提问于2014-07-21
得票数 21
回答已采纳
3
回答
大数据案例研究或用例示例
、
、
我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提到 这些公司使用了什么样的数据。数据有多大? 他们用来处理数据的工具是什么? 他们面临的问题是什么,他们得到的数据是如何帮助他们解决问题的。 他们如何选择工具\技术来满足他们的需要。 他们从数据中识别出了什么样的模式&他们从数据中看到了什么样的模式。 我想知道是否有人能为我提供所有这些问题的答案或一个链接,至少回答一些问题。我正在寻找现实世界的例子。 如果有人能分享金融业是如何利用大数据分析的,那就太好了。
浏览 0
提问于2014-06-11
得票数 14
2
回答
处理大数据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的大数据和数据可视化项目。所以请让我知道有没有最好的软件来处理大数据和数据可视化,即数据分析。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
2
回答
DataOps是什么?
、
这个网站已经有了很好的答案,比如什么是DevOps和什么是SecOps。 随着时间的推移,我逐渐认识到,当敏捷方法的哲学应用于运营时,意见就诞生了DevOps。SecOps也是如此。 那么,将敏捷方法应用于大数据和数据分析的DataOps会是什么样子呢?这与敏捷软件开发和DevOps有何相似之处?
浏览 0
提问于2019-11-13
得票数 3
6
回答
facebook数据泄漏:大数据分析竟能操控美国大选?
、
、
、
近日,facebook的数据泄露事件引起广泛讨论,罪魁祸首剑桥分析公司通过数据分析来帮助企业和政党改变受众行为。他甚至声称“只要了解用户的十个赞,就能比用户的同事更准确地评价用户”。那么大数据分析真的有他们所说的那么强吗?这是怎么样做到的?公众的个人隐私又该如何保护?
浏览 814
提问于2018-03-26
1
回答
大数据和小数据的优缺点?
我在寻找更深入的答案。我知道基础知识--小数据分析起来更快,使用大数据你会有更多的能力,等等。但我想知道更多(也许是关于因果推断?)关于每种方法的优点和缺点。谢谢!
浏览 3
提问于2017-10-11
得票数 1
2
回答
长期运行的due作业由于Azure存储超时而失败
、
、
、
问题是一个长期运行的天蓝色网络工作在一个日常的时间表上。每次运行需要2-4小时进行数据分析。唯一的依赖项是通过EF使用Azure SQL数据库和使用Azure存储,只需在AzureWebJobsDashboard和AzureWebJobsStorage连接上设置App.Config,在VS上使用webjob进行标准设置。网络作业的大部分时间都使用EF的SaveChanges()。我还使用aprox 3000行控制台输出来进行重要的日志记录以监视进度。web应用程序被配置为Allways ON,WEBJOBS_IDLE_TIMEOUT设置为一个非常高的数字。 以下是错误的日志: 10/20/20
浏览 3
提问于2016-10-20
得票数 2
回答已采纳
1
回答
如何使用Gephi选择社交网络中具有最大/最小聚类系数或度的节点?
、
、
、
我有一个关于社交网络的项目,我已经使用Gephi 0.9.2工具来绘制由非常大的节点组成的图。我想要使我的网络中的节点数量固定,然后如果我们想要添加一个新节点,我们需要删除具有最大/最小聚类系数或最大/最小度的节点。 下图显示了我的网络的数据分析:
浏览 2
提问于2016-05-03
得票数 0
1
回答
光纤到铜交换-需要鲁棒解决方案的小型网络
、
、
我有一个简单的设置,这似乎需要一个聪明的解决方案,希望有人有一些想法。 网络: 4台数据生成计算机,每台都配有铜>光纤介质转换器。 2数据分析计算机 SM光纤从所有四台数据生成计算机到包含数据分析计算机的机房。 所有计算机中的1Gb Cat-5 NICS 我有一组人在分析电脑上做数据分析。在任何给定的时间,它们都需要指定从哪台(单一的)数据生成计算机接收数据(TCP套接字连接)。因此,他们需要一种简单的方法来选择数据生成计算机连接到特定数据分析计算机的UI,无论是在物理设备上,还是使用自定义的可读取的防傻瓜用户界面。 我的前任的解决方案是使用两个媒体转换器,并让操作者插入正确的光纤对。这
浏览 0
提问于2020-10-06
得票数 1
2
回答
hadoop与mongodb和hadoop对mongodb
、
、
我试图理解mongoDB和Hadoop之间的关键区别。我理解mongoDB是一个数据库,而Hadoop是一个包含HDFS的生态系统。使用这两种技术处理数据的方式有一些相似之处,但也有很大的不同。 我不明白为什么有人会在Hadoop集群上使用mongoDB,主要是mongoDB比Hadoop具有什么优势。两者都执行并行处理,两者都可以与Spark一起用于进一步的数据分析,那么什么是一个比另一个的增值。 现在,如果要将两者结合起来,为什么要在mongoDB和HDFS中存储数据呢?MongoDB有map/reduce,所以为什么要将数据发送到hadoop进行处理,而且两者都与Spark兼容。
浏览 1
提问于2019-05-07
得票数 0
回答已采纳
9
回答
近日开放的腾讯云“米大师”平台在支付计费领域有什么优势?
腾讯云“米大师”最近对社会进行开放,其产品定位提到的聚合支付、对账结算、数据分析和立体监控都是什么意思?仅仅理解为腾讯对接其旗下的多款游戏和应用的氪金官方平台吗?长远角度看是否拥有更广的应用市场?
浏览 2127
提问于2018-04-25
2
回答
大数据到哪里去了,它是如何存储的?
、
、
、
我试图掌握大数据,主要是如何管理大数据。 我熟悉数据管理和数据生命周期的传统形式;例如: 收集的结构化数据(如网页表格) 存储在数据库服务器RDBMS中的表中的数据 数据清理后,ETL进入数据仓库 数据使用OLAP多维数据集和其他各种BI工具/技术进行分析。 但是,在大数据的情况下,我对第2点和第3点的等效版本感到困惑,主要是因为我不确定每个大数据“解决方案”是否总是涉及使用NoSQL数据库来处理和存储非结构化数据,以及数据仓库的大数据等效是什么。 据我所见,在某些情况下,NoSQL并不总是被使用,而且可以完全省略--这是真的吗? 对我来说,大数据生命周期就是这样的:
浏览 7
提问于2017-04-20
得票数 7
回答已采纳
1
回答
SQLite的尺寸限制和性能
、
、
我已经研究过一些数据库,比如MySQL,但我从来没有专门处理过数据库。我正在进行一个项目,我们打算使用SQLite (出于一些原因:小型、轻量级、快速等),然后我对它有一些疑问: SQLite支持多少千兆字节的数据?有限度吗?(我将为每个用户提供一些大型数据表(例如,18列X 80.000行)) 读取大量数据快吗?(例如,18列X 80.000行) 关于SQLite,还有其他相关的信息我需要知道吗?(注:我将在Windows和OS上使用它) 附加信息 我正在开发的软件是一个数据分析软件,我只需要使用DB来保存使用一些传感器从用户那里收集到的数据。 我在项目中使用QT5.3.2 (C++)。
浏览 0
提问于2016-12-02
得票数 0
1
回答
什么相当于Amazon Cloud中提供的Google Cloud Datalab(jupyter笔记本服务)托管服务
、
、
什么相当于Amazon Cloud中提供的Google Cloud Datalab(jupyter笔记本服务)托管服务,供数据分析师/数据科学家使用?唯一的选择是在亚马逊网络服务的EC2集群上单独构建Databricks/Jupyter笔记本电脑,亚马逊网络服务中是否有托管服务可用于此目的?
浏览 22
提问于2019-07-29
得票数 0
2
回答
火花的性能瓶颈
、
、
、
在NSDI 2015上发表的“在数据分析框架中提高性能的意义”的论文得出结论,CPU(而不是IO或网络)是Spark的性能瓶颈。凯在Spark上做了一些实验,包括BDbench、TPC和处理工作负载(只使用Spark?)在这篇论文里。我不知道这个结论对于建立在Spark上的一些框架是否正确(比如流,通过网络接收连续数据流,网络IO和磁盘都会承受很大的压力)。
浏览 1
提问于2015-05-15
得票数 1
回答已采纳
1
回答
用于数据分析的查询(类似SQL的联接)远程CSV
、
、
我想在网络文件夹中查询(使用联接的SQL) CSV文件来执行数据分析工作。由于监管原因,我不允许将文件从网络文件夹中移出。显然,我也不能将CSV导入数据库表。 为此,我开始探索Presto,但我不确定它是否能够处理这个场景。普雷斯特专家有什么建议吗?
浏览 5
提问于2021-08-01
得票数 0
2
回答
社交网络分析和图表分析是一回事吗?
、
、
、
社交网络分析和图表分析是一回事吗?如果没有,有什么不同呢?社会网络分析可能是图形分析的一个子集吗? 它们仅仅是图论的现代扩展吗?因为现代类型的数据和数据分析,图论已经变得相关? 像NetworkX和neo4j这样的软件扮演什么角色?
浏览 0
提问于2019-01-29
得票数 2
1
回答
自动化客户端自注册的原始导出数据清理-格式始终不同
、
、
、
、
所以这是一个比较普遍的问题。我是一家初创公司的数据分析师。我的主要流程包括获取客户拥有的现有客户数据,并将其清理/标准化以适应我们的平台,这是我们自注册过程的一部分。我们团队的一名成员从他们正在转换的系统中导出他们的数据,或者,如果他们在内部跟踪数据,我们会收到他们用来跟踪数据的Excel日志。它总是采用不同的格式,并且需要广泛的清理(平均1分钟/条)。我们通常是一个大表(.xlxs格式),在清理之后,将它拆分为四个.csv文件;我们在我们的平台上以四个表的形式加载它们。 我觉得我已经很好地优化了流程,包括流程步骤和excel函数(if、concat、text-to-column等)的清理。我
浏览 0
提问于2017-09-29
得票数 0
7
回答
如何利用大数据技术整治药品网络制假售假?
、
、
、
2月1 号阿斯利康与腾讯达成战略合作,共同为“健康中国”保驾护航,其中腾讯将以大数据为驱动的互联网技术,精准打击药品网络制假售假,那么这是如何实现的呢?
浏览 501
提问于2018-03-30
1
回答
服务器间快速传输大数据
、
、
、
这是一个常见的问题,但在谷歌上搜索会产生很多垃圾。 随着数据量越来越大,加上处理能力和云能力,我们看到对快速数据传输技术的需求越来越大,这些技术能够通过在不同的服务器/客户端之间传播/移动/共享数据来释放所有这些可用数据的能力。 在我们的例子中,我们记录实时二进制数据(每天50吉),我们需要每天将其上传/下载到/从订阅者(是的,所有这些都是每个订阅服务器本地需要的,用于计算和各种数据分析)。 因此,简单地说,今天有哪些选择可以在远程windows服务器(VPS,Cloud)之间快速传输大量数据(VPS,Cloud,具有“相当一致的”带宽-(光纤除外)) 这是一个悬而未决的问题。不管协议是什么,
浏览 3
提问于2012-07-19
得票数 5
回答已采纳
1
回答
ESRI提供了谷歌BigQuery无法提供的功能,以及如何将这两种工具结合使用?
、
、
、
目前,我正在寻找支持大数据地球空间分析的大数据技术。我来到ESRI,发现它主要支持地球空间数据分析和可视化。然而,目前,除了需要许可的ArcGIS GeoAnalytics服务器之外,它们还没有对大数据地理空间分析的广泛支持。同时,我发现Google BigQuery是多么强大,它最近提供了对地理空间处理和分析的支持(为您使用的东西付费,每秒)。 我想知道的是:我应该选择哪个工具进行地理空间大数据处理、分析和可视化?哪个工具(ESRI和BigQuery)更适合用于什么? 我想在非常大的时间地理空间数据集上运行复杂的查询,最后在地图上可视化结果。 请注意,我刚刚开始了对地理空间大数据处理的研究,
浏览 5
提问于2019-10-28
得票数 0
回答已采纳
1
回答
大数据的最佳实践?
、
、
、
、
根据您的经验,我有以下大数据系统: 我们的主要目标是分析数十亿条每日推文,并将其显示在我们的门户网站上,供决策者使用。图形类型包括条形图、柱状图、网络图。到目前为止我们的系统是这样的: Cloudera平台(CDH),仅用于在HDFS中存储数据 Apache用于GNIP的流推文 弹性搜索和php开发图表 我想知道什么是产品的最佳组合,可以产生在线可视化和大数据的离线可视化?
浏览 2
提问于2015-10-08
得票数 0
2
回答
与云中数据分析(数据清理)相关的成本
、
、
、
、
我是数据分析员。我的公司正在将所有的数据科学转移到云提供商(可能是Azure,GCP,AWS)。所有的数据科学编程工具,如木星笔记本,都将安装在云环境中(不会在本地安装Python,也不会在笔记本电脑上安装木星笔记本)。 在我的大部分工作中,我将直接从一个前提数据库中读取/吸收关系数据库表。而且,我的大部分数据分析工作不需要任何GPU实例来进行数据处理。有时,我也做一些简单的研究或实验数据分析编程,例如使用木星笔记本进行数据清理,而不需要使用GPU实例。 我想知道,在我的任务都不使用GPU的情况下,我的公司在他们的数据科学云计算平台上是否有可能进行这样的活动,而不用支付任何每次使用的费用或不必
浏览 2
提问于2021-10-17
得票数 0
回答已采纳
1
回答
亚马逊Aurora RDS的大数据分析
、
、
、
我有一张极光表,里面有五亿张唱片。我需要执行大数据分析,比如查找两个表之间的差异。到目前为止,我一直在使用文件系统上的HIVE来完成这项工作,但是现在我们已经将所有文件行插入到Aurora中。但仍然每月我需要做同样的事情,找到差异。 那么,对此,什么是最好的选择? 将Aurora数据作为文件导出回S3,然后对其运行单元查询(将所有Aurora行导出到S3需要多长时间)? 我可以在Aurora表上运行蜂箱查询吗?(我猜Aurora上的蜂箱不支持) 在Aurora上运行spark (性能如何)? 或者有什么更好的方法。
浏览 1
提问于2018-10-09
得票数 0
8
回答
大数据技术如何在整治传销工作中发挥作用?
、
、
、
、
随着移动互联网、网络购物、跨境电商等网络概念和营销方式的发展,传销组织打着所谓“微商”“多层分销”“消费投资”“爱心互助”“网络招聘”等名义从事传销活动屡见不鲜,成为打击传销工作的重点和难点。 人民日报微博发布2018年传销重点整治城市,而眼下火热的大数据技术能在打击传销中发挥什么样的作用? 网络传销善于藏匿,而相关部门是不是能通过眼下大热的大数据技术从网络上找到他们?如果可行的话,好奇将会是怎么实现的?如果不可行的话能说一下理由吗?
浏览 535
提问于2018-04-10
1
回答
如何在亚马逊网络服务QuickSight中禁用数据聚合?
我有一些简单的数据分析可以在亚马逊网络服务的QuickSight中显示:一些日期字段和金额。默认情况下,QS聚合所有日期字段,最低粒度是按分钟聚合。但我需要的是显示所有数据而不进行任何聚合。我已经搜索过了,但没有发现怎么可能禁用聚合?有什么想法吗?
浏览 27
提问于2020-08-27
得票数 1
3
回答
扩充拓扑(整形)神经网络的神经进化可以在TensorFlow中构建吗?
、
、
、
我正在制作一个用于时间序列数据分析的机器学习程序,使用NEAT可以帮助我完成这项工作。我不久前才开始学习TensorFlow,但似乎TensorFlow中的计算图通常是固定的。TensorFlow中是否有工具可以帮助构建动态进化的神经网络?或者像Pytorch这样的东西会是更好的选择?谢谢。
浏览 10
提问于2018-09-12
得票数 7
1
回答
一个自项目的算法建议
、
、
、
、
所以,我正在做一个关于数据分析的自我小项目。我正在收集安卓应用程序的数据,从游戏商店网站通过网络抓取。我基本上是在收集与某一特定应用程序相关的所有可能的信息,比如它的类型/类型和子类型、评级、大小、下载次数(如果是付费的/无偿的),以及其他可能的有关应用程序的信息,只要可能的话。 我在想,在我完成数据提取和清理工作之后,我可以在我的play存储应用程序数据上应用什么数据分析相关的算法来分析它并找到其中的模式,预测数据之间的链接,并对其进行其他预测和数据分析? 我遇到的几个例子是:- TFID、聚类、决策树、序列分析以及可能的回归。 因此,请回顾上面的那些,并提出任何新的算法,这可能对我的项目有
浏览 0
提问于2018-09-27
得票数 1
1
回答
AWS弹性MapReduce和AWS红移有什么区别?
、
、
我看到AWS弹性MapReduce和AWS都使用集群结构,并且可以用于数据分析。它们的不同用例是什么? 支持与多种应用程序的客户端连接,包括商业智能(BI)、报告、数据和分析工具。 (Amazon )是一个托管集群平台,它简化了在AWS上运行大数据框架(如Apache和Apache )来处理和分析大量数据的过程。
浏览 1
提问于2016-06-04
得票数 15
回答已采纳
2
回答
如何将两台独立的ubuntu机器连接到同一个hadoop集群
、
、
我正在使用Hadoop为一个大学项目做一些数据分析。我的大学好心给了我一台机器,系统正在运行Ubuntu。在我把任何东西放到这个系统上之前,我先在我自己的笔记本电脑上测试一下。我有虚拟机VMware和一个Ubuntu安装在上面。由于我的“主要工作”是在我的虚拟机上完成的,到目前为止,我在单个集群上使用Hadoop (无视我项目中“大数据分析”部分的全部要点)。有没有办法将这台机器连接到我的虚拟机VMware版的Ubuntu上,以至少演示两个节点的集群,或者这是不可能的,因为它们不在同一个网络上? 提前谢谢。
浏览 1
提问于2014-04-14
得票数 1
1
回答
从控制台执行一个木星笔记本
我在木星笔记本中有一些数据分析步骤。 随着数据的变化,我希望能够 重新运行所有单元格(考虑到新的数据) 转换为html以供查看 我知道我可以通过jupyter nbconvert完成#2,但是我如何做到#1而不用手动与笔记本网络界面交互呢?
浏览 2
提问于2016-10-30
得票数 3
回答已采纳
2
回答
最佳数据科学编程语言
、
我正在学习JS,HTML和CSS,但我怀疑JS很擅长数据分析。那么,你们会推荐我学什么来开始我在数据科学的“事业”呢?处理数据的最佳编程语言是什么?我喜欢统计和编程,所以我觉得这会很有趣。
浏览 0
提问于2017-06-21
得票数 2
回答已采纳
1
回答
具有不成比例的单一标签的数据集
、
、
、
、
我正在使用数据分析软件Orange来分析带有标签${H,T,L}$的数据行。$T$是我试图建模的系统的中性状态,所以数据几乎总是被标记为$T$。这将导致97美元的分类准确率极高,这是不正确的。几乎没有带有$H的数据点,L$实际上分别由神经网络标记为$H、L。神经网络所做的事情是合乎逻辑的:将所有事情都压平到$T$,因为这在大多数情况下都会发生。我怎样才能弥补这种情况?
浏览 0
提问于2018-08-27
得票数 1
回答已采纳
1
回答
在Apache pyspark环境上运行python脚本的AWS设置
、
、
、
需要通过运行python脚本,在pyspark框架上运行RDD,在数据集上执行数据分析和创建可视化。寻找一些帮助,如果我们可以在AWS上做到这一点,而不是在本地计算机(VM)上做到这一点。 似乎我们在亚马逊网络服务中有几个可用选项,使用电子病历或EC2,但不确定相关的步骤和定价,即使我们在亚马逊网络服务中提供12个月的免费试用选项。 有谁能帮帮忙。
浏览 3
提问于2017-12-24
得票数 0
1
回答
有可能保护公共api密钥吗?
、
我在一个网络服务器上工作,它使用rollbarApiKey和segmentApiKey发送数据分析和错误日志到相关的主机。 我的理解是,我必须公开API密钥,这是我目前在/deploy-config.js文件中执行的操作。有没有可能不公开它们?使用密钥与滚动条和段进行通信,而不会暴露在公共目录中? 谢谢,
浏览 19
提问于2017-12-10
得票数 0
3
回答
如何使用python pandas在本地系统Jupyter Notebook中读取两个更大的5 5GB文件?如何在本地连接两个数据帧进行数据分析?
、
、
、
、
如何使用python pandas在本地系统Jupyter Notebook中上传两个大(5 5GB)的csv文件。请建议任何配置来处理用于数据分析的大型csv文件? Local System Configuration: OS: Windows 10 RAM: 16 GB Processor: Intel-Core-i7 代码: dpath = 'p_flg_tmp1.csv' pdf = pd.read_csv(dpath, sep="|") Error: MemoryError: Unable to allocate array 或 pd.read_c
浏览 1
提问于2020-01-24
得票数 4
1
回答
我可以在Azure环境之外使用Azure Synapse功能吗?
、
、
论坛, 我目前正在研究Azure Synapse作为迁移我们的on数据架构的一种选择。我对它提供的功能感到兴奋- SQL池、火花池和附带的笔记本。我知道Synapse可以在一个数据平台中发挥作用,我的数据科学家和数据分析者可以利用它的功能随意提供见解。然而,我的团队所做的大部分工作是创建数据产品。 我们目前有一个kubernetes集群,它有几个独立的API,在我们软件的更大的整体中执行数据科学操作。它们可以被认为是微型服务。K8S集群中的微服务(通常是python +一些python包+ FastAPI)通常通过使用ODBC连接器从SQL-server获取所需的数据。 现在我的问题是,Syn
浏览 3
提问于2022-03-31
得票数 1
回答已采纳
1
回答
使用iOS将多个文件上载到服务器
、
、
、
、
我想把很多文件上传到服务器。例如,用户在网络上无法到达时拍摄的图像超过50张,并按下“发送”按钮。然后我应该上传他们时,可以在网络上联系。当无法在网络上访问时,iOS不允许添加具有较大大小post请求的会话任务。所以我尝试了一种链式任务。但需要很长时间才能唤醒下一项任务。
浏览 1
提问于2016-10-20
得票数 1
回答已采纳
5
回答
机器学习概述
、
、
这可能不是要问的问题类型,而只是想知道其他人在大型企业环境中实现机器学习算法时需要考虑哪些因素。 我的目标之一是研究行业机器学习解决方案,可以根据我的公司的具体需要。我是我的团队中唯一有数学背景的人,而且以前读过一些机器学习算法的背景资料,我的任务是解释/比较这个行业的机器学习解决方案。从我在谷歌上收集到的信息来看,似乎: 机器学习和预测分析并不完全一样,所以当一个公司提供预测分析软件和机器学习软件时,有什么本质上的区别呢?(例如IBM预测分析相对于Skytree Server) 很多流行的术语经常被纠缠在一起,特别是关于大数据、Hadoop、机器学习等等。有人能澄清这些术语之间的区别吗?根据
浏览 8
提问于2013-04-18
得票数 2
1
回答
使用神经网络在1000个宝石中找到1个宝石?还有别的吗?
、
、
、
关于神经网络我有点不理解。我尝试将它们用于金融数据分析和音频音调分类。在这两种情况下,我都需要一个能够从众多项目中检测出有意义的项目的分类器。从字面上看,我的音频应用程序每1000次负面点击就会有一次正面点击。我运行了网络训练器,它了解到这是一个非常好的猜测,仅仅是否定的。有没有其他算法来检测稀有宝石?有没有某种形式的神经网络训练特别适合这种类型的问题?我可以将正数据的范围更改为等于负值的总和,但我不明白这如何符合典型神经网络上0到1的首选范围。
浏览 2
提问于2012-02-25
得票数 2
回答已采纳
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据分析
网络大数据分析,关于五一这几个地方肯定会扎堆
大数据分析领域
大数据分析方法
大数据时代:何为大数据概念?大数据分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券