腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
数据仓库能包括一个数据湖吗?
、
、
我想更详细地了解数据仓库和数据湖。 在我看来,这个话题有不同的信息。Inmon将数据仓库定义为 一种面向主题、综合、时变和非易失性的数据收集,以支持管理层的决策过程。 现在我明白了,这只是一种架构形式,并不意味着任何技术。这意味着底层数据可以是任何也可以是S3对象存储的结构。此外,还提出了一个具有数据集成过程的数据仓库。 当谈到数据湖时,我发现了以下定义 可伸缩的存储存储库,保存大量原生格式的原始数据(“原样”),直到需要时再加上可以在不损害数据结构的情况下接收数据的处理系统(引擎)。 取自。 现在,数据仓库能成为一个更严格的数据湖吗?有一种观点认为,数据仓库必须使用ETL,但
浏览 0
提问于2018-12-11
得票数 1
4
回答
数据比较多,有什么好点的存储方案吗?
、
贵州地区,给公司做类似企业网盘的东西,存储数据大概在6~7T左右,有没有好点的存储方案呢?我看腾讯云这边有COS、CFS等,我是从网站直接读取数据,推荐那个?有没有什么试用渠道呢?
浏览 969
提问于2017-09-15
1
回答
未知类-功能子集
、
、
如果你有一个问题,除了涉及的对象和特征之外,你什么都不知道,但不知道这些是如何组合在一起的,即你想看看是否有基于数据的自然群体。将这个新物体的10个特征(比如20世纪80年代的吉他)分成两个功能集,每组5个特征-一组与人类的东西(如颜色,价格等)有关,另一组与物理特征(重量,木材类型)等有关,这有什么价值吗?我希望找到的一个群体的例子是电学和声学之间的区别,但我们不知道。结果可能是,数据告诉我们,由于价格、重量等原因,美国吉他和欧洲吉他之间存在差异。 因此,我们的想法是针对第一组5个特征训练我的模型,然后针对第二组特征,并以某种方式使用这两个结果来形成预测? 这个过程有没有一个特别的名字,或者
浏览 0
提问于2017-10-02
得票数 0
2
回答
如何实现数据网格概念数据工程产品或应用
、
、
我正在尝试在一个与业务相关的应用程序中实现数据网格概念。让我先描述一下: 已经使用数据HDFS、hive和cassandra_database来管理数据。 1:据我所知,在数据网格概念中,多个数据库、内部数据、数据湖和数据仓库连接在一个点上,分布这些数据。在这里,每个数据仓库、数据湖或数据库都是一个数据网格节点。对于数据网格,这个整体概念是否正确? 2:如何在我的项目中实现,我正在尝试使用graphDb数据库,因为它支持作为主节点和工作节点(存储库)的另一个数据库的集群连接。 3:可以使用graphDb以外的其他平台进行检查吗?像neo4j一样,这是可能的吗? 任何人都可以在我的项目或任何参
浏览 16
提问于2020-04-28
得票数 2
8
回答
腾讯云服务器可以采取哪些算法来加密数据?
、
、
数据加密服务提供弹性,高可用,高性能的数据加解密、密钥管理等云上数据安全服务,那么腾讯云服务器可以采取哪些算法来加密数据保障业务数据隐私安全?
浏览 5322
提问于2018-06-12
1
回答
想问一下服务器的构建问题?
、
、
需要做个项目,通过医院的各个PC终端,把各种医疗影像上传至云端,而后在手机端查看,准备是微信公众号,大概需要哪些服务器? 我的想定是要一个对象存储服务器,一个数据库服务器,如果PC段使用网页上传,则还需要一个web服务器,是否还有什么建议? 具体价格大概多少,估计每年的存储量大概有20TB左右的增量。另外web网页服务器是不是就是租用云服务器,然后安装相应的软件, 还是有腾讯云直接可以提供?另外上传查找文件的软件后台是否还需要一台服务器
浏览 386
提问于2017-10-28
1
回答
我应该使用elasticsearch进行非免费文本搜索吗?
、
我使用Postgres作为数据仓库。我需要在许多字段上进行免费文本搜索。我的DBA建议不要使用Postgres进行免费文本搜索。我现在正在考虑elasticsearch。问题是,如果用户同时通过自由文本和结构化维度进行过滤,该怎么办?我应该同时查询弹性和postgres,并选择交叉口,还是可以从弹性中提供所有查询?如果过滤器中没有免费的文本,那么弹性是否适合我的一般用途查询呢? 编辑:应要求提供更多信息。数据库将包含几百万行。我不能给出关于数据的具体细节,除非一行将包含大约30列,其中一半是字符串,介于一个单词和几个句子之间。使用弹性的原因不仅仅是DBA反对postgres中的全文索引,而且弹
浏览 4
提问于2013-11-18
得票数 1
回答已采纳
4
回答
TBDS是否支持实时数据接入、国产数据库接入?
、
、
、
、
腾讯云文档中没有关于TBDS数据接入组件的说明,TBDS都支持哪些数据来源?是否支持工业物联网设备实时数据采集?是否支持如达梦、翰高等国产数据库?另外机器学习平台DI-X也没有相关文档支持。 [附加信息]
浏览 679
提问于2018-04-08
2
回答
星火MLLib中支持向量机内核选择和丢失函数的配置
、
、
、
、
我已经安装了星星之火在AWS弹性地图减少(EMR),并一直运行支持向量机使用软件包在MLLib。但是没有任何选项可以选择建立模型的参数,比如内核选择和错误分类的代价(如R的e1071包)。有人能告诉我如何在建立模型时设置这些参数吗?
浏览 2
提问于2015-01-30
得票数 1
回答已采纳
2
回答
传统数据湖与AWS湖形成
、
、
我一直在为客户建立数据湖,在那里我们将数据从onprem或任何其他来源加载到S3 (一个数据湖)中。我们将在这些原始数据上创建一个AWS Glue目录来创建模式。 下一步是使用EMR或AWS Glue进行数据清理,将转换后的数据加载到RDS / REDSHIFT / S3中作为最终目标。 根据使用的用例/服务,可以使用数据管道、Glue Jobs或AWS Lambda事件触发器来调度作业。 分析人员、其他用户将使用IAM服务提供所需的数据/ S3桶访问,用于Quicksight可视化或使用雅典娜、data等进行数据查询,或在Sagemaker中为ML应用程序使用数据。 我的问题是,AWS湖的形
浏览 0
提问于2019-08-20
得票数 3
9
回答
腾讯云时序数据库 CTSDB VS 传统时序数据库?
、
很多公司已经开始持续收集、分析数据,用于异常处理、趋势预测、精准营销、风险控制等场景,希望利用数据的潜在价值,提高公司盈利能力和竞争力。那么腾讯云时序数据库 CTSDB VS 传统时序数据库,腾讯云时序数据库有没有什么进步?
浏览 1730
提问于2018-09-26
1
回答
比较两个pandas数据帧之间的geohashes
、
、
我有两个数据帧df1和df2,它们具有不同的经度和纬度,以及它们对应的地理散列。现在,对于df1中的每个geohash,我希望在dataframe df2中找到最接近的geohash。我不确定是否有一种方法可以比较geohashes。例如,对于df1中的id121,df2中最接近的geohash将是9mu3rr,而对于df2中的id122,最接近的geohash将是9wv97m1。 数据帧df1 Id Latitude Longitude Geohash 121 32.815130 -117.151695 9mudwju 122 37.920948 -108.00504
浏览 0
提问于2016-08-19
得票数 1
2
回答
匹配,根据每个标准的相关性进行排序
、
、
我有一个不断增长的数据库,其中包括: 需求表(多标准)报价表(多标准) 条件可以是字符串(例如:国家名称)、布尔值、数字、. 我想找到所有的需求 如果表不包含许多行,我将按以下方式计算: 对于每个需求,通过平均每个标准的相关性来计算每个需求的匹配相关性。 但是对于一个重要的数据库来说,这需要花费太多的时间,不是吗? 你推荐什么解决方案?
浏览 4
提问于2010-06-24
得票数 0
2
回答
数据湖中时间戳csv外部表中的临时缓慢变化尺寸物化
、
、
、
、
问题 主要问题 如何在短期内从每日提取的文件夹中实现缓慢更改的维度类型2,其中每个csv都是从源系统中提取的表的一个完整提取部分? 理据 我们正在设计临时数据仓库,作为最终用户的数据集市,这些数据仓库可以在没有后果的情况下被分解和烧毁。这要求我们在一个湖泊/blob/桶中拥有所有数据。 我们每天都要摘录,因为: 我们无法可靠地提取更改集(原因超出了我们的控制范围), 我们想用“最少”的可能数据来维护一个数据湖。 质疑问题 有没有一种解决方案可以给我一个特定日期的状态,而不仅仅是“最新”状态? 存在主义问题 我是不是完全倒着想这件事,还有更简单的方法来做到这一点
浏览 4
提问于2020-09-17
得票数 0
回答已采纳
2
回答
使用Azure数据湖时是否需要数据仓库?
、
、
、
我正在探索Azure数据湖,我是这个领域的新手。我探索了很多东西,读了很多文章。基本上,我必须从不同来源的数据开发Power仪表板。 在典型的Server栈中,我可以编写一个ETL (提取、转换、加载)进程,将我的系统数据库中的数据导入数据仓库数据库。然后利用SSAS等技术,利用Power实现数据仓库。 但是我想使用Azure数据湖,我探索了Azure和Azure ( use )。我绘制了如下的架构图。 在当前的申请流程中,我遗漏了什么东西吗? 我可以使用Power直接从Azure数据湖获取数据,因此不需要数据仓库。我说的对吗? 我可以在Azure数据湖创建一个数据库,那
浏览 1
提问于2018-03-15
得票数 3
回答已采纳
12
回答
什么是数据仓库?
、
、
一位客户问我“数据仓库”这个术语的真正含义是什么。 我想过ETL,数据模型的细节,与NoSQL,云,‘普通’数据库管理系统,主数据管理等的区别,但无法用几句话向他描述这个术语……(事实上,我做了一些谈话,没有照亮他。) 如何用1-3个(或更多)句子来描述“数据仓库”?
浏览 0
提问于2010-06-23
得票数 26
回答已采纳
3
回答
数据湖中的桌子有什么意义?
、
我认为使用数据湖( Data )与数据仓库()的全部目的是将ETL (提取、转换、加载)过程转换为让(加载、提取、转换)。难道提取这些数据,将其转换并加载到一个表中,就能让我们回到我们开始的地方吗?
浏览 7
提问于2017-10-16
得票数 5
回答已采纳
7
回答
数据可视化在生活的哪里可以应用?
现在都在提大数据的可视化,不知道到底具体运用是在哪里?腾讯云能不能进行数据可视化?
浏览 1985
提问于2018-07-24
1
回答
为什么我们不能直接使用数据仓库而不是数据库呢?
、
、
、
我正在学习Hadoop,偶然发现了蜂箱。我还了解到,HIVE是一个用于分析查询的数据仓库。 如果数据仓库是多个数据源的聚合,为什么公司要使用多个数据源并进行聚合?为什么他们不能直接写到数据仓库,因为这将减少聚合和处理的开销? 这是因为如果所有用户都从同一个数据仓库读取时会产生的开销吗? 我想知道,如果我们有高度可伸缩的数据仓库,为什么我们需要数据库呢? (只有在大公司的背景下才能产生大量的数据。因为我能理解大多数公司甚至可以用两个数据库来管理。)
浏览 12
提问于2022-01-30
得票数 0
回答已采纳
8
回答
腾讯智能云为开发者带来哪些便利?
、
、
、
、
腾讯云在云+未来峰会上推出了智能云。使得普通开发者能够快速上手进行开发。能够有效节省自身开发成本,我想知道究竟带来了哪些便利?有哪些服务极大提升了开发效率和用户体验?
浏览 885
提问于2018-05-24
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简易指南带你启动 R 语言学习之旅
Excel–如何拆分单元格中无规律混合的数字和英文字母?
Excel实用tips–如何拆分单元格中无规律混合的数字和英文字母?
Python Excel处理库openpyxl详解
快速掌握R语言中类SQL数据库操作技巧
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券