使用Pentaho从MongoDB迁移到MongoDB文档_从Pentaho数据集成连接到MongoDB_从Firebase迁移到NodeJS MongoDB - 腾讯云开发者社区

本文介绍了如何使用Pentaho Data Integration (Kettle) 和Pentaho Business Intelligence (Kibana)实现大数据的加载、转换、分析和可视化。首先介绍了如何使用Kettle从多个数据源加载数据，然后介绍了如何使用Kibana进行数据转换、分析和可视化。最后介绍了如何使用Kettle和Kibana进行大数据处理，包括数据转换、数据清洗、数据集成和数据可视化等。

010

Pentaho BI Server 批量上传文件排坑笔记

本文讲的是实际操作中的小问题和小技巧，这里要谈谈Pentaho BI Server对文件夹的操作，在项目使用pentaho cde图表开发完图表后，通常会迁移cde图表文件来完成开发与部署不同环境下的图表迁移，在迁移过程中发现BI Server可以对Pentaho中文件夹进行下载，

您找到你想要的搜索结果了吗？

是的

没有找到

MongoDB中文社区有话说: 卫报迁移和58简历事件专家剖析

开源ETL工具之Kettle介绍

Kettle是一个Java编写的ETL工具，主作者是Matt Casters，2003年就开始了这个项目，最新稳定版为7.1。 2005年12月，Kettle从2.1版本开始进入了开源领域，一直到4.1版本遵守LGPL协议，从4.2版本开始遵守Apache Licence 2.0协议。 Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为：Pentaho Data Integeration，简称“PDI”。自2017年9月20日起，Pentaho已经被合并于日立集团下的新公司： Hitachi Vantara。总之，Kettle可以简化数据仓库的创建，更新和维护，使用Kettle可以构建一套开源的ETL解决方案。

使用扩展的JSON将SQL Server数据迁移到MongoDB

在评估数据库系统的价值的时候，一个重要的目标就是能将数据存储到已有的数据库，也能将从已存在的数据库中的数据取出来。这篇文章就是从SQL Server数据库中获取数据迁移到MongoDB中，反之亦然。

「集成架构」2020年最好的15个ETL工具(第二部)

ETL代表提取、转换和加载。它是从任何数据源中提取数据并将其转换为适当格式以供存储和将来参考的过程。

Kettle构建Hadoop ETL实践（三）：Kettle对Hadoop的支持

本篇演示使用Kettle操作Hadoop上的数据。首先概要介绍Kettle对大数据的支持，然后用示例说明Kettle如何连接Hadoop，如何导入导出Hadoop集群上的数据，如何用Kettle执行Hive的HiveQL语句，还会用一个典型的MapReduce转换，说明Kettle在实际应用中是怎样利用Hadoop分布式计算框架的。本篇最后介绍如何在Kettle中提交Spark作业。

MongoDB运维与开发(10)---chunk

MongoDB中，在使用到分片的时候，常常会用到chunk的概念，chunk是指一个集合数据中的子集，也可以简单理解成一个数据块，每个chunk都是基于片键的范围取值，区间是左闭右开。例如，我们的片键是姓名的第二个字母，包含了A-Z这26中可能，理想情况下，划分为26个chunk，其中每个字母开头的姓名记录即为一个chunk。

【数据迁移工具】使用 kettle数据迁移从oracle到mysql的图文教程

在工作中，我们有时候会遇到这种情况。老系统或其他系统使用的数oracle数据库，现在使用新系统，需要使用mysql数据库。但是之前数据也要迁移过来。那么这种请求下怎么办呢？我们可以使用kettle来进行数据迁移。

物联网平台的采用将成为2018年首要IT发展趋势

【天极网家电频道】智能对象存储、分析和人工智能，以及敏捷方法在企业中的全面扩展，将成为来年的主要趋势北京，2017年12月28日——HitachiVantara近日发布了公司认为2018年将会在亚太区盛行的重要业务和技术发展趋势。这些发展趋势由公司首席技术官Hubert Yoshida和亚太区首席技术官Russell Skingsley共同预测得出。在众多趋势中，物联网(通常称为IoT)平台的采用无疑将会在2018年的企业IT战略中占据主要地位。Yoshida和Skingsley共同确定了2018年亚太

大数据处理必备的十大工具

Hive是一个建立在Hadoop上的开源数据仓库基础设施，通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和处理等。 Hive提供了一种简单的类似SQL的查询语言—HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。

MongoDB和MySQL对比(译)

几十年来，关系型数据库已经成为企业应用程序的基础，自从MySQL在1995年发布以来，它已经成为一种受欢迎并且廉价的选择。然而随着近年来数据量和数据的不断激增，非关系数据库技术如MongoDB应运而生，以满足新应用的需求。 MongoDB用于新的应用程序，以及扩充或替换现有的关系型基础设施（关系型数据库）。

MongoDB和MySQL对比(译)

可伸缩性架构常用技术——之数据切分（Data Sharding/Partition）

我们知道，为了应对不断增长的数据，我们对数据进行切分，存储在不同的数据库里，本文提到的数据库在非特定指明的情况下，均指一个逻辑数据库（是一组数据库，比如Master-Slave），而非单一各个物理数据库。

大数据可视化项目开发总纲

下载地址：www.oracle.com/cn/downloads/index.html

如何在Ubuntu 14.04上备份，还原和迁移MongoDB数据库

MongoDB是最受欢迎的NoSQL数据库引擎之一。它以可扩展，强大，可靠和易于使用而闻名。在本文中，我们将向您展示如何备份，还原和迁移MongoDB数据库。

008.MongoDB分片群集概念及原理

Mongodb另一种集群，就是分片技术，可以满足MongoDB数据量大量增长的需求。

使用kettle迁移oracle 12c数据到mysql (简单例子)

Hitachi Data Systems于2017年改名为Hitachi Vantara 了.

Kettle教程一：Kettle简介和Kettle的部署安装

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于开发或者运维人员来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种ETL工具的使用，必不可少，这里我们要学习的ETL工具就是Kettle！

基于云计算的数据集成工具

选择基于云计算的集成工具时有几个关键考虑因素。重点关注工具提供的连接器集、服务的可扩展性、解决方案的运行速度，以及提供的安全级别。还需要考虑许多关键的管理功能。

从MongoDB迁移到ES后，我们减少了80%的服务器

李猛(ynuosoft)，Elastic-stack产品深度用户，ES认证工程师，2012年接触Elasticsearch，对Elastic-Stack开发、架构、运维等方面有深入体验，实践过多种Elasticsearch项目，最暴力的大数据分析应用，最复杂的业务系统应用；业余为企业提供Elastic-stack咨询培训以及调优实施。

MongoDB分片迁移原理与源码（1）

单个节点的MongoDB实例，具备MongoDB基本的功能和服务能力，不过缺乏数据冗余和高可用，以及横向扩展的能力，一般很少在实际生产环境中使用。

Pentaho图表开发指南

注：1、设置每种图时注意该图表的特性（合理装载指标和维度）2，设置维度时可在查询语句中利用连接查询该维度名（即类型名）

大数据处理必备的十大工具！

大数据的日益增长,给企业管理大量的数据带来了挑战的同时也带来了一些机遇。下面是用于信息化管理的大数据工具列表： 1.ApacheHive 📷 Hive是一个建立在hadoop上的开源数据仓库基础设施，通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和处理等。Hive提供了一种简单的类似SQL的查询语言—HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。 2JaspersoftBI套件 📷 Jaspersoft包是一个通过数据库列生成报表的开源软件。

Pentaho CDE详细开发使用手册

3、添加应用的资源（资源类型有CSS和Javascript，导入内容形式有代码或具体文件）

腾讯云与MongoDB达成战略合作，为全球用户提供最新MongoDB服务

腾讯云数据库又搞大事了！这次，我们和MongoDB联名了，准确说，是腾讯云数据库和全球领先的现代通用型数据库平台MongoDB正式达成了战略合作。 MongoDB是什么？全球最受欢迎的文档数据库……连续4年被Stack Overflow评为“最受开发人员青睐的数据库”……拥有庞大的开发者群体和优秀的技术能力的数据库……在不断演进升级中创造出了一系列产品能力的数据库…… 根据双方协议，腾讯云即日起将为全球用户提供授权的MongoDB服务，双方将在产品和技术层面加强合作，深入游戏、电商、社交媒体等行业数据

【工具】六大工具帮你做好大数据分析

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器、气候信息、公开的信息、如杂志、报纸、文章。大数据产生的其他例子包括购买交易记录、网络日志、病历、事监控、视频和图像档案、及大型电子商务。大数据分析是在研究大量的数据的过程中寻找模式，相关性和其他有用的信息，可以帮助企业更好地适应变化，并做出更明智的决策。 Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是

【性能分析】大数据分析工具

对话爱思唯尔架构师：借助MongoDB驱动云平台

爱思唯尔的出版量占全球医学和科学研究出版总量的17%，该公司用MongoDB数据库取代了之前采用的NoSQL(非关系型)数据库，从而开启了业务分析的新类别，并将成本降低了50%以上。

对话爱思唯尔架构师：借助MongoDB驱动云平台

使用MongoDB进行分片

本文档回答了有关分片的常见问题。或者可以参考手册的分片章节，其提供了分片的概述，包括如下细节：

大数据处理分析的六大工具

下面请看详细介绍： Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计算元

015

本周新鲜事：开源那些事

开源界开源最近也闹腾着一件事，Eureka 2.0 竟然宣布闭源了！并且提示开源工作宣告停止，继续使用风险自负。Eureka 是 Spring Cloud 中官方推荐的注册中心，在国内有大量的使用用户，也不知道 Netflix 脑子是怎么想的，居然开历史倒车！短期内对我们没有太大的影响，后期建议大家将相关业务迁移到 Consul/ZooKeeper/Etcd 等工具上。 Python 3.7 正式版发布，大量新特性和优化来袭，还在坚持在使用 Python 2.X 的朋友们，迷途知返，趋势是不可抗的。后续我

MongoDB实战-分片概念和原理

到目前为止，你都是把MongoDB当做一台服务器在用，每个mongod实例都包含应用程序数据的完整副本。就算使用了复制，每个副本也都是完整克隆了其他副本的数据。对于大多数应用程序而言，在一台服务器上保存完整数据集是完全可以接受的。但随着数据量的增长，以及应用程序对读写吞吐量的要求越来越高，普通服务器渐渐显得捉襟见肘了。尤其是这些服务器可能无法分配足够的内存，或者没有足够的CPU核数来有效处理工作负荷。除此之外，随着数据量的增长，要在一块磁盘或者一组RAID阵列上保存和管理备份如此大规模的数据集也变得不太现实。如果还想继续使用普通硬件或者虚拟硬件来托管数据库，那么这对这类问题的解决方案就是将数据库分布到多台服务器上，这种方法称之为分片。

mongodb 集合_mongodb原理

默认情况下，对比事务安全，MongoDB更关注高的插入速度。如果你需要加载大量低价值的业务数据，那么MongoDB将很适合你的用例。但是必须避免在要求高事务安全的情景下使用MongoDB，比如一个1000万美元的交易。

6个用于大数据分析的最好工具

01-PDI(Kettle)简介与安装

最好的学习资料就是官网，附上官网文档地址： PDI官方文档地址 https://help.hitachivantara.com/Documentation/Pentaho/9.2/Products/Pentaho_Data_Integration

6个用于大数据分析的最好工具

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器，气候信息，公开的信息，如杂志，报纸，文章。大数据产生的其他例子包括购买交易记录，网络日志，病历，军事监控，视频和图像档案，及大型电子商务。在大数据和大数据分析，他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式，相关性和其他有用的信息，可以帮助企业更好地适应变化，并做出更明智的决策。一 Hadoop Hadoo

17 Media数据迁移 | 从自管理MongoDB到MongoDB Atlas，用户体验与工作效率双提升

随着网络技术的提升，视频直播已经成为了互联网的一种常态。因为视频直播最接近人类沟通方式，易于使用、交互能力强、体验最好，所以拥有庞大的用户群。巨大的用户需求加剧了直播平台之间的竞争，为了增强竞争力，吸引更多的用户，各大直播平台想方设法提升自身服务质量，不仅要不断推出新的业务形式，还要大力借助IT技术的力量。

最佳实践丨从 MySQL/MongoDB 迁移数据至 CloudBase 云数据库

本篇文章从 MySQL、MongoDB 迁移到云开发数据库，其他数据库迁移也都大同小异。

Kettle使用小结

‍♂️简介：Kettle 是一款国外开源的 ETL 工具，纯 Java 编写，绿色无需安装，数据抽取高效稳定(数据迁移工具)。Kettle 中有两种脚本文件，transformation 和 job

听唐建法从ORACLE 到 MONGODB 数据迁移数据库还可以这么玩？

这几年一直是MONGODB使用者，从3.2 到4.0 ，在使用中也一直充分的感受到MONGODB 这几年的飞速的发展以及功能的扩展，偶然在极客时间里面看到有MONGODB 的终极玩家唐建法老师的关于MONGODB的课，其中有一段内容以前是不大敢想的, 就是ORACLE TO MONGODB。

ETL工具-Kettle Spoon教程

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，了解并掌握一种etl工具的使用，必不可少，支持图形化的GUI设计界面，然后可以以工作流的形式流转，在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现，使用它减少了非常多的研发工作量，提高了我们的工作效率。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐