我正在使用Talend Open Studio for MDM,我希望使用MySQL作为MDM数据库,但似乎Talend Open Studio for MDM只支持2个数据库- H2 embedded和eXist XML数据库。
有没有办法在MDM中处理后加载源数据,并将其直接加载到MySQL数据库中?
我想使用Talend创建一个将多个xls文件导入到MySQL数据库的作业。我不知道这些文件的模式(列数和名称),但我可以假设标题行对应于列名。我的想法是为每个包含xls文件和配置文件的xls模式创建一个文件夹(描述模式和到mySQL表的映射)。所有xls文件必须映射到已存在的单个表。我想知道这在Talend open Studio中是否可行?任何其他解决方案都非常受欢迎。
我正在使用Talend Open Studio for MDM,我有一个对客户记录进行版本控制的要求。
在使用Oracle数据库时,我可以使用tOracleSCD来捕获更改。同样,对于MySQL,我可以使用tMysqlSCD。
但是在Talend Open Studio for MDM中,唯一支持的数据库是H2,所以我将所有主记录存储在一个H2数据库中。
在这种情况下,在Talend中没有可用于H2数据库的组件的情况下,如何实现版本控制?
我需要将一个实时SQL server 2008迁移到MySQL server 5,我已经尝试过MySQL迁移工具包,但是它抛出了很多迁移错误。在Stackoverflow这里有人建议我使用Talend。我安装了Talend Open Studio for Data Integration,但它是一个非常通用的工具,没有像我真正需要的那样快速入门来进行数据库迁移。
我在哪里可以找到使用Talend进行此类工作的快速入门指南?
我正在使用Talend open studio for Data Integration工具将sql server表数据传输到mysql server数据库。
我在表中有4000万条记录。我创建并运行了作业,但在插入大约2000万之后,连接失败。
当我再次尝试插入数据时,talend作业首先从表中截断数据,然后从头开始插入数据。
我正在使用Talend open studio for Big data (版本6.4.0),并使用tRESTClient从HP ALM中提取数据并插入到mongoDB中。现在我的ALM关闭了&我想从任何文件中提取数据,如excel,CSV等,而不是ALM。
是否可以使用talend tRESTClient从excel或CSV中提取数据?如果是,我如何使用tRESTClient执行与HP ALM api调用相同操作?
我正在使用Talend Open Studio for Big Data版本TOS_DQ-20141207_1530-V5.6.1.zip学习数据质量。
根据我的问题,我想使用tMatchGroup,但我意识到它没有出现在Talend Studio的调色板中。在help.talend.com中,他们说我必须订阅一个"Talend Platform产品“。()
谁能告诉我怎样才能找到这个平台?我做了一些研究,但我不知道它在哪里。
非常感谢。p/s:很抱歉我的英语不好。
我需要使用一个嵌入式DB (H2,Apache Derby)和talend open studio。我看到使用talend MDM是可能的,但是找不到任何关于如何将其嵌入到talend open studio中的教程。 我有大量的数据,这些数据来自第一次处理的不同表,在第二步转换之前存储在本地。但不能使用缓存或文件(csv)作为中间存储。 有什么想法吗?请帮帮忙
我是mysql和一般数据库的新手。我遇到了一个问题,我似乎也找不到解决方案。我甚至不确定该如何描述这个场景。
基本上,我有一个连接的字段,我需要“分解”,并使该字段的每个值都有自己的行。我从每日提要中提取这些数据,因此这需要在Talend中作为触发器、存储过程或计划作业自动执行。以下是这种情况的简化版本。请看“当前文件格式”和“预期结果”的图片。对不起-这是我在这里的第一篇文章!任何帮助都将不胜感激!
我使用的是mysql数据库。目前文件是通过csv导出的,但我将通过Talend Open Studio连接以同步数据。有关和示例,请参阅下面的链接。
我安装了Talend Open studio for Big Data 6.0,在创建下面的项目时弹出错误。我已经安装了Java,版本是1.7.0_65.Please,如果有任何事情需要修复,请让我知道。
java.lang.NullPointerException
at org.talend.designer.codegen.JavaRoutineSynchronizer.doSyncRoutine(JavaRoutineSynchronizer.java:145)
at org.talend.designer.codegen.AbstractRoutineSynchroni
我正在使用Talend Open Studio fro Integration版本7.1.1。我需要连接Azure数据库的数据提取和数据上传从Talend到我们的SQL数据库。我已经通过下面的链接连接到Azure cosmos dbs。
但在我的Talend DB连接中,我可以找到任何CosmosDBconnection类型或组件。甚至我试着在包中搜索,但没有找到。谁能告诉我如何安装或启用CosmosDBConnection或如何使用Talend连接到Cosmos数据库。
我对Talend提供的不同产品感到困惑。
Talend Open Studio for Data Integration和Talend Open Studio for Big Data似乎是同一种产品,但默认情况下只是安装了不同的组件。是那么回事吗?如果我使用Talend进行数据集成,并从Talend下载我需要的组件(例如,用于谷歌BigQuery),那么它实际上是同一个产品吗?
我们正在使用Talend Open Studio for Big Data将MySQL数据迁移到Neo4j。我有几个作业要运行,但是我在rels.csv文件上使用tNeo4jOutputRelationship组件时遇到了问题,这个组件包含了nodes.csv文件中不存在的值之间的关系。
抛出的显式错误:
Exception in component tNeo4jOutputRelationship_1
java.lang.RuntimeException: Start node looked up by index with my_index as key and my_value
我正在使用Talend Open Studio for ESB ver.6.3.1,并创建了用于将数据从ALM拉到MongoDB.In的作业,我使用带有查询参数(Date)的tRESTClient从ALM中拉出数据,并使用tMongoDBOutput插入ALM数据。之后,我构建了作业&作为一个java项目导入到eclipse中。我试着用“作为Java应用程序运行”的选项来运行程序,它工作得很好。
在上面的作业中,我直接给出了查询参数值,比如'tRESTClient --> Basic settings --> Query parameters --> name
我正试图在talend studio中创建一个新的数据库连接,它显示了这个错误:
Connection failure. You must change your database settings.
我已经配置了MySQl安装程序,我也搜索了这个错误,看到了一些答案,但他们都不清楚,我如何解决这个问题。
我正在尝试实现ESB,以便连接两个不同的应用程序。我需要同步他们的数据库,这意味着一旦第一个数据库发生变化,它应该会同时自动反映到第二个数据库上。
第一个应用程序(Java /Hibernate)有一个Oracle数据库,第二个应用程序(PHP/Symfony2)有一个MySQL DB。我正在使用Talend Open Studio for ESB V5.2。
我真的需要一些帮助,尤其是我是ESB的新手。
我正在尝试使用Talend Open Studio将联系人从各种输入源同步到Exchange2007服务器。
我知道Talend可以谈论SOAP,而EWS有一个WSDL,但是在尝试将两者结合在一起时遇到了各种各样的问题(因为Exchange缺少Talend需要的元素),我不知道这是不是最好的攻击计划,或者我是否应该考虑使用MS.的为Talend构建一个更特定于Exchange的插件。
或者,如果这两种情况都是不可能的,我希望能给出一个解释--毕竟所有的流行语似乎都在两边排成一排。
我正在尝试使用Talend中的DataStax Java驱动程序来生成TimeUUIDs;但是,我一直得到一个未找到异常的类。我很确定原因是因为在执行时,JAR文件正在扩展到web上的一些外部存储库以获得依赖库,而我的工作的网络防火墙正在阻止Talend获取这些依赖项。是否有特定的JAR可以手动下载和安装到Talend,这样我的工作就不需要在执行时接触到web库了?
我正在使用:
用于大数据版本6.4.1的Talend Open Studio
Oracle Java JDK 8更新161 (标准版)
Windows 10企业64位版本1709
dse-java-driver-c
我是新手,我正在尝试设计一个数据流,将数据从postgres传输到neo4j数据库。我使用的是"Talend Open Studio for Big Data“开源工具版本6.2.1。我需要实现一个有序的作业流,其中Job1和Job2独立执行,当且仅当Job1和Job2都成功完成时,作业3才会启动!
我使用了tRunJob组件来实现订单,但是在执行流之后,我注意到Job3不会等待前两个作业的完成,而是开始执行。我在这里做错了什么?这是在Talend中设计有序和依赖作业的正确方法吗?
每个tRunJobs都有自己的子流,例如User_Import是:
当我试图将作业部署到talend企业服务器时,我遇到了问题。当我在talend管理中心运行作业时,我会得到以下错误:
java.lang.NoClassDefFoundError: javax/xml/rpc/encoding/SerializerFactory
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:800)
at java.security.SecureClassLoader.defineClass(SecureCla