Apache Pig:如何在load函数中连接字符串？

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

字符串级联不适用于猪

、、、

我在hcatalog中有一个表，它有3个字符串列。当我试图连接字符串时，会得到以下错误：c

浏览 3提问于2014-10-10得票数 3

1回答

、

我是Pig的新手，我想使用Pig从路径加载数据。该路径是动态的，并且存储在txt文件中。假设我们在pig脚本中有一个名为pigInputPath.txt的txt文件，我计划执行以下操作：InputPath = Load 'pigInputPath.txt' USINGPigStorage();Data = Load 'someprefix' + InputPath + '

浏览 8提问于2018-08-12得票数 2

1回答

我正在试着从小猪那里连接到Cassandra。但是Cassandra安装在不同的集群中，我需要连接才能从pig远程连接到Cassandra。我指的是下面的链接Failed to parse: Can not retrieve schema from loader org.apache.cassandra.hadoop.pig.CqlStorage@1216d9bf at org.apache.pig

浏览 3提问于2017-05-25得票数 0

1回答

Apache Pig中的Json解析

、、、、

fraction":"3"},"destination":"/user/sree/OUT","source":"/user/sree/foo.txt"}USING PigJsonLoader(); 但是如何在Apache Pig中</e

浏览 1提问于2014-07-24得票数 0

回答已采纳

1回答

如何在猪中使用字符串函数

、

我试图使用它的内置函数之一，将字符串转换为猪的大写。我用的是本地模式的猪。emps.csv2,Jack,30,F,201,3540000.00,09/10/84empdata = load: ERROR 1070: Could not resolve upper using imports: [, java.lang., org.apache.pig.builtin.

浏览 3提问于2014-07-29得票数 0

回答已采纳

1回答

在猪中转储字符串或(字符串、整数)元组

、

但是，我未能转储字符串或( string，int)元组。只是想知道我在这里错过了什么？非常感谢!dataset = LOAD '/Users/me/input' USING PigStorage() AS (id:chararray,data:chararray); dataset_GROUP

浏览 4提问于2015-03-12得票数 3

回答已采纳

3回答

通过带有TimeStamp数据类型的HCatalog问题对猪使用配置单元

、、、、

在我的开发框中，我有MapR 3.0.2、Hive 0.11、HCatLog 0.4.1和Pig 0.12。我使用HCatlog从Pig (Pig Latin)读取和写入Hive表，使用标准查询，我的Hive表包含TIMTESTAMP数据类型(几列)，因此紧跟在GRUNT中的这条语句之后，

浏览 1提问于2014-05-27得票数 3

1回答

pig示例apache [输入路径不存在]

、、、

我正在本地桌面上试用apache pig。Local Mode Mapreduce Mode org

浏览 2提问于2012-08-23得票数 0

1回答

错误2997:遇到IOException。目录part1不存在

、、、、

我在Apache中执行脚本时遇到了问题。我有3个文件，即movies.csv、ratings.csv、tags.csv。首先加载"movies.csv"，然后加载"ratings.csv“并连接两个表。但我在加载文件时遇到了一个错误。);当我发出"cat“命令时，我得到了一个错误，如ERROR 2997: Encountered IOException.(Grunt.java:69) at org.apache.p

浏览 1提问于2017-10-13得票数 0

回答已采纳

2回答

由于hbase客户端jars中硬编码的HTable，无法连接到Bigtable来扫描managed=true数据

、、、、

我正在使用Dataproc上的Pig编写一个自定义load函数来从Bigtable加载数据。我使用从Dataproc获取的jar文件列表编译了我的java代码。当我运行下面的Pig脚本时，当它试图与Bigtable建立连接时，它会失败。Bigtable does not support managed connections.'hbase://events_sessions' USING com.eduboom.pig.

浏览 5提问于2017-03-25得票数 1

回答已采纳

1回答

Cloudera VM中的Pig* Join*

、、、

我尝试在apache pig中执行一个简单的连接。我使用的数据集来自profiles = LOAD '/user/hadoop/tests/userid-profile.tsv' AS (id,gender,age,country, dreg); songs = LOAD '/user/hadoop/tests/userid-timestamp-ar

浏览 1提问于2013-04-20得票数 1

3回答

在不嵌入pig脚本的情况下在java中运行pig

、

我想运行一个pig脚本，我不想将pig脚本嵌入到我的java程序中，我想通过任何传递必要的Pig脚本和参数(可能是参数文件)的pig执行方法来运行它。核心pig库或任何其他库是否提供了执行pig脚本的方法。我已经尝试过java运行时exec方法，我用空格分隔字符串来传递一些参数，所以我放弃了通过运行时exec方法调用pig命令，因为这不是执行pig命令的正确方式。

浏览 1提问于2012-06-22得票数 3

回答已采纳

2回答

如何使用猪从hdfs加载twitter数据？

、、

我只是用水槽流一些twitter数据并将其集群到HDFS中，现在我尝试将其加载到analysis.As的JsonLoader中，默认的JsonLoader函数无法加载这些数据，所以我在google中搜索一些可以加载此类数据的库现在，当我尝试使用以下命令加载数据时 load_tweets = LOAD '/TwitterData/' USING com.twitter.elephantbird.pig.load.J

浏览 2提问于2016-02-22得票数 2

回答已采纳

1回答

在没有主键的情况下使用猪删除重复项

、、

我是hadoop的新手，我有一个用例，其中有3列--名称、值、时间stamp.The数据是分开的，逗号是分开的，并且是csv格式的--我需要检查副本并使用pig.How删除它们--我能做到这一点吗？

浏览 0提问于2015-11-28得票数 0

回答已采纳

1回答

Pig: Python用于搜索文本中的关键字/字符串列表

、、、

我有两个文件，一个带有关键字/字符串列表：theorangefileThe blue fox jumpedthis file has nothing importantthis line does not match 我希望获取第一个文件中的字符串列表，并从第二个文件中找到与第一个文件中的任何字符串匹配的行所以我用Python编写了一个Pig脚本

浏览 0提问于2014-04-01得票数 0

回答已采纳

1回答

在猪中加载嵌套的Parquet文件？

、

我正在使用parquet.pig.ParquetLoader。我做了以下转换：- 如何加载嵌套数据？在Pig中，可选值应该加载为null。

浏览 3提问于2016-03-28得票数 0

回答已采纳

2回答

针对简单组按并计数发生任务抛出错误

、

使用Hadoop的头拉丁语从搜索引擎日志文件中查找唯一搜索字符串的出现次数。()请帮助我解决问题。提前谢谢。猪脚本(encryptcode:chararrayforeach GroupBySearchString Generate group as searchstring,count(searchstring);

浏览 3提问于2013-09-15得票数 1

回答已采纳

1回答

如何连接带有硬编码值的变量？

、

如何连接带有硬编码值的变量？A=加载'data‘as (f1:chararray，f2:chararray，f3:chararray)；预期产出： (apache，open

浏览 3提问于2015-03-04得票数 1

回答已采纳

1回答

阅读Apache中的Snappy压缩蜂窝RCFile

、、

尝试使用http://pig.apache.org/docs/r0.8.1/api/org/apache/pig/piggybank/storage/HiveColumnarLoader.html读取Pig此外，它们被分区到多个目录(如/day=20140701)。rows = <em

浏览 2提问于2014-07-17得票数 0

2回答

Apache分配&计数解析问题

、、

目前，使用Hadoop学习Apache，并使用6200万个巨大的数据集。只是尝试做一个正常的计数函数，并不断地得到错误。、org.apache.pig.builtin.、org.apache.pig.impl.builtin解析计数。错误org.apache.pig.PigServer -解析过程中的异常:解析过程中的错误。无法使用导入、java.lang.、org.apache.pig</

浏览 3提问于2016-08-24得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

字符串级联不适用于猪