腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
猪中频条件
、
month_quad INTO 'hdfs:/month_quad';在
拆分
时,我会得到以下错误 有人对语法错误有什么建议吗
浏览 2
提问于2017-03-01
得票数 2
1
回答
PIG
中
的
拆分
运算符
reviews_per_month<1,b3 if (b0.reviews_per_month>1.5);2019-11-30 01:48:12,232 main error org.apache.
pig
.tools.grunt.Grunt- error 1200:语法错误,位于或靠近'b1‘
的
意外符号
浏览 9
提问于2019-11-30
得票数 0
1
回答
shell传递给命令
的
参数有多少:
、
我想知道shell传递给命令
的
参数有多少: echo "It's "'funny how'" it's done."
浏览 0
提问于2019-10-26
得票数 0
1
回答
增加映射器
的
大小
、
我是
PIG
和HDFS
的
新手。这就是我想要做
的
。我
的
问题是我
的
小猪脚本只产生一个映射器,大约需要15分钟。以按顺序读取文件。这对于我每天必须在配置单元中加载
的
数据量来说是不实际
的
。 这
浏览 1
提问于2012-09-21
得票数 2
回答已采纳
1
回答
我们可以使用
Pig
Udfs
拆分
PDF文件吗?
、
、
我们可以使用
Pig
Udf
拆分
PDF文件吗??
浏览 4
提问于2016-05-03
得票数 0
1
回答
为什么大象鸟猪
的
JsonLoader只处理我
的
文件
的
一部分?
、
、
我在亚马逊
的
Elastic Map-Reduce上使用
Pig
进行批量分析。我
的
输入文件在S3上,包含由每行一个JSON字典表示
的
事件。我使用elephantbird库来解析输入文件。到目前一切尚好。我在交互式
Pig
会话
中
处理存储在本地文件系统或hdfs上
的
大文件时遇到了问题。如果我从S3流输入(在S3输入上没有文件
拆分
),或者如果我直接将文件转换为
Pig
可读
的
格式,我就不会有同样
的
问题。举一个具体<
浏览 3
提问于2011-04-29
得票数 0
1
回答
你可以使用三进制
运算符
和STORE in
pig
吗?
、
、
在apache
pig
中
,如果我想有条件地存储一些数据,我尝试这样做:data2 = ....;--assuming
pig
is smart enough not to run the query<file test.
pig
, line 38, column 6> Syntax error, un
浏览 0
提问于2014-09-16
得票数 0
1
回答
MR jobs
的
Pig
文档
有谁知道Apache
pig
文档
中
列出了所有
运算符
(如group by、streaming等)以及
PIG
采取
的
相应操作,即操作符导致
的
MR作业
的
类型/数量?我特别感兴趣
的
是流方面,它如何映射到MR作业。
浏览 1
提问于2012-09-10
得票数 0
回答已采纳
1
回答
Apache
Pig
:在处理
Pig
中
的
数据类型时面临
的
问题
、
:错误0:执行过程
中
的
异常(名称:{未知}-作用域-1097
运算符
键:范围-1097):org.apache.
pig
.backend.executionengine.ExecException:错误0::错误0:执行过程
中
的
异常(名称: ext_oo_import:针对每个(假,假)包-957
运算符
键: org.apache.
pig
.backend.executionengine.ExecException
pig
_1548942743
浏览 0
提问于2019-01-31
得票数 0
1
回答
使用"for“循环和使用星型
运算符
(*)在Python
中
打印元组
、
、
、
、
我试图以两种不同
的
方式以下列代码打印“结果”元组
的
项:在输出
中
,字符串“引用点”应该将这两种方式
的
结果分开。animals = {"dog", "cat", "
pig
"}column = ['a', 'b', 'c'] result = zi
浏览 5
提问于2020-11-11
得票数 0
回答已采纳
3
回答
猪与卡桑德拉& DataStax分裂控制
、
、
、
、
我一直在用
Pig
和我
的
Cassandra数据来完成各种令人惊奇
的
分组壮举,这几乎是不可能
的
。我正在使用DataStax对Hadoop和Cassandra
的
集成,我不得不说,它非常令人印象深刻。我开始在原木周围打探,我可以看到地图不断地溢出(我看到了177个从地图中溢出
的
东西),我认为这是问题
的
一部分。CassandraInputFormat和JobConfig
的
组合只创建一个映射器,因此这个映射程序必须从表
中
读取100%
的</
浏览 9
提问于2013-10-24
得票数 3
1
回答
有关LoadFunc
的
示例和更多说明
、
、
在哪里可以找到有关LoadFunc
的
更多信息/示例。除了之外,我没有看到任何使用新
的
LoadFunc APis
的
例子。谁能告诉我在哪里可以找到一些编写Load UDF
的
例子?
浏览 2
提问于2012-06-07
得票数 2
回答已采纳
1
回答
猪群函数
中
的
1003错误(找不到别名
的
操作符)
、
、
(int)year;byjobtitile = GROUP year2010 by title; 猪堆栈跟踪?错误1003:找不到别名
的
运算符
。(找到别名
的
运算符
org.apache.
pig
.tools.pigscrip
浏览 2
提问于2016-06-07
得票数 0
2
回答
apache
pig
计数不起作用,转储失败
我有来自class
的
赋值,以查找由特定条件过滤
的
条目的数量。11 563356 1235000140 lisp,方案,主观,完形填空1235040652查找qt和at之间
的
差异小时数 A = FOREACH data1 GENERATE HoursBetween(ToDate(qt),T
浏览 2
提问于2016-04-06
得票数 0
1
回答
Pig
: Slow Group By operator
、
在对Hive和
Pig
进行基准测试后,我发现
Pig
中
的
Group By
运算符
比Hive慢得多。我想知道是否有人经历过同样
的
情况?人们是否有任何技巧来提高这个操作
的
性能?(在这里添加一个之前
的
帖子建议
的
DISTINCT并没有帮助。我目前正在重新运行基准测试,并启用了LZO压缩)。
浏览 1
提问于2013-08-18
得票数 1
2
回答
在
PIG
中加载
的
多个文件
的
多个输出
、
我
的
数据目录中有50个文本文件(路径:/home/admin/Desktop/ data )。我
的
任务是扁平化(标记化)文本文件
中
的
数据,并将输出存储在50个输出文件
中
。下面是我为完成这项工作而建立
的
关系: STORE B into '/home/ame
浏览 0
提问于2015-08-09
得票数 2
4
回答
使用apache
Pig
将文件
拆分
为4个相等
的
部分
、
我想用Apache
pig
把一个文件分成4个相等
的
部分。例如,如果一个文件有100行,前25行应该转到第一个输出文件,依此类推。最后25行应该转到第四个输出文件。有人能帮我做到这一点吗。我使用Apache
Pig
,因为文件
中
的
记录数将以百万为单位,并且之前
的
步骤需要使用
pig
生成需要
拆分
的
文件。
浏览 1
提问于2015-09-24
得票数 2
2
回答
猪究竟什么时候使用Hadoop MapReduce环境?
、
、
我对Hadoop Mapreduce和
Pig
环境有疑问。在
中
,我发现
Pig
系统对
Pig
的
拉丁代码很感兴趣。首先,我认为
Pig
使用map和reduce方法创建.jar文件,然后将该文件“发送”到Hadoop Mapreduce环境以运行mapreduce作业(这是
Pig
开发人员未来
的
工作)。那么,
Pig
系统到底什么时候使用Hadoop Mapreduce呢?它是在解释
Pig
拉丁语代码
的
过程中出现<em
浏览 0
提问于2012-08-30
得票数 2
回答已采纳
2
回答
使用大而动态
的
分组/路径存储数据
、
我目前有以下
pig
脚本(为简洁起见,列列表被截断):STORE site3 INTO 'pigsplit1/3/' USING org.a
浏览 2
提问于2013-03-08
得票数 0
3
回答
将句子转换为
Pig
拉丁语
、
我是Python
的
新手,我正在尝试做
的
一个练习项目是将句子转换成猪拉丁语。最初
的
项目只是将单词转换为小猪拉丁语,但我想将其扩展为转换句子。以下是我到目前为止拥有的代码:print("
Pig
Latin Maker") word = input("Write a Word: ")
pig</em
浏览 1
提问于2020-06-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券