开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >Hive:在struct字段上可以使用regexp_extract吗？(NullPointerException)

问Hive:在struct字段上可以使用regexp_extract吗？(NullPointerException)
EN

Stack Overflow用户

提问于 2017-08-09 09:00:19

回答 1查看 537关注 0票数 1

我将一个装满twitter信息(json格式)的dynamodb加载到蜂箱中。json文件的格式如下所示：

{"id":{"s":"894643473017561088"},"sentiment":{"s":"neutral"},"subjectivity":{"s":"0.0"},"username":{"s":"Jessi"},"geo":{"s":"None"},"location":{"s":"Valley of the sun☀️"},"polarity":{"s":"0.0"},"tweet":{"s":"b\"RT @bannerite: Donald Trump's lies have consequences. We're seeing them now | Charlotte Observer #DemForce""},"created_at":{"s":"Mon Aug 07 19:36:40 +0000 2017"},"screen_name":{"s":"JessiAtkins06"},"followers_count":{"s":"19"}}

我创建的蜂箱表如下所示：

create external table table1 (
    > id struct<s:string>,
    > sentiment struct<s:string>,
    > subjectivity struct<s:string>,
    > username struct<s:string>,
    > geo struct<s:string>,
    > location struct<s:string>,
    > polarity struct<s:string>,
    > tweet struct<s:string>,
    > created_at struct<s:string>,
    > screen_name struct<s:string>,
    > followers_count struct<s:string>)
    > ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
    > STORED AS TEXTFILE;

然后使用通常的"load data inpath.“从json文件加载数据。公式。

我需要从"tweet“字段中提取hashtag，但是当我尝试执行一个正则表达式来搜索hashtag时，我会得到一个错误：

hive> select regexp_extract(lower(tweet), '/\B#\w*[a-zA-Z]+\w*/',0) as patterns
    > from table1
    > limit 10;
FAILED: NullPointerException null

我想知道这是否是因为字段的结构格式。我本可以将发电机文件导出为csv，但是tweet中有许多逗号。无论int字段设置为0、1还是2，都会发生相同的错误。

我试图确定字段中的值是null，而且我真的不确定--我在一个由字符串类型字段组成的表上尝试了一个类似的命令，它成功了。我看过“什么是NullPointerException，以及如何修复它？”线，但仍然不知道，任何援助都将不胜感激。

amazon-dynamodb

云直播特惠9.9元起

基于腾讯云多年音视频能力积淀，支持超低延迟、超高画质、超大并发访问量的直播需求，满足客户的多样化直播需求

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-08-09 10:23:30

我回溯了你的脚步，也收到了NullPointerException。

接下来，我运行了一个简单的查询，得到了以下内容：

select tweet from table1;
OK
Failed with exception java.io.IOException:org.apache.hadoop.hive.serde2.SerDeException: org.codehaus.jackson.JsonParseException: Unexpected character ('"' (code 34)): was expecting comma to separate OBJECT entries

在示例输入数据中，您似乎有一个额外的" (在#DemForce之后)，它破坏了json反序列化。

您可以在tweet中的每个\之前添加"，这样"就会被视为文本。

如果您导出为csv，则必须事先从内容中删除所有逗号。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45596643

复制

相关文章

select2的使用

cdn class list repeat select

你必须在其它地方能获取到这个select标签，所以要为其设置id、class或者是name以便能得到这个标签。multiple属性是是否可以多选。option是下拉框中多选的内容。例如在angluar中，使用ng-repeat循环出来值xxx，然后放在option中供select使用。

晓果冻

2022/06/17

1.5K0

ui-select官方教程（二）——ui-select指令

数据结构 bootstrap cdn 编程算法

ui-select指令 ui-select的指令和事件属性选项描述值默认值 multiple 多选，直接加上multiple属性 close-on-select 在多选情况下，选中一项，就关闭下拉项 boolean true append-to-body 在多选情况下，选中项追加显示 boolean false ng-disabled 控件被禁用 boolean true ng-model 控件绑定对象 String,number,array undefined search-enabled

逝兮诚

2019/10/30

2.7K0

select2的搜索框不能输入搜索内容

function google prototype 搜索

按照select2官网配置完后，搜索框弹出后无法输入内容，究竟怎么回事，于是在其他页面尝试了select2，发现可以啊，为什么在这个地方不可以，终于找到了造成这个问题的不同之处：select2在模态对话框中会失效。找到了问题所在，但不知道如何解决：百度或者google，最终找到了解决方案：

johnhuster的分享

2022/03/29

1.4K0

在 Discourse 中如何使用输入对话框

如下图显示的内容，可以在输入框中输入文本，然后在主题中可以根据你输入的文本重新生成字符串：

HoneyMoose

2021/09/08

2.2K0

在 Discourse 中如何使用输入对话框

在Ubuntu 20.04中禁用motd欢迎消息

ubuntu root 登录脚本框架

本篇文章重点讲解一下在Ubuntu 20.04中禁用motd欢迎消息具体方法，有需要的小伙伴可以参考一下。

会长君

2023/04/25

2.6K0

禁止在input中输入中文

提示：设置ime-mode为disabled的意思是禁止在输入时禁止用户激活输入中文，韩文，日文等的输入法（IME）状态，因为这个只能检测到键盘的输入，对通过鼠标操作的粘贴和拖放无效。

崔笑颜

2020/06/08

4K0

win禁用shift切换输入法

在很多场景下，我们都会使用到shift来完成一些功能，最常见的就是输出键盘上面一排标点符号，但是往往在使用shift时会出现切换输入法的情况，在一些仅英文或者中文输入的场合切换会对工作效率造成影响，这里介绍禁用shift切换输入法的方法，仅仅采用ctrl+空格的方式完成切换输入法。

timerring

2022/09/21

6K0

win禁用shift切换输入法

select2无法输入搜索和宽度问题解决

这时候select2的搜索框无法输入,一般有两方面的原因 1.检查下modal的div中是否有tabindex=”-1”，这个属性

botkenni

2019/09/02

1.7K0

select2无法输入搜索和宽度问题解决

yii2使用select2

Text-to-speech function is limited to 200 characters

botkenni

2019/09/02

8990

select2 使用教程（简）「建议收藏」

编程算法 github json https git

用了这么久的Select2插件，也该写篇文章总结总结。当初感觉Select2不是特别好用，但又找不到比它更好的下拉框插件。

全栈程序员站长

2022/09/12

25.1K0

select2 使用教程（简）「建议收藏」

在python中实现密文输入

腾讯云同步

本文由腾讯云+社区自动同步，原文地址 http://blogtest.stackoverflow.club/input-password-in-python/

羽翰尘

2019/11/21

1.8K0

【DB笔试面试727】在Oracle中，如何禁用HAIP？

说明，ora.cluster_interconnect.haip的ENABLED属性的原始值为1：

AiDBA宝典

2020/01/20

1.8K0

如何使用 Selenium 在 HTML 文本输入中模拟按 Enter 键？

selenium python 自动化

Selenium是 Python 中可用的内置模块，允许用户制作自动化套件和测试。我们可以使用 selenium 构建代码或脚本以在 Web 浏览器中自动执行任务。Selenium 用于通过自动化测试软件。此外，程序员可以使用 selenium 为软件或应用程序创建自动化测试用例。

海拥

2021/12/20

8.4K0

在 Vue 中创建自定义输入

vue.js 编程算法

基于组件的库或框架（如 Vue ）可以创建可重用组件，它能在各自应用程序中相互传递数据，这些框架能确保这些数据是一致的，并且（希望）简化了它们的使用方式。

疯狂的技术宅

2019/03/28

6.5K0

Python 教程之输入输出（1）—— 在 Python 中接受输入

python 编程算法

开发人员经常需要与用户交互，以获取数据或提供某种结果。今天的大多数程序都使用对话框来要求用户提供某种类型的输入。而 Python 为我们提供了两个内置函数来读取键盘输入。

海拥

2022/09/16

1.7K0

Python 教程之输入输出（1）—— 在 Python 中接受输入

在评论输入框中插入表情

range selection textarea window

最近在做一个后台管理系统，要求可以对前台用户的作品进行评论，而评论要可以输入表情，常规的文字输入框都是用的文本域textarea来做的，但这种输入框只能输入文字，没有办法输入表情图标，这个时候可编辑div就能起到作用了，那么如何在可编辑的div中插入表情呢？

越陌度阡

2020/11/26

4.1K0

初次使用AngularJS中的ng-view,路由控制

AngularJS中的route可以控制页面元素的改变，使多页面变成一个单页面第一步：引入必要的js： <script src="js/lib/angular.js"></script> <script src="js/lib/angular-animate.min.js"></script> <script src="js/lib/angular-route.min.js"></script> <script src="app.js"></script> 第二步：准备好一个单页： <body ng-a

Ryan-Miao

2018/03/13

1.6K0

在文件中输入字符串HelloWord

Our life today is three years ago, our life three years later is today's choice.

小Bob来啦

2020/12/15

2.5K0

在文件中输入字符串HelloWord

点击加载更多

相似问题

使用Select2禁用用于自动完成的输入

12

在更新来自ng重复的ng禁用输入时停止ng模型

20

ng-禁用所有输入元素

10

Select2 -禁用用户输入选择

23

在ng-repeat下的tfoot中禁用输入控件

12

活动推荐

快速将图片识别为可编辑文本，高准确率

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例