文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用logstash解析包含不同unicode字符串的字段

问如何使用logstash解析包含不同unicode字符串的字段
EN

Stack Overflow用户

提问于 2019-07-18 16:00:39

回答 2查看 375关注 0票数 0

我使用logstash jdbc语句"select utl_raw.cast_to_varchar2(dbms_lob.substr(field，length( field )) from table;“来获取blob字段。logstash中的输出是像"\v\u0004\u0000\u0000\u0000\u0001\u0005\u0001\u0004\u0019\u0000c\u0000o\u0000m\u0000.\u0000w\u0000m\u0000.\u0000d\u0000a\u0000t\u0000a\u0000.\u0000I\u0000S\u0000M\u0000e\u0000m"‘这样的unicode字符，它的实际值是"com.wm.data.ISMem“，我需要替换所有unicode字符并解析我的数据。任何人都可以建议如何重新解析它，以及在这里可以使用哪个logstash过滤器来解析SQL输出

unicode

logstash

gsub

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-07-18 21:11:53

您可以从mutate过滤器中使用gsub。

mutate {
    gsub ["field-name","\v\u0004\u0001\u0005\u0001\u0004\u0019",""]
    gsub ["field=name","\u0000",""]
}

第一个将删除\v\u0004\u0001\u0005\u0001\u0004\u0019，它似乎是某种标头。

第二个将从字符串中删除剩余的\u0000。

票数 1

Stack Overflow用户

发布于 2019-07-18 21:26:26

您可以使用以下命令对其进行变异

    mutate {
        gsub => [
            "message", "[\\]u0000", "",
            "message", "[\\]v[\\]u0004[\\]u0001[\\]u0005[\\]u0001[\\]u0004[\\]u0019", ""]
    }

我希望有一种方法可以修复ruby过滤器中的编码，但我不知道它是什么。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57089731

复制

相似问题

问如何使用logstash解析包含不同unicode字符串的字段
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用logstash解析包含不同unicode字符串的字段EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用logstash解析包含不同unicode字符串的字段
EN