首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用regex和Presto DB从引用url中提取域名

使用regex和Presto DB从引用url中提取域名
EN

Stack Overflow用户
提问于 2018-05-31 03:23:23
回答 1查看 709关注 0票数 1

我正在尝试从PrestoDB中的引用urls列表中提取域名。使用url_extract_host函数,我有一个类似下面的列表。我在尝试从字符串中获取域名时卡住了。

Presto使用java样式的模式语法。

下面是一个字符串列表,所有字符串都应该返回google

google.com google.co.il blog.google.com blog.google.co.il

谢谢,谢谢你的帮助。

EN

回答 1

Stack Overflow用户

发布于 2018-05-31 05:55:58

我认为你可以从Mozilla维护的Public Suffix List创建一个正则表达式。

但是表达式的长度将超过100,000个字节--目前有超过8,500个公共后缀,包括相当多的非ascii后缀,可以用UTF-8和punycode进行编码,并且您的表达式可能需要同时支持这两种编码。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50612073

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档