感谢谷歌提供的BigQuery,它太棒了!
是否可以使用BigQuery进行近似字符串匹配/模糊字符串搜索?
谷歌有计划将此功能添加到BigQuery中吗?
当然,谷歌专有的近似字符串匹配算法可以用来向BigQuery提供这种能力,同时仍然保持谷歌的知识产权。我们已经搜索了所有的BigQuery文档和堆栈溢出问题。当然,有很多算法可以做到这一点,但是如何与BigQuery集成呢?
我们的需求很简单,比较两个字符串,这两个字符串虽然可能略有不同,但大部分相同。例如:
"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC". 从我们的BigQuery测试中,似乎需要两个字符串完全匹配,BigQuery才能连接它们,甚至每个字符串中的尾随空格数量也是如此。如果能添加此功能或与BigQuery集成的指南,我们将不胜感激。这是为了支持密尔沃基喷气机公司,这是一家位于威斯康星州密尔沃基的地区性、创新性的喷气式飞机所有权公司。再次感谢谷歌提供BigQuery。
非常感谢并致以良好的问候,安德鲁·保林电话:(414) 212-5372
发布于 2012-05-11 23:22:22
不幸的是,不支持近似字符串匹配。最接近的方法是使用正则表达式。最好的办法可能是在数据到达BigQuery之前对其进行标准化--即转换"Rhodes USA“和"Rhodes,USA”。转换成相同的字符串。但是,我将为此支持添加一个功能请求bug。
https://stackoverflow.com/questions/10546130
复制相似问题