首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

干货 | 机器学习在1店商品匹配实践

作者简介 刘洋,1店搜索部算法工程师,机器学习爱好者和实践者。上海大学博士,在语义分析、知识发现有深入研究。 电子商务通过服务和商品给用户带来极致体验。...规则匹配每次都要去分析,两个商品信息中,匹配有哪些,不匹配有哪些,用什么规则可以进行区别。 优点:易于干预,匹配错误Case易于调整。...同一个词有可能来自1店商品标题,也有可能来自友商商品标题,这里作为两个不同特征。...例如特征“480773:YHD_BRAND:康师傅”,480773是特征编号,“YHD”表示来自一店商品特征,“BRAND”是特征词性表明是品牌词,最后“康师傅”是具体词。...展望 1店采用了规则匹配、特征工程匹配、纯数据驱动匹配去解决商品匹配问题。目前多是基于文本信息,由于各家网站运营规范不同,有时仅凭借标题等信息也无法判断两个商品是否匹配

3.2K130

python正则积累

表示任意一个字符 \d 表示任意一个数字 [] 匹配[]中字符 \D 表示任意一个非数字(\d反向操作) \s 表示空白(空格和tab键) \S 表示非空白 \w 匹配单词字符如0-9,-z,A-Z...,_ \W 匹配单词字符 ?...表示非贪婪模式 * 表示贪婪模式 ^ 匹配字符串开头 $ 匹配字符串末尾。 . 匹配任意字符,除了换行符, [...]...imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中区域。 (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中区域。 (?...\b 匹配一个单词边界,也就是指单词和空格间位置。例如, 'er\b' 可以匹配"never" 中 'er',但不能匹配 "verb" 中 'er'。 \B 匹配单词边界。'

40930

前端学数据结构与算法(八): 单词前缀匹配神器-Trie树实现及其应用

(add) 将单词拆解为单个字符,而每个字符就是一个Node类实例,最后当单词达到末尾时,将最后字符Node节点isWord属性设置为true即可。...查询Trie里单词(search) 因为已经有一颗Trie树了,所以要查询也很简单,只需要将要查询单词分解为字符逐层向下和Trie树节点进行匹配即可,只要有一个节点Trie树里没有,就可以判断Trie...思路就是我们把这个字典转化为一个Trie树,在树里给每个单词做好结束标记,只能是单词才能往下进行匹配,所以进行深度优先遍历,但其中只要有一个字符不是单词,就结束这条路接下来遍历,最后返回匹配到最长单词长度即可...,然后再输入前缀之后,把每个匹配单词权重值累加即可。...因为...我们来总结下这种数据结构优缺点: **优点** 性能高效,从任意多字符串中匹配某一个单词时间复杂度,最多仅为该单词长度而已。

84111

Python学习(二) 正则表达式

可选参数 count 是模式匹配后替换最大次数;count 必须是非负整数。缺省值是 0 表示替换所有的匹配。 直接上例子: #!....*′,“”,phone)’, “”, phone) 匹配字符串末尾,在多行模式中匹配每一行末尾 ‘#.*$’意思是从#开始到字符串末尾所有内容,全部用空格替换。...模式 描述 ^ 匹配字符串开头 $ 匹配字符串末尾。 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符任意字符。...imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中区域。 (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中区域。 (?...\b 匹配一个单词边界,也就是指单词和空格间位置。例如, ‘er\b’ 可以匹配”never” 中 ‘er’,但不能匹配 “verb” 中 ‘er’。 \B 匹配单词边界。’

88190

Execute 方法(Find 对象)

MatchWholeWord   Variant 类型,可选。如果为 True,则只查找匹配完整单词,而并非作为一个长单词一部分文字。...相当于“编辑”菜单“查找和替换”对话框中“全字匹配”复选框。 MatchWildcards Variant 类型,可选。如果为 True,则查找文字包含特殊搜索操作符。...相当于“编辑”菜单“查找和替换”对话框中“使用通配符”复选框。 MatchSoundsLike Variant 类型,可选。如果为 True,则查找与待查找文字发音相近单词。...如果搜索从不是文档开头位置开始,并到达文档末尾(如 Forward 设置为 False,则相反),用本参数控制接下来操作。当在选定内容或区域中没有找到搜索文字时,本参数也控制接下来操作。...MatchKashida Variant 类型,可选。如果为 True,则查找结果应与阿拉伯语文档中区分 kashidas 文本相匹配

1.2K70

Python3快速入门(七)——Pyth

^匹配字符串开头 $匹配字符串末尾 .匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符任意字符。...imx)正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中区域。 (?-imx)正则表达式关闭 i, m, 或 x 可选标志。只影响括号中区域。 (?...\b匹配一个单词边界,也就是指单词和空格间位置。例如, 'er\b' 可以匹配"never" 中 'er',但不能匹配 "verb" 中 'er'。 \B匹配单词边界。'...可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 可以一次输入多个组,在这种情况下它将返回一个包含那些组所对应值元组。...string 待匹配字符串。 pos 可选参数,指定字符串起始位置,默认为 0。 endpos 可选参数,指定字符串结束位置,默认为字符串长度。

78510

VBA实战技巧36:比较两组数据并高亮显示不匹配字母或单词

假设你正在查看下图1所示2列表,并且想知道每行中两组数据哪里不同。 图1 可以使用一个简单VBA程序来比较这2个列表并突出显示不匹配字母或单词。演示如下图2所示。...要比较两组数据,需要执行以下操作: 1.对于列1中每个项目 2.获取列2中对应项 3.如果它们不匹配 4.对于单词匹配 (1)对于第一个文本中每个单词 (2)在第二个文本中获取相应单词 (3)相比较...(4)如果不匹配,以红色突出显示 (5)重复其他词 5.对于字母匹配 (1)找到第一个不匹配字母 (2)在第二个文本中突出显示自该点所有字母 6.重复列1 中下一项 7.完毕 一旦你写下了这个逻辑....找到第一个不匹配单词/字符 length = Len(cell1.Value2) If Range("wordMatch") Then '匹配单词...;结束下一个单词 Dim i As Long Dim delim As String delim =" .,?!"""

2.2K10

Python 正则表达式大全(下)

1 正则表达式修饰符 - 可选标志 1 阅读本文需要3分钟 1 正则表达式可以包含一些可选标志修饰符来控制匹配模式。修饰符被指定为一个可选标志。多个标志可以通过按位 OR(|) 它们来指定。...模式 描述 ^ 匹配字符串开头 $ 匹配字符串末尾。 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符任意字符。 [...]...imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中区域。 (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中区域。 (?...\b 匹配一个单词边界,也就是指单词和空格间位置。例如, 'er\b' 可以匹配"never" 中 'er',但不能匹配 "verb" 中 'er'。 \B 匹配单词边界。'...\W 匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。 END 1

94110

python 学习笔记(9)——Python 正则表达式

匹配对象方法 描述 group(num=0) 匹配整个表达式字符串,group() 可以一次输入多个组,在这种情况下它将返回一个包含那些组所对应值元组。...groups() 返回一个包含所有小组字符串元组,从 1 到 所含小组。 实例 #!...匹配对象方法 描述 group(num=0) 匹配整个表达式字符串,group() 可以一次输入多个组,在这种情况下它将返回一个包含那些组所对应值元组。...模式 描述 ^ 匹配字符串开头 $ 匹配字符串末尾。 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符任意字符。 [...]...\b 匹配一个单词边界,也就是指单词和空格间位置。例如, 'er\b' 可以匹配"never" 中 'er',但不能匹配 "verb" 中 'er'。 \B 匹配单词边界。'

59141

正则表达式入门

3.3 重复次数 *3.3.1 字符 *匹配在 *之前字符出现大于等于0次,就是出现0次或多次 3.3.2 +字符 +匹配+之前字符出现 >=1 次. ? 3.3.3 ?...之前字符为可选,即表示出现0次或者1次。比如[T]?he匹配字符串he和The ? 3.4 {} 在正则表达式中 {} 是一个量词, 常用来一个或一组字符可以重复出现次数....这些特殊字符.如果想要匹配这些特殊字符则要在其前面加上反斜线 . 3.8 边界 字符 含义 ^ 以^后面的字符开头 $ 以 $前面的字符结尾 \b 单词边界,指[a-zA-Z0-9]之外字符 \B...非单词边界 3.9 修饰符(i, g, m) 修饰符 描述 i 忽略大小写 g 全局搜索 m multiple lines多行匹配 ?...需要注意一点,正则表达式中前和后和我们一般理解前后有点不同。一段文本,我们一般习惯把文本开头方向称作“前面”,文本末尾方向称为“后面”。

87020

Python 正则表达式 re 模块

匹配对象方法 描述 group(num=0) 匹配整个表达式字符串,group() 可以一次输入多个组,在这种情况下它将返回一个包含那些组所对应值元组。...模式 描述 ^ 匹配字符串开头 $ 匹配字符串末尾。 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符任意字符。...\z 匹配字符串结束 \G 匹配最后匹配完成位置。 \b 匹配一个单词边界,也就是指单词和空格间位置。...例如, ‘er\b’ 可以匹配"never" 中 ‘er’,但不能匹配 “verb” 中 ‘er’。 \B 匹配单词边界。...\w 匹配包括下划线任何单词字符。等价于’[A-Za-z0-9_]'。 \W 匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]’。

46210

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券