首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

商品标题实体识别

比赛链接 https://www.heywhale.com/home/competition/620b34ed28270b0017b823ad/content/3 1 赛题背景 京东商品标题包含了商品的大量关键信息...,商品标题实体识别是NLP应用中的一项核心基础任务,能为多种下游场景所复用,从标题文本中准确抽取出商品相关实体能够提升检索、推荐等业务场景下的用户体验和平台效率。...本赛题要求选手使用模型抽取出商品标题文本中的实体。 与传统的实体抽取不同,京东商品标题文本的实体密度高、实体粒度细,赛题具有特色性。...值得注意的是实体不仅仅与实体词有关,而且与当前标题所售卖商品有关。...举例说明,一个售卖产品为手机壳的商品标题中出现的“iPhone13”与售卖产品为手机的商品标题中出现的“iPhone13”为不同的实体标签。

1.8K20

数据挖掘:网购评论是真是假?

当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?商品评论一定是一个重要的参考吧。一般我们总会看看历史销量高不高,用户评论好不好,然后再去下单。...过去不久的11、12网络购物节中,无数网友在各个电商网站的促销大旗下开启了买买买模式。不过,当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?...有时我们选购商品,经常会发现许多条看起来十分夸张的评论,如某女鞋的商品评论: “超级好看的鞋,随便搭配衣服就觉得自己像女神,又不磨脚,站一天都不会累。下次还来买,赶快上新款哦!”...我们特意选取了具有刷单倾向的商品,可以看出,其中许多评论日期连续、会员名相似、买家等级较低;经过人眼识别,刷单评论占比约30%。...我们意在使用这些数据去构建刷单评论识别模型,然后可以用这里得出来的规则去识别其它鞋类商品的刷单评论。

6.9K90
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    同款商品识别的克星--ArcFace!

    ArcFace: Additive Angular Margin Loss for Deep Face Recognition(CVPR2019) 简 介 利用深度卷积神经网络(DCNNs)进行大规模人脸识别特征学习的一大挑战是设计合适的损失函数以提高识别能力...在本文中,我们提出了一个附加的角Margin损失(ArcFace)来获得高分辨的人脸识别特征。由于与超球面上的测地距离精确对应,所提出的弧面具有清晰的几何解释。...背 景 目前训练人脸识别的DCNN方案主要有两种: 训练一个多分类器,它可以将训练集合中的不同实体分开; 训练embeddings,例如triplet loss。...但是softmax的loss和triplet loss都存在一些缺点, 对于softmax来说: 线性转化矩阵和是线性相关的; 学习得到的特征对于闭集分类问题是可分离的,而对于开集人脸识别问题,学习到的特征是不可分辨的...ArcFace相较于Triplet-Loss有更好的margin; 小结 本文提出了一种Additive Angular Margin Loss ,该函数能有效地提高DCNNs学习的特征嵌入在人脸识别中的判别能力

    3.2K10

    网购评论是真是假?文本挖掘告诉你

    摘自:毕马威大数据挖掘 微信号:kpmgbigdata 刚刚过去的11、12网络购物节中,无数网友在各个电商网站的促销大旗下开启了买买买模式。...不过,当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?商品评论一定是一个重要的参考吧。一般我们总会看看历史销量高不高,用户评论好不好,然后再去下单。...有时我们选购商品,经常会发现许多条看起来十分夸张的评论,如某女鞋的商品评论: “超级好看的鞋,随便搭配衣服就觉得自己像女神,又不磨脚,站一天都不会累。下次还来买,赶快上新款哦!”...我们特意选取了具有刷单倾向的商品,可以看出,其中许多评论日期连续、会员名相似、买家等级较低;经过人眼识别,刷单评论占比约30%。...我们意在使用这些数据去构建刷单评论识别模型,然后可以用这里得出来的规则去识别其它鞋类商品的刷单评论。

    5K70

    网购评论是真是假?文本挖掘告诉你

    刚刚过去的11、12网络购物节中,无数网友在各个电商网站的促销大旗下开启了买买买模式。不过,当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?...有时我们选购商品,经常会发现许多条看起来十分夸张的评论,如某女鞋的商品评论: “超级好看的鞋,随便搭配衣服就觉得自己像女神,又不磨脚,站一天都不会累。下次还来买,赶快上新款哦!”...那么,如何才能识别刷单评论呢?我们在此介绍一种借助文本挖掘模型的破解之道。 首先要解决数据来源问题,可以从网站上批量下载这些评论,也就是爬虫。...我们特意选取了具有刷单倾向的商品,可以看出,其中许多评论日期连续、会员名相似、买家等级较低;经过人眼识别,刷单评论占比约30%。...我们意在使用这些数据去构建刷单评论识别模型,然后可以用这里得出来的规则去识别其它鞋类商品的刷单评论。

    5.3K90

    NER | 商品标题属性识别探索与实践

    ---- ©作者 | 康洪雨 单位 | 有赞科技 研究方向 | NLP/推荐算法 来自 | PaperWeekly 最近一段时间在做商品理解的工作,主要内容是从商品标题里识别商品的一些属性标签,包括不限于品牌...▲ 商品理解示例,品牌:佳丰;口味:蒜香味 本文主要记录下做这个任务上遇到的问题,踩的坑,模型的效果等。...主要内容: 怎么构建命名实体识别(NER)任务的标注数据 BertCRF 训练单标签识别过程及踩坑 BertCRF 训练超多标签识别过程及踩坑 CascadeBertCRF 训练超多标签识别过程及踩坑...而且抽出的字一般都是标题前 1、2 个字,这与商品品牌一般都在标题前面有关。...多标签样本是指一个标题中包含多个标签,比如下面这个商品包含 5 个标签。

    2.1K20

    智慧零售商品识别系统方案解析,15分钟上手商品识别AI模型

    2 基于EasyDL零售版的商品识别方案 将终端数据转化为数字资产 百度飞桨EasyDL零售版,针对快消零售业提供专业版服务,实现了低成本、高精度获取商品图像识别模型,完成智能化的店内陈列与费用核销。...通过 EasyDL 零售版,可以训练包含但不限于本品 SKU、竞品 SKU、POSM 助销物料、价签与价格等识别对象。...同时,还配套提供货架拼接、翻拍识别、空位识别商品陈列层数识别商品陈列场景识别等通用能力,从业务实际需求出发,有效获取网点真实商品分销和陈列数据,推动实时预警、及时跟进的市场策略落地,帮助快消品牌商顺利完成经营模式的数字化转型

    1.4K10

    【深度学习】同款商品识别的克星--ArcFace!

    利用深度卷积神经网络(DCNNs)进行大规模人脸识别特征学习的一大挑战是设计合适的损失函数以提高识别能力。...在本文中,我们提出了一个附加的角Margin损失(ArcFace)来获得高分辨的人脸识别特征。由于与超球面上的测地距离精确对应,所提出的弧面具有清晰的几何解释。...目前训练人脸识别的DCNN方案主要有两种: 训练一个多分类器,它可以将训练集合中的不同实体分开; 训练embeddings,例如triplet loss。...但是softmax的loss和triplet loss都存在一些缺点, 对于softmax来说: 线性转化矩阵和是线性相关的; 学习得到的特征对于闭集分类问题是可分离的,而对于开集人脸识别问题,学习到的特征是不可分辨的...本文提出了一种Additive Angular Margin Loss ,该函数能有效地提高DCNNs学习的特征嵌入在人脸识别中的判别能力。

    2.4K40

    快消品图像识别丨无人店背后的商品识别技术

    人脸识别已经逐渐渗透我们的日常生活,机器能够认准人脸,想必大家都有所耳闻;而另一类计算机视觉的应用,是进行商品识别。...当前新兴的一些无人零售店,背后就需要机器对商品进行自动识别,拍图购物、AR互动营销等场景,也运用了商品识别技术。...今天,图酱就跟大家科普应用在无人店、新零售中的商品识别技术。...研究组,则要克服各种疑难杂症,比如容易产生褶皱的软包装、商品侧面和背面的识别、遮挡和反光环境下的识别等等。 ? 目前,在实际生产环境下,已经达到95%以上的识别准确率。...人脸都有眼睛、鼻子、嘴巴等固定的特征,而超市中琳琅满目的商品,则千奇百态。与人脸识别相比,商品识别有更高的工程复杂度。

    3.6K70

    NLP之NER:商品标题属性识别探索与实践

    作者 | 康洪雨 单位 | 有赞科技 整理 | PaperWeekly 最近一段时间在做商品理解的工作,主要内容是从商品标题里识别商品的一些属性标签,包括不限于品牌、颜色、领型、适用人群、尺码等等...▲ 商品理解示例,品牌:佳丰;口味:蒜香味 本文主要记录下做这个任务上遇到的问题,踩的坑,模型的效果等。...主要内容: 怎么构建命名实体识别(NER)任务的标注数据 BertCRF 训练单标签识别过程及踩坑 BertCRF 训练超多标签识别过程及踩坑 CascadeBertCRF 训练超多标签识别过程及踩坑...而且抽出的字一般都是标题前 1、2 个字,这与商品品牌一般都在标题前面有关。...多标签样本是指一个标题中包含多个标签,比如下面这个商品包含 5 个标签。

    1.6K50

    10分钟搭建商品结算平台!商品、车辆识别一网打尽

    "商品识别"、"人脸识别"、"以图搜图"有什么难?这个在 GitHub 上狂圈 Star 3100+ 的项目就能轻松帮你实现! 它就是全开源、轻量级的图像识别系统 PP-ShiTu。...当然不是,一个优秀的图像识别系统往往在处理实际场景问题过程中需要面临各种挑战: 1.商品类别数以万计:根本没法事先把所有类别都放入训练集; 2.不同商品相似度极高:比如同一种饮料的不同口味,就很可能拥有非常类似的包装...,同时对于商品识别中品类众多、外观相似和更新频繁的痛难点也提供了可参考的示范。...其实商品识别的能力远不仅如此,商超能够通过这项技术进行资产保护,降低运营成本;时尚行业能够通过这项技术,完成对秀场服装的大数据分析,把握时尚潮流;服装行业可以通过商品识别快速匹配产品材质和生产工艺等相关信息...未来,从设计到生产、从物流到销售,AI 商品识别,大有可为! 如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

    1.1K30

    猿设计9——真电商之商品实体识别

    商品系统的设计与构建,从某种程度上来讲,就是围绕SPU和SKU来进行的。但是只有这两个粗浅的概念,并不足以描述一个商品信息,今天,我们一起来聊一聊商品到底有哪些信息,进一步完善商品系统的设计。 ?...说到商品的基本信息,我们不妨回过头来看看商品的发布流程。从页面上去寻找需要持久化的信息,从而达到抽象商品信息的目的。 ?...我们先看商品的基础信息,从页面直观的可以看出,有商品类型、商品名称,以及商品类目属性构成。...需要注意的是商品类型这个属性,考虑到我们构建的是一个B2C的站点,同时还需要兼容多商家2C的设计,那么应该从商品的售卖方去区分商品是属于自营还是第三方。...在编辑商品的时候,一般会要求填写条形码,如果一个商品是有条形码如果存在的话,那么这个条形码会在很多地方用到,比如采购、仓库、出纳,也有利于建立一套标准的商品编码。

    93620

    首次揭秘1112背后的云数据库技术!| Q推荐

    从 2009 年到 2021 年,从千万交易额到千亿交易额, 11 已经开展了 12 年。如今,每年的 11 以及一个月后的 12,已经成为真正意义上的全民购物狂欢节。...是什么样的数据库撑起了 2021 年的 11 12 的稳定进行?...《数据 Cool 谈》第三期,阿里巴巴大淘宝技术部 12 队长朱成、阿里巴巴业务平台 11 队长徐培德、阿里巴巴数据库 11 队长陈锦赋与 InfoQ 主编王一鹏,一同揭秘了 11 12 背后的数据库技术...在 11 12,这种方式的弊端会被进一步放大。数据显示,在 11 秒杀系统中,秒杀峰值交易数据每秒超过 50 万笔,是一个非常典型的电商秒杀场景。...在数据库层面,往往一个商品 ID 对应数据库内的一行记录。消费者下单那一刻核销资产或者卡券,在关系数据库里被称为完成了一个事务。

    31.8K50

    京东商品详情页应对“11”大流量的技术实践

    我们有几亿个商品,对于这么多商品,你如果生成页面的话需要跑很多天,而且还无法应对一些突发情况。 ?...商品详情页涉及的服务 对于商品详情页涉及了如下主要服务: 商品详情页HTML页面渲染 价格服务 促销服务 库存状态/配送至服务 广告词服务 预售/秒杀服务 评价服务 试用服务 推荐服务...最早期的时候,我们商品详情页采用.NET技术,但是随着商品数量增加,而且随着商品数据库结构设计复杂性的变化,后来我们就生成了静态页,通过JAVA生成页面的片段,像商品介绍等等,都是通过一个一个片段输送出去的...有商品维度,还有其他维度,比如商品介绍、分类、商家、品牌,对于这些维度我们都会分开进行存储。...比如展示商品详情页时,读取商品信息、商品相关信息:分类,商家,品牌等等信息然后渲染页面即可;而商品介绍读出来吐出去就可以了。

    1.7K100

    在线商城项目12-商品列表页价格筛选实现

    简介 本篇主要目的如下: 实现商品列表页的后端价格筛选逻辑 前后端联调价格筛选逻辑 1. 实现商品列表页的后端价格筛选逻辑 之前我们约定前端传startPrice和endPrice来获取价格区间。...我们设定如下规则: 如果startPrice未传,则默认查询起始价为0 如果endPrice未传,则不设置查询结尾价 查询起始价(不包含)到结尾价(包含)区间的商品 修改routes/goods.js文件如下...}}; } else { params = {salePrice: {$gt: startPrice}}; } // 查询起始价(不包含)到结尾价(包含)区间的商品...我看了一下京东,天猫,淘宝,唯品会等商品搜索页面,大部分都只有手动输入价格区间。如果有指定筛选空间的,一般是定价没有小数点的,比如:0-100,101-500,500以上这样。

    1.2K20
    领券