Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >PKUseg在货运领域的评测

PKUseg在货运领域的评测

作者头像
sladesal
发布于 2019-02-22 07:27:13
发布于 2019-02-22 07:27:13
50600
代码可运行
举报
文章被收录于专栏:机器学习之旅机器学习之旅
运行总次数:0
代码可运行

先说结论,再和大家闲聊,对比jieba与PKUseg在公路货运切词能力上:

  • 默认模型下,jieba效果优于PKUseg
  • PKUseg提供场景精细化的预训练(还没有提供入口),长远来讲适合专业领域使用
  • PKUseg在特定的场景下有令人惊喜的效果(地址切分)

给大家的建议就是,如果大家赶时间求稳定适应范围需要非常广的时候,目前来说jieba是非常好的选择,如果说在面临一些精细化领域的特殊需求的时候,可以用PKUseg进行一波尝试,有意外惊喜。


那是一个风和日丽的早上,突然群里老大发出一条消息:

我感觉我的心脏有一丝隐隐作痛的感觉,人在办公室坐,活从天上来,虽然身后站着一堆催上线的产品,我还是屈服于老大的正义(淫威),简单测评了新出来的PKUseg与Jieba在公路货运/运输行业上的效果对比。

在我们的热词数据库中已经有人工切词完成的2万多条货运的词条:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
description standard
高博集团装货卸宝华   高博 集团 装货 卸 宝华
北安到吉林农安饲料90吨每吨105   北安 到 吉林 农安 饲料 90吨 每吨 105
需要4个车   需要 4个 车
叶张公路装香闵路曲吴路两卸   叶张公路 装 香闵路 曲吴路 两卸
从福通物流到吴滩镇   从 福通 物流 到 吴滩镇
霞浦宏霞路到中通物流  霞浦宏霞路 到 中通物流
石大路3场到德兴西门山 石大路 3场 到 德兴 西门山
公园西路装   公园 西路 装
不押车每吨150    不 押车 每吨 150
速订价钱好商量 速订 价钱 好商量
慈溪胜山装   慈溪 胜山装
好装好卸高价急走    好装好卸 高价急走
九顶山路与东方大道位置装货可以配货   九顶 山路 与 东方 大道 位置 装货 可以 配货
要二部 要 二部
青浦工业园区久远路提货到奉贤新杨公路进仓    青浦 工业园区 久远路 提货 到 奉贤 新杨公路 进仓
园光路装博学南路卸   园光路 装 博学南路 卸
公兴装卸荣昌广顺    公兴 装卸 荣昌 广顺
打备注电话18458331112    打 备注 电话 18458331112
...

首先看,不加任何词库,预训练下的,最后的效果对比:

结果

切词准确率

jieBa

79.5%

pkuSeg

59.79%

可以看到,在默认的分词模型下,jieBa分词还是拥有绝对优势的,但是在pkuSeg的git里面

所以我想看看能不能进行一下预训练下后再对比一下,可惜的是我在git(git地址传送门)上找了半天也没有找到预训练的入口,只有已经被官方预训练好的词库

等有时间了,可以邮件沟通一下再补充这个部分的效果对比,我觉得,应该还是有提升的。

但是,在我们实际去测的过程中,我们发现了一些差异话的东西比较有意思。我们其实现在在做一个语音发货的产品,涉及到把一串地址切分开的需求:

其中涉及到地址切分的时候,jieba的能力会比如PKUseg要弱不少,比如“山西大同”,“上海浦东”,我们需要把一级二级地址切开的时候,PKUseg可以做到,而jieba并不能按照需求切块。所以,我们已经打算在地址模块切换PKUseg的模型来适应了。

最后吐槽一下,虽然我知道PKUseg需要加载模型,但是一加载就是一二十秒也是有点夸张了。酒浆,各位下回见。

欢迎大家关注我的个人bolg知乎,更多代码内容欢迎follow我的个人Github,如果有任何算法、代码、转行疑问都欢迎通过公众号发消息给我。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.01.14 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Waymo无人卡车高调重返凤凰城,重点路测高速和主干道,但货运先机已失
Waymo官方推特表示,已经在亚利桑那州凤凰城展开无人驾驶半挂卡车的实际道路测试。
量子位
2019/06/18
3310
Waymo无人卡车高调重返凤凰城,重点路测高速和主干道,但货运先机已失
Perceptln获三星数百万美元投资,将切入自动驾驶领域
李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI Perceptln,一家不算完全陌生的公司。 量子位曾先后两次提过这家位于硅谷的华人背景公司。一次是与他们业务相似的硅谷公司被百度收购,我们说这也是一家“洋装穿在身心还是中国心”的公司,从创始团队到投资方,都是中国背景。 另一次则是在复盘百度系无人车创业群像中,我们提到Perceptln的联合创始人及董事长刘少山,他曾在百度美研工作了2年左右的时间,以百度无人车高级架构师的身份,主要负责传感器融合、ROS、感知等相关工作。 不过在此之间,Perc
量子位
2018/03/26
8290
Perceptln获三星数百万美元投资,将切入自动驾驶领域
新年干货 | NLP一路走来的经验之谈
第一种,在实践中学习,找一个特定的任务,譬如文本分类、情感分析等。然后以做好任务为导向的去挖掘和这一个任务相关的知识点。 由于没有系统的学习,肯定会遇到各种各样的拦路虎问题,当遇到不懂的概念时,利用百度/谷歌查阅相关资料去理解学习这个概念,若是概念难懂,就多看不同的人对这些概念的理解,有的时候有些人能深入浅出的讲解一些很不错的资料,个人觉得这种有目的性的实践学习方式学来的东西更加印象深刻。
zenRRan
2019/05/06
7310
凯立德:开放API/SDK,提供全流程智能货运导航
凯立德的货运地图数据除了应用于常规的货车导航设备外,还为货运物流服务平台量身打造,全面开放API和SDK,适用大、中、小各类物流企业,可提供全流程的货运导航业务解决方案。
BestSDK
2018/03/01
1.4K0
凯立德:开放API/SDK,提供全流程智能货运导航
货运安全事故频发、代价高昂,智慧物流能做些什么?
一辆大货车在高速行驶途中突然冲过中央隔离防护栏,进入车流密集且高速的对向车道,以很高的相对速度撞向正常行驶的5辆小汽车,最终酿成5人死亡、11人受伤(其中一人重伤)的惨剧。
用户2908108
2021/10/20
2910
我的皮带秤劳模朋友(一)
我结交的从事电子皮带秤同行朋友中有两位是共和国的佼佼者——全国劳动模范,一位是上港集团煤炭分公司的徐富德,另一位是中铝云铜锌业的罗丽萍,他们都是普通劳动者,干的工作同本媒体的一部分读者差不多——使用、维护电子皮带秤,正是他们的勤奋努力,在先进衡器的普及应用和研制方面取得了一个个成绩,造就了中国衡器行业的飞速进步。
剑指工控
2023/08/31
1620
我的皮带秤劳模朋友(一)
国内自动驾驶企业在美国首秀其最新L4级自动驾驶货运卡车
美国东部时间1月9日,在国际消费电子展 (CES 2018)上,国内自动驾驶企业图森未来携最新 L4 级 (SAE) 自动驾驶卡车在CES上正式亮相。这是年内即将在亚利桑那州路测的最新 L4 级自动驾驶卡车的美国首秀。
人工智能的秘密
2018/01/15
8490
数字货运角逐:满帮化零为整,福佑化整为零
尽管今天中国的货运业已经具备相当的规模,来自淘宝京东的包裹更是川流不息,但物流仍旧是各个企业发展过程中的“不可忽视”之痛——太贵了。从数据来看,2020年中国物流成本占GDP比重约为14.7%,几乎是美国该数值(7.6%)的两倍。而且国内物流有接近1/3的支出,是因为信息不对称导致的,按照中国GDP总体数值,这种浪费每降低一个百分点就能每年节省数百亿。
刘旷
2022/05/10
2140
数字货运:“技”行天下,“绩”论英雄
过去的“双11”电商节,人们判断市场消费力度的依据是头部电商平台的业绩战报,以及货运市场快递单量。虽然今年“双11”全网成交额相比去年相差悬殊,但货运平台依旧吃到了电商促销的红利。
刘旷
2022/12/01
3040
这家无人车公司专注货运,获新浪投资,有望全球最早商用
百度投资上百亿做无人车,并宣称将在三年内商用、五年内量产,如果这一目标实现,百度有望成为全球最早实现自动驾驶技术商用的公司。不过,现在有一家不起眼的中国公司正在与百度竞逐“全球最先商用无人车”这一目标。创业团队图森互联计划在2017年底推出他们的自动驾驶车并开展路测,再用一到两年的时间实现商业化,近日笔者对其CEO陈默进行了一次专访,希望可以将这家继百度之后入局自动驾驶领域的中国公司介绍给大家。 专注于中长途城际货运 说到自动驾驶汽车,人们往往会想到乘用车,而忽视卡车。市面上知名度较高的自动驾驶汽车玩家,
罗超频道
2018/04/27
5920
这家无人车公司专注货运,获新浪投资,有望全球最早商用
集装箱拖车运输知识_箱讯科技
集装箱运输是一种高效率与高效益的运输方式,安全风险小、装卸效率高、劳动力成本低、货损货差少,有利于铁路、水路、公路开展多式联运,构建多种运输方式协同化的现代综合交通运输体系,对于加快我国物流业发展、降低全社会物流成本、推动国民经济持续快速发展具有十分重要的意义。
箱讯科技
2023/05/26
3780
集装箱拖车运输知识_箱讯科技
京东、美团领投嬴彻科技 重卡自动驾驶量产还有多远?
今年8月3日,嬴彻科技宣布完成B轮2.7亿美元融资,由京东物流、美团、太盟投资集团联合领投。作为专注干线物流自动驾驶的科技公司,已经历了4轮融资,股东阵容堪称豪华。
用户2908108
2021/10/20
5420
过滤豆瓣租房小组中介贴之 python 实现
如果K=3,那么离绿色点最近的有2个红色三角形和1个蓝色的正方形,这3个点投票,于是绿色的这个待分类点属于红色的三角形。 如果K=5,那么离绿色点最近的有2个红色三角形和3个蓝色的正方形,这5个点投票,于是绿色的这个待分类点属于蓝色的正方形。
统计学家
2019/04/10
6650
外贸术语缩写大全简写解释
  做外贸经常会遇到一些专业术语,比如外贸术语exw、MOQ等缩写,这些外贸术语简写代表什么意思呢?随ytkah一起来了解一下吧
ytkah
2022/03/14
4K0
千米感知误差低于5%,嬴彻发布全球领先的超长距精准3D感知技术
行驶在高速公路上的自动驾驶重卡,时速保持在 80-100 km/h,即每秒移动大约 25 米。
量子位
2020/07/14
5600
7个月前被英特尔153亿美元收购的Mobileye,现在怎么样了? | 专访Mobileye中国区掌门人苏淑萍
被英特尔收购之后,Mobileye已经开始着手执行一个明确的规划。他们计划在以色列建立一个大型的研发基地,目标是建立一支2000到3000人的研发团队。 2017年3月13日,英特尔宣布以153亿美元的价格收购以色列科技公司Mobileye。这一消息在当时震撼了全球科技圈,并由此把巨头企业在无人驾驶领域的厮杀彻底摆在了明处。 如今,距离这次历史性收购事件已经过去了7个月,“卖身”给英特尔的Mobileye近况如何,又有哪些新的动作?本文将为你揭晓答案。 以下为正文部分: Mobileye,如雷贯耳,俨然已成
镁客网
2018/05/30
5010
渣土车这块城市膏药,什么时候能撕下来?
2018年初,扬州曾在一天之内发生了3起严重交通事故。中午11点,高邮文游南路一辆渣土车与电动车相撞,导致电动车男子死亡。下午1点,扬子江路与古渡路交叉路口发生了渣土车与人相撞事故,导致一人伤亡。10分钟后,润扬路与328国道交叉口,电动三轮车左转过路口,被迎面呼啸而来的渣土车撞飞,电动车夫妻当场死亡。
镁客网
2018/08/16
3610
渣土车这块城市膏药,什么时候能撕下来?
国家交通运输部《交通运输领域新型基础设施建设行动方案》:智慧公路、智慧航道、智慧港口、智慧枢纽等交通新基建工程建设是重点
《交通运输领域新型基础设施建设行动方案 (2021—2025年)》 为贯彻党中央、国务院决策部署,落实《交通强国建设纲要》《国家综合立体交通网规划纲要》总体要求,推动交通运输领域新型基础设施建设,根据《交通运输部关于推动交通运输领域新型基础设施建设的指导意见》和“十四五”时期数字交通发展有关要求,制定本方案。 一、总体要求 (一)指导思想。 以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,立足新发展阶段,贯彻新发展理念,构建新发展格局,以推动交通运输高质
云头条
2022/03/18
9390
2023中国自动驾驶领域最具商业合作价值企业盘点
几年前,相关企业宣布启动自动驾驶研究项目以来,我国的自动驾驶行业迅速取得了巨大进展。近年来,国内陆续出台多项政策支持,加之技术和政策的多重推动,推动了国内自动驾驶领域的持续发展,不断迈入新的发展阶段。
数据猿
2023/09/15
5070
2023中国自动驾驶领域最具商业合作价值企业盘点
是权谋还是不当竞争,自动驾驶领域为何频发“技术偷窃”事件?
无论是古往今来的权谋故事、军事战争、还是商业大片之中,派遣己方人员去“敌方”卧底窃取机密总是最令看客们心惊胆战却倍感刺激的情节。近年来,这一经典的情节在自动驾驶领域频繁上演,其中夹杂着出走、背叛、信念不合种种,背后究竟是人性的“扭曲”,还是道德的“沦丧”?
镁客网
2019/05/07
4560
是权谋还是不当竞争,自动驾驶领域为何频发“技术偷窃”事件?
推荐阅读
Waymo无人卡车高调重返凤凰城,重点路测高速和主干道,但货运先机已失
3310
Perceptln获三星数百万美元投资,将切入自动驾驶领域
8290
新年干货 | NLP一路走来的经验之谈
7310
凯立德:开放API/SDK,提供全流程智能货运导航
1.4K0
货运安全事故频发、代价高昂,智慧物流能做些什么?
2910
我的皮带秤劳模朋友(一)
1620
国内自动驾驶企业在美国首秀其最新L4级自动驾驶货运卡车
8490
数字货运角逐:满帮化零为整,福佑化整为零
2140
数字货运:“技”行天下,“绩”论英雄
3040
这家无人车公司专注货运,获新浪投资,有望全球最早商用
5920
集装箱拖车运输知识_箱讯科技
3780
京东、美团领投嬴彻科技 重卡自动驾驶量产还有多远?
5420
过滤豆瓣租房小组中介贴之 python 实现
6650
外贸术语缩写大全简写解释
4K0
千米感知误差低于5%,嬴彻发布全球领先的超长距精准3D感知技术
5600
7个月前被英特尔153亿美元收购的Mobileye,现在怎么样了? | 专访Mobileye中国区掌门人苏淑萍
5010
渣土车这块城市膏药,什么时候能撕下来?
3610
国家交通运输部《交通运输领域新型基础设施建设行动方案》:智慧公路、智慧航道、智慧港口、智慧枢纽等交通新基建工程建设是重点
9390
2023中国自动驾驶领域最具商业合作价值企业盘点
5070
是权谋还是不当竞争,自动驾驶领域为何频发“技术偷窃”事件?
4560
相关推荐
Waymo无人卡车高调重返凤凰城,重点路测高速和主干道,但货运先机已失
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档