首页
学习
活动
专区
工具
TVP
发布

AI科技评论

专栏作者
4092
文章
3386351
阅读量
184
订阅数
贯穿计算机历史长河的幽灵竟是一张“彩票”,深度学习也曾被诅咒
先以数学为例。曾经繁荣一时的毕达哥拉斯学派曾提出“万物皆数”,也即“一切数均可表示成整数或整数之比”,这也成为这一学派的数学信仰。——后来该学派中的一个成员希巴斯带着
AI科技评论
2020-09-24
5440
学界 | 北大开源中文分词工具包 pkuseg
考虑到 jieba 分词和 THULAC 工具包等并没有提供细领域的预训练模型,为了便于比较,开发团队重新使用它们提供的训练接口在细领域的数据集上进行训练,用训练得到的模型进行中文分词。他们选择 Linux 作为测试环境,在新闻数据(MSRA)、混合型文本(CTB8)、网络文本(WEIBO)数据上对不同工具包进行了准确率测试。在此过程中,他们使用第二届国际汉语分词评测比赛提供的分词评价脚本,其中 MSRA 与 WEIBO 使用标准训练集测试集划分,CTB8 采用随机划分。对于不同的分词工具包,训练测试数据的划分都是一致的;即所有的分词工具包都在相同的训练集上训练,在相同的测试集上测试。
AI科技评论
2019-10-31
8520
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档