首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

实体识别(2) -命名实体识别实践CRF

官网地址:http://taku910.github.io/crfpp/ 安装 CRF++的安装可分为Windows环境和Linux环境下的安装。...关于Linux环境下的安装,可以参考文章:CRFPP/CRF++编译安装与部署 。...在Windows中CRF++不需要安装,下载解压CRF++0.58文件即可以使用 训练语料创建 在训练之前需要将标注数据转化为CRF++训练格式文件: 分两列,第一列是字符,第二例是对应的标签,中间用...比如标注方案采用BISO,效果如下: 模板 模板是使用CRF++的关键,它能帮助我们自动生成一系列的特征函数,而不用我们自己生成特征函数,而特征函数正是CRF算法的核心概念之一。...++安装与使用 https://www.biaodianfu.com/crf.html 使用CRF++实现命名实体识别(NER) https://www.cnblogs.com/jclian91/p

1.6K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    达观数据如何打造一个中文NER系统

    对于CRF,有很多开源的工具包可供选择,在此使用CRF++进行训练。CRF++官方主页为https://taku910.github.io/crfpp/,包括下载及使用等说明。...图6使用了unigram特征,并且仅以字符本身作为特征而不考虑其他特征。除当前字符外,还使用了其前后3个字,以及上下文的组合作为特征。CRF++会根据特征模版生成相关的特征函数。...图8:CRF++训练过程 ? 图9:CRF++训练结果 3.5 模型预测及使用 模型训练完毕后就可以进行预测。...CRF++提供crf_test命令进行测试,我们使用文本“北京市委组织部长姜志刚调任宁夏副书记“进行测试,测试文件中每字一行,每句话使用空行隔开。测试结果如图10所示。 ?...图10:CRF++测试结果 从图10的结果我们可以看到,CRF模型能够对输入文字序列输出相应的标签从而完成NER任务。在模型预测时,CRF++主要使用了维特比算法进行nbest输出。

    2.2K90

    LinuxLinux调试器-gdb使用

    前言 在前面的博客【Linux】编译器-gcc/g++使用已经分享了关于编译器的使用,而编译器的使用离不开调试,这次就来分享一下Linux调试器-gdb使用。 2....使用 3.1 进入gdb 默认系统中会安装gdb,使用方法就是gdb后面直接加上调试的可执行程序名: gdb myprocess-debug 就会默认进入到调试模式 想要退出就直接输入quit或者...如果想要从程序第一行开始查就用命令: l 0 还可以使用l加程序名再加0的方式 l myprocess.c:0 不可以直接查文件,但是加上行号就可以查。...进入到函数体里面就退不出来 如果想要跳转到某一行,就用到命令: until 试一下跳转到12行: 总结一下gdb使用就是: set var:修改变量的值 把指定变量直接修改为目标值

    16310

    Linux Deploy:使用Repository部署Linux系统

    文章更新   20170408 初次成文 问题提出:   在之前的文章中,小苏为大家介绍过使用常规方式和使用镜像方式部署Linux系统的方法,但是这两种方法各有利弊:   使用常规方式部署时,镜像大小可以灵活调节...使用镜像方式部署Linux系统时,虽然可以免去部署时下载大量数据的麻烦,但是使用别人部署好的镜像,初始实现的功能依别人部署好的镜像而定,不能个性化定制系统,也不能调整镜像大小。   ...那就是先在Linux Deploy中部署和安装所需要的环境和软件包,然后使用Linux Deploy的导出功能,将Rootfs打包为tar.gz文件,之后,我们只需要将此tar.gz文件导入Linux...Deploy,就可以完整还原打包时的Linux系统了。...因为在Repository中,作者使用各发行版的官方软件源作为软件源,这样一来,一是服务器节点远离中国,软件包下载速度一般都很慢,二是在我国ipv6还未普及,使用官方软件源在部署过程中有一定几率解析到ipv6

    6.2K20

    Linux 之 crontab 使用

    定时任务 任务调度的crond常驻命令 crond 是linux用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。...而linux任务调度的工作主要分为以下两类: 1、系统执行的工作:系统周期性所要执行的工作,如备份系统数据、清理缓存 2、个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信...Day 每月的第几天执行该任务 Month 每年的第几个月执行该任务 DayOfWeek 每周的第几天执行该任务 对于程序员来说最关注的莫过于使用示例...,通过示例可以一目了然的掌握如何使用定时任务 注意:在 crontab 命令中只有 “绝对路径”,不存在相对路径,故执行任何命令都需要写绝对路径 1、每小时的第5分钟执行 ls 命令 5 * * * *...对应的 mdd.toml 和 mdd.log 都是在 cd 到的目录下,此时就不需要全部写全目录了,如果不使用 cd 命令,最终的写法如下: 0 * * * * /data/GoProjects/bin

    2.9K20

    Linux终端的使用

    也就是说终端就是为主机提供了人机接口,每个人都通过终端使用主机的资源。 终端有字符终端和图形终端两种模式。...在linux的图形环境下,我们可以通过鼠标点击来完成所有的管理任务,这是图形界面终端,另外一种就是文本界面的终端,在这个界面的终端下我们可以使用linux命令来控制系统完成响应的工作,而这个文本终端也是服务器常用的模式...命令控制系统的工具,我们点击屏幕左上角的“活动”就可以找到这个它 打开之后我们会看到linux的命令行,在这里面我们可以输入linux命令来进行操作 第二种 打开文本终端,这个需要键盘上的组合键[Ctrl...] + [Alt] + [F1] - [F6] ,其中F1和F2是两个可供登录的图形终端,F3-F6为文本终端,现在我们使用[Ctrl] + [Alt] + [F3]打开文本终端,然后使用root用户登录...以上的快捷键都是在工作中可能会经常用到的,不论是在图形界面打开的终端还是字符界面的终端都可以使用,在这里面就不挨个演示了,各位可以在终端中使用任意字幕和空格模拟命令输入然后多多熟悉,尽快掌握。

    11.8K20

    Linux 之 crontab 使用

    定时任务 任务调度的crond常驻命令 crond 是linux用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。...而linux任务调度的工作主要分为以下两类: 1、系统执行的工作:系统周期性所要执行的工作,如备份系统数据、清理缓存 2、个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信...Day 每月的第几天执行该任务 Month 每年的第几个月执行该任务 DayOfWeek 每周的第几天执行该任务 对于程序员来说最关注的莫过于使用示例...,通过示例可以一目了然的掌握如何使用定时任务 注意:在 crontab 命令中只有 “绝对路径”,不存在相对路径,故执行任何命令都需要写绝对路径 1、每小时的第5分钟执行 ls 命令 5 * * * *...对应的 mdd.toml 和 mdd.log 都是在 cd 到的目录下,此时就不需要全部写全目录了,如果不使用 cd 命令,最终的写法如下: 0 * * * * /data/GoProjects/bin

    3.5K20

    linux shell快速使用

    (1) who是查看当前谁登录了linux系统 |是在两个程序之间建立一个管道, who | wc -l who的输出成为了wc 的输入 当然也可以自己创建linux的命令,创建一个文件,赋值给其执行的权限...x ,当然也可以直接在脚本中使用set -x 来打开执行跟踪的功能,使用set +x 来关闭执行跟踪功能 ctrl +a 快速切换命令到行首 ctrl + e 快速切换命令到行尾 (2)查找与替换...sed 命令进行替换 's;被替换值;要替换的值;'使用s后紧跟的界定符分割; 如果末尾是以g结尾则会进行全局替代,当然在后面添加数字代表替代哪一个,使用p结尾代表是否打印 当然可以将替换的命令放入脚本中使用...; anonuid/anongid :要和root_squash 以及 all_squash一同使用,用于指定使用NFS的用户限定后的uid和gid,前提是本机的/etc/passwd中存在这个uid...启动完NFS后,就该使用NFS服务了。

    1.3K10

    Linux 了解内存使用

    注意:实际上,内核完全控制着内存的使用情况,linux会在需要内存的时候,或在系统运行逐步推进时,将buffers和cached状态的内存变为free状态的内存,以供系统使用。...2.从应用层的角度来看系统内存的使用状态 也就是linux上运行的应用程序可以使用的内存大小,即free命令第三行“(-/+ buffers/cached)”的输出,可以看到,此系统已经使用的内存才...Linux操作系统的内存运行原理,很大程度上是根据服务器的需求来设计的,例如系统的缓冲机制会把经常使用到的文件和数据缓存在cached中,linux总是在力求缓存更多的数据和信息,这样再次需要这些数据时可以直接从内存中取...3)、如何回收cached Linux内核会在内存将要耗尽的时候,触发内存回收的工作,以便释放出内存给急需内存的进程使用。...Linux SWAP使用情况 ---- 如果系统的物理内存用光了,则会用到swap。系统就会跑得很慢,但仍能运行;如果Swap空间用光了,那么系统就会发生错误。

    3.6K30
    领券