首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Java实现随机人名抽取

- 使用数组、方法、循环等实现人名的随机抽取 ## 前言:         我们今天来写一个随机抽取用户名字的一个小程序,     首先我们思考这个需求他需要的条件,要抽取用户的名     字,...###### 1.要有一个储存用因为户数据的一个数据库         因为有些小伙伴刚入们没学过数据库,所以这里就     使用动态数组来代替数据库,实现数据库储存数据,查     找数据,打印数据的功能...DiceGame {    public static void main(String[] args) {       String[] name = {"张三", "李四", "王五",};//定义人名...            break;          }          num = (int) (Math.random() * 3);       } //将数组下标设置成随机数,就可以实现人名的随机抽取

1.2K10
您找到你想要的搜索结果了吗?
是的
没有找到

HanLP中人名识别分析详解

在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》 关于命名识别的一些问题,可参考下列一些issue: l ·名字识别的问题 #387 l ·机构名识别错误 l ·关于层叠HMM中文实体识别的过程...总结一下,对句子进行角色观察,首先是通过分词算法将句子分成若干个词,然后对每个词查询人名词典(PersonDictionary)。...若这个词在人名词典中(nr.txt),则记录该词的角色,所有的角色在com.hankcs.hanlp.corpus.tag.NR.java中定义。...若这个词不在人名词典中,则根据该词的Attribute “猜一个角色”。在猜的过程中,有些词在核心词典中可能已经标注为nr或者nnt了,这时会做分裂处理。...比如说,若最优隐藏序列中 存在 'U' 或者 'V', U Ppf 人名的上文和姓成词 这里【有关】天培的壮烈 V Pnw 三字人名的末字和下文成词 龚学平等领导, 邓颖【超生】前 则会做“拆分处理”

85730

HanLP中的人名识别分析详解

在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》 关于命名识别的一些问题,可参考下列一些issue: 名字识别的问题 #387 机构名识别错误 关于层叠HMM中文实体识别的过程 封面....总结一下,对句子进行角色观察,首先是通过分词算法将句子分成若干个词,然后对每个词查询人名词典(PersonDictionary)。...u 若这个词在人名词典中(nr.txt),则记录该词的角色,所有的角色在com.hankcs.hanlp.corpus.tag.NR.java中定义。...u 若这个词不在人名词典中,则根据该词的Attribute “猜一个角色”。在猜的过程中,有些词在核心词典中可能已经标注为nr或者nnt了,这时会做分裂处理。...比如说,若最优隐藏序列中 存在 'U' 或者 'V', U Ppf 人名的上文和姓成词 这里【有关】天培的壮烈 V Pnw 三字人名的末字和下文成词 龚学平等领导, 邓颖【超生】前 则会做“拆分处理”

81150

在Solr中搜索人名的小建议

搜索人名是我们在许多应用程序中经常用到的功能。比如对书店来说,按作者名检索的功能就相当重要。虽然很难起一个完美的名字,但是我们可以使用Solr的一些功能,使绝大多数英文名搜索达到绝佳的效果。...Graeme Turnbull 好了,您已经可以清楚看出我们在表示英语人名时的差异,这让我们有了检索方法。...人名“Douglas G....另一方面,我们的相似搜索为Solr提供了一些自由度,可以重新排列标记以满足匹配需要,从而给了自由组合的可能 - 所以会搜到许多重排和缩写的人名。...希望这篇文章能帮助你开始建立一个合理的人名搜索系统。您过去是否遇到过此类问题?您如何用Solr解决这些问题?请联系我们以获取问题帮助!

2.6K120

hanlp自然语言处理包的人名识别代码解析

各命名实体识别准确率 nr 33% ns 83% nt 43% 姓氏过滤后,各命名实体识别准确率 nr 36% ns 83% nt 81% 这里没有开层叠隐马预测机构名和地名,nt上升原因估计是由于很多不是人名的词语没被标为人名...错误识别的人名,100个常用姓氏的不多,很多恐怕是HanLP里其他词表干预进来的。 隐马一般用于分词和词性标注是比较好的,为什么通常的序列标注方法也就是BIEO方法直接用到实体识别不合适呢。...但是到了实体识别则不一定,拿人名来说,除了姓氏以外,名字词语部分可以填充的词语是任意的,也就是说任何词语都有可能出现在中间位置,此时发射矩阵中的某些词实际上就没有太大意义了,因为它可能等可能的由BIEO...下边介绍一下HanLP人名识别的主要流程 1.使用使用匹配法求出各种分词路径用变量wordNetAll存储 2.用viterbi方法找到一条最优的分词路径,这里主要使用用户自定义词典以及核心词典,用序列变量...5.对角色序列进行模式匹配得到人名。模式匹配定义在NRPattern类中。 在精度要求比较高且时间紧的情况下,最好的提高准确率的方法为,只保留常用姓氏,只保留最可能的2gram角色标记模式。

87430

HanLP-基于HMM-Viterbi的人名识别原理介绍

Hanlp自然语言处理包中的基于HMM-Viterbi处理人名识别的内容大概在年初的有分享过这类的文章,时间稍微久了一点,有点忘记了。看了 baiziyu 分享的这篇比我之前分享的要简单明了的多。...封面.jpg 本文主要介绍一下HanLP是如何利用HMM来做人名识别的。基本思想是把词语序列作为观测序列,将角色序列作为隐藏序列,当模型预测出最佳隐藏状态序列后,利用模式最大匹配法,匹配出人名实体。...角色n* 最大模式匹配阶段: 利用下边的模式串匹配出人名 { BBCD, BBE, BBZ, BCD, BEE,BE,BG,BXD,BZ,CD,EE,FB, Y,XD} 基于HMM-Viterbi标注的人名识别原理就介绍到这里...基于隐马的人名识别会很容把以一个姓氏作为开头的词语识别为人名,特别是地名中有人名字的,因此,人工整理出一些非常用姓氏的人名,以及一些地名是必要的,后续如果整理出来了,我应该会放到专栏文章里,毕竟都是公开语料上做的

76440
领券