用于CRF分类器的StanfordNLP训练迭代_斯坦福crf分类器的评价_显示Logistic回归分类器sklearn的训练迭代分数 - 腾讯云开发者社区

nlp、stanford-nlp

当我尝试包含StanfordNLP序列化分类器文件时，它给出了以下异常。 edu.stanford.nlp.io.RuntimeIOException: Resource or file looks like a gzip file, but is not: models/ner/default/english.all.3class.distsim.crf.ser.gz 有人能帮上忙吗？

浏览 3提问于2017-05-01得票数 0

1回答

如何将我们训练过的数据添加到现有的斯坦福NER分类器中？

stanford-nlp

我必须将我训练过的数据添加到现有的CRF分类器english.all.7class.distsim.crf.ser中。是否有任何API来提取现有模型或对其进行反序列化？谢谢

浏览 0提问于2015-11-09得票数 0

1回答

用于CRF分类器的StanfordNLP训练迭代

nlp、stanford-nlp、named-entity-recognition

我知道这是一个简单的问题。但我只是想确认一下。在CRF分类器中，训练数据集中的所有样本是否都在每次迭代中使用？

浏览 27提问于2019-03-14得票数 0

3回答

条件随机场

c++、r、matlab、image-processing、machine-learning

是否有适合于图像分类的二维(二维)条件随机场(CRF)的训练和优化算法？有没有人用过R ()中的CRF包进行图像分类？我想有一个工作的例子代码的看法。谢谢。

浏览 0提问于2011-10-18得票数 5

1回答

斯坦福NER:如何在现有的NER模型中添加我们自己的标签？

stanford-nlp、named-entity-recognition

我正试着用我自己的标签做我自己的NER分类器。我尝试使用中的指令来训练我的模型。但问题是我没有太多的训练数据。因此，我在想，是否有一种方法可以在现有的分类器中添加我们自己的标签，如english.all.3class.distsim.crf.ser，english.all.7class.distsim.crf.ser等。我可以为我自己的标签训练分类器。请在这方面帮助我。提前谢谢你。

浏览 18提问于2015-02-07得票数 0

1回答

如何构建StanfordNER分类器

machine-learning、nlp、classification、stanford-nlp、named-entity-recognition

我正在使用StanfordNER分类器。有4个分类器 english.all.3class.distsim.crf.ser.gz english.muc.7class.distsim.crf.ser.gz english.conll.4class.distsim.crf.ser.gz example.serialized.ncc.ncc.ser.gz 这些分类器是如何建立的？因为它们都是基于不同的语料库，所以我猜在语料库上训练一个机器学习分类器，如SVM和OVR (用于多标签案例)，以检测ORGANIZATION、PERSON、LOCATION等实体，这意味着训练数据将是语料库中文档的完

浏览 3提问于2016-01-22得票数 2

回答已采纳

1回答

OpenNLP与StanfordNLP中的词性标注

nlp、stanford-nlp、opennlp、part-of-speech

我对词性( pos )标签是个新手，我正在对一个文本文档进行pos标签。为此，我正在考虑使用OpenNLP或StanfordNLP。对于StanfordNLP，我使用MaxentTagger，并使用english-left3words-distsim.tagger对其进行训练。在OpenNLP中，我使用POSModel，并使用en-pos-maxent.bin对其进行训练。这两个标记器(MaxentTagger和POSTagger)和训练集(english-left3words-distsim.tagger和en-pos-maxent.bin)有何不同，哪一个通常会提供更好的结果。

浏览 0提问于2015-10-18得票数 0

1回答

条件随机场实际上是什么？

python、named-entity-recognition、crf

我是机器学习方面的新成员，特别是在条件随机场中。我读过几篇文章和论文，里面总是与HMM和序列分类相关。我不太懂数学，尤其是在烦人的formula.So里，我不能理解这个过程我要从哪里开始？我想使用CRF开发一个名为实体识别(NER)的信息提取应用程序。我得到了一些教程：但是我不知道每一步的散文，比如训练散文，评价和测试还有一件事让我感到困惑： crf = sklearn_crfsuite.CRF( algorithm='lbfgs', c1=0.1, c2=0.1, max_iterations=20, all_pos

浏览 1提问于2019-07-14得票数 0

1回答

具有长度为1的训练序列的条件随机场只是Maxent模型吗？

machine-learning、classification、crf、maxent

我正在尝试执行分类过程，其中我的训练数据如下所示： (状态，(feature_1，feature_2，feature_3，...，feature_n)) 因此，给定一组特征，我需要预测这些特征最可能对应的状态/标签/类。我有一个很好的模型，可以非常快速地制作CRF，但是CRF真的很适合这种学习吗？我过去使用CRF表示状态序列，也就是说，$nth$状态的标签也可能取决于前$n-1$状态的标签/特征。例如，下面是我用来预测儿童语音输出的训练序列，给出了成人IPA转录： e Adult=e __BOS__ i Adult=- d Adult=d r Adult=- i Adul

浏览 4提问于2014-09-18得票数 0

2回答

使用Stanford训练模型时的Classpath错误

nlp、stanford-nlp

当我想训练我的NER模型时，我会得到一个类路径错误：加载JAR-内部分类器/edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz .线程“主”java.lang.RuntimeException中的异常:错误从jar文件加载分类器(很可能不是从jar文件中运行此代码，或者命名分类器没有存储在jar文件中) 我使用这个命令行： java -cp“斯坦福-ner.jar:lib/*”edu.stanford.nlp.ie.crf.CRFClassifier /edu.stanford.nlp.ie.crf.CR

浏览 9提问于2016-06-24得票数 0

回答已采纳

1回答

评估Stanford并以编程方式计算精度/召回

java、stanford-nlp

Stanford是否有类/方法来计算Java (而不是命令行)的精确/召回？我已经能够用Java对我的培训数据进行如下培训： Properties props = StringUtils.propFileToProperties("classifierTraining/austen.prop"); SeqClassifierFlags flags = new SeqClassifierFlags(props); CRFClassifier<CoreLabel> crf = new CRFClassifier<CoreLabel>(flags); crf

浏览 1提问于2017-01-27得票数 3

2回答

使用CRF++时，MIRA适用于我，但CRF-L1和CRF-L2不适用

windows、crf++

这可能无关紧要，但我使用的是CRF++ 0.58的windows发行版。因此，我已经成功地使用mallet训练了一个具有CRF的模型，然后对其进行了测试。当我尝试在CRF++中使用相同的训练和测试文件时(并且在创建模板文件之后)，我得到一个 The line search routine mcsrch failed: error code:0 当我使用以下任一选项时出错 -a CRF-L1 或缺省设置 -a CRF-L2 当我使用 -a MIRA 尽管如此，训练没有错误，测试也是如此。对于mallet和crf++，测试和训练数据的格式可以是相同的，所以这不是问题所在。我的模板文件很简单，就

浏览 6提问于2013-04-26得票数 1

回答已采纳

2回答

训练一个非英语的斯坦福NER模型

stanford-nlp、named-entity-recognition、french

我看到了一些关于培训斯坦福大学的其他语言的帖子。例如：然而，斯坦福CRF分类器使用了一些与语言相关的功能(例如:Speech标签的一部分)。我们真的可以使用相同的Jar文件训练非英语模型吗？

浏览 6提问于2018-10-09得票数 1

1回答

在Stanford NER中添加全名标签

php、named-entity-recognition

我正在尝试将全名标记为完整的标记(一个人)，而不是单独的标记。下面是一个例子。 (斯坦福NER online) 穆罕默德·阿里是一位伟大的拳击手。阿里最大的对手是乔·弗雷泽。这个名字也可以写成M. Ali和J. Frazier。这是我现有的PHP代码` $text = "Muhammad Ali was a great boxer. Ali's greatest rival was Joe Frazier. The name can also be written as M. Ali and J. Frazier"; $pos = new \StanfordN

浏览 0提问于2014-09-15得票数 2

1回答

StanfordNLP:无法使用7-class-ner标识日期

nlp、stanford-nlp

我使用stanfordNLP从文本中获取日期实体。这是我尝试过的代码： import java.io.IOException; import java.util.List; import edu.stanford.nlp.ie.AbstractSequenceClassifier; import edu.stanford.nlp.ie.crf.CRFClassifier; import edu.stanford.nlp.ling.CoreAnnotations; import edu.stanford.nlp.ling.CoreLabel; public class StanfordNLP

浏览 18提问于2020-07-22得票数 0

1回答

我怎样才能培养我自己的中国人模特呢？

stanford-nlp、named-entity-recognition

我正在尝试用来训练我自己的中文NER模型。我将数据转换为一行一个汉字，并在字符后面标注实体，它喜欢：红ORG 帽ORG 首O 席O 执O 行O 官O 吉姆人怀特赫斯特人曾O 表O 示O ，O 亚ORG 马ORG 逊ORG 公O 共O 云O 有O 许O 多O ..。在使用命令java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -prop tech.prop之后，它最终生成了类符(chinese.misc.distsim.crf.ser.gz)。然后，我检查了类函数在带注释的测试数据上的工作方式，我使用了

浏览 4提问于2017-05-23得票数 1

1回答

Cleartk - Mallet分类器在0个实例上训练，尽管那里有数据

uima、cleartk

我正在使用Cleartk (V.2.0) simple pipeline为CAS中的单个句子开发二进制分类器。然而，即使生成了训练数据，分类器在训练期间也不会拾取它，请参见下面的内容。我正在使用，特别是下面的代码片段： AnalysisEngineFactory.createPrimitiveDescription( <name-of-your-cleartk-annotator>.class, CleartkAnnotator.PARAM_IS_TRAINING, true, DirectoryDataWriterFactory.PARAM_OUTPUT

浏览 1提问于2014-10-03得票数 0

2回答

Mallet CRF SimpleTagger性能调优

machine-learning、nlp、mallet、crf

对于使用过条件随机场(CRF)的Java库Mallet的SimpleTagger类的任何人来说，这是一个问题。假设我已经对可用的最大CPU数量使用了多线程选项(这就是这种情况)：我应该从哪里开始，如果我需要它运行得更快，我应该做些什么？一个相关的问题是，是否有一种方法可以做一些类似于随机梯度下降的事情，从而加快训练过程？我想要做的培训类型很简单： Input: Feature1 ... FeatureN SequenceLabel ... Test Data: Feature1 ... FeatureN ... Output: Feature1 ... FeatureN Sequen

浏览 0提问于2011-03-28得票数 5

回答已采纳

1回答

使用IOB标签方案为影评数据集自定义Spacy NER

machine-learning、nlp、spacy

我之前已经使用CRF++模型来识别电影评论数据集中的NER。然而，我发现spacy在使用和可视化方面非常有效。然而，这里的问题是，我如何在spacy中合并CRF++模型？如果这是不可能的，我如何使用IOB标签训练Spacy NER模型来满足我的需求？

浏览 1提问于2018-05-27得票数 0

1回答

如何在sklearn_crfsuite中设置随机种子

python、scikit-learn、random-seed、crf、crfsuite

目前，我正在尝试使用sklearn_crfsuite库来实现NER模型。培训守则简单如下： for repeat in range(10): crf = sklearn_crfsuite.CRF( algorithm='lbfgs', c1=0.1, c2=0.1, max_iterations=100,

浏览 13提问于2022-01-05得票数 0

1回答

Mallet CRF序列分类训练数据格式

java、nlp、mallet、crf

我正在尝试使用Mallet库训练CRF序列模型，但我遗漏了一些重要信息。我在的库中找到了一个示例，但是该示例没有说明输入训练数据的格式，因此我不知道如何重新创建它。 Mallet在上确实有一个数据导入示例，但这个特定的示例似乎是用于文档分类，而不是我的用例-- CRF序列模型。我尝试将输入训练数据放入中使用的形式，即 Bill CAPITALIZED noun slept non-noun here LOWERCASE STOPWORD non-noun 和表单中的测试数据 CAPITAL Al slept here 然而，根据输出日志，它似乎不是正确的格式。

浏览 4提问于2017-06-29得票数 2

回答已采纳

1回答

将自定义训练的NER模型与斯坦福CoreNLP中现有的默认模型集成

python、stanford-nlp、named-entity-recognition

我已经通过以下链接训练了语料库。 https://www.sicara.ai/blog/2018-04-25-python-train-model-NTLK-stanford-ner-tagger 数据集是一些我训练过的健康博客(英文版)。我能够成功地在我的新看不见的文本上运行这个模型。问题:我面临的问题是，我想在斯坦福CoreNLP中运行我的自定义英语NER模型和默认的英语模型。期望的结果:我希望Stanford默认模型在我自己的自定义模型NER模型之后以顺序方式运行，以处理我自己的模型遗漏的那些英语实体。

浏览 22提问于2019-09-24得票数 1

回答已采纳

4回答

读取训练数据失败: tagger.cpp (393) CRF++

c++、crf++

当我对我的训练数据(train.txt)运行CRF++时，我得到了以下错误 C:\Users\2012\Desktop\CRF_Software_Package\CRF++-0.58>crf_learn template train.d ata model CRF++: Yet Another CRF Tool Kit Copyright (C) 2005-2013 Taku Kudo, All rights reserved. reading training data: tagger.cpp(393) [feature_index_->buildFeatures(this)]

浏览 8提问于2013-06-03得票数 0

1回答

JAVA中字符串列表的机器学习分类

java、stanford-nlp、text-classification、named-entity-recognition、information-extraction

我有几个字符串列表已经被分类了 <string> <tag> 088 9102355 PHONE NUMBER 091 910255 PHONE NUMBER ... Alfred St STREET German St STREET ... RE98754TO IDENTIFIER AUX9654TO

浏览 2提问于2015-10-17得票数 1

1回答

在条件随机场中，是否必须使用与以下和前面的标记相关的特性？

machine-learning、classification、feature-selection

我正在训练CRF分类器，以便将文档行分类为标题(第一级)、标题(第二级)或简单文本。我是使用条件随机场，因为他们的能力，以说明顺序方面。在阅读一些教程时，我注意到，通常在这些特性中，有一些与前面的标记或后续标记相关的特性。 [...] if i > 0: word1 = sent[i-1][0] postag1 = sent[i-1][1] features.update({ '-1:word.lower()': word1.lower(), '-1:wor

浏览 0提问于2019-07-12得票数 4

回答已采纳

2回答

在Java程序中使用多个分类器

java、nlp、named-entity-recognition

我正在使用斯坦福命名实体识别系统来识别我的查询中的命名实体。我发现其中一个分类器(english.all.3class.distsim.crf.ser.gz)比另一个(english.muc.7class.distsim.crf.ser.gz)更能识别人员命名的实体。而第二个分类器比第一个分类器更多地识别组织命名实体。问题是我如何修改我的代码来结合3class和7class分类器的性能。我的意思是如何将第2行和第3行合并。 public void main () { //String serializedClassifier = "classifiers/english.all

浏览 0提问于2014-03-20得票数 3

1回答

带有自定义标签的SparkNLP的NerCrfApproach

named-entity-recognition、johnsnowlabs-spark-nlp

我正在尝试使用CoNLL格式的数据集训练SparkNLP NerCrfApproach模型，该数据集具有产品实体(如I-Prod、B-Prod等)的自定义标签。然而，当使用训练好的模型进行预测时，我只得到了"O“作为所有标记的分配标签。当使用在SparkNLP研讨会示例中的CoNLL数据上训练的相同模型时，分类效果很好。(请参阅https://github.com/JohnSnowLabs/spark-nlp-workshop/tree/master/jupyter/training/english/crf-ner) 因此，问题是：NerCrfApproach是否依赖于CoNLL数据

浏览 23提问于2021-10-13得票数 0

回答已采纳

1回答

基于粒子群优化的神经网络训练的概念问题

matlab、machine-learning、neural-network、particle-swarm

利用MATLAB提供的IRIS数据库，以均方误差(MSE)为适应度函数，采用粒子群优化算法(PSO)训练4个输入、3个输出神经网络。对适应度函数进行了50次评价。实验是对特征进行分类。我有点怀疑 (1)粒子群算法迭代/代数是否等于适应度函数的计算次数？ (2)在许多论文中我看到了MSE与世代之间的训练曲线是有情节的。在图中，左边的图(a)是一个类似于NN的模型。它是一个4输入-0隐藏层-3输出认知地图.图(b)是由同一粒子群算法训练的神经网络。本文的目的是证明新模型在(a)优于神经网络中的有效性。但他们提到，实验是进行的，说周期为100次，世代为300次。在这种情况下，(a)和(b)的训

浏览 3提问于2014-04-10得票数 6

回答已采纳

3回答

渐进随机森林？

machine-learning、classification、random-forest

我正在考虑使用随机森林来解决分类问题。数据是按顺序来的。我计划使用前N(500)来训练分类器。然后，使用分类器对数据进行分类。它会犯错误，错误有时可以被记录下来。我的问题是:我可以使用这些错误分类的数据来重新训练原始分类器吗？如果我简单地将错误分类的样本添加到大小为N的原始训练集中，那么错误分类样本的重要性将被夸大，因为更正后的分类样本会被忽略。我必须使用所有数据重新训练分类器吗？还有哪些分类器可以进行这种学习？

浏览 1提问于2013-07-08得票数 1

2回答

有没有办法找到整个数据集最具代表性的样本集？

machine-learning、scikit-learn、nlp、data-science、text-classification

我正在做文本分类，我有一组200.000条推文。这个想法是手动标记一组短的推文，并训练分类器来预测其余的标签。监督学习。我想知道的是，是否有一种方法可以选择要包括在训练集中的样本，使该训练集能够很好地代表整个数据集，并且由于训练集中包含的高度多样性，经过训练的分类器具有相当大的可信度，可以应用于其余的推文。

浏览 0提问于2019-05-12得票数 2

1回答

如何利用Matlab中的PartitionedEnsemble模型预测新数据(测试集)的标签？

matlab、classification、cross-validation、ensemble-learning

我在Matlab2014a中用函数RUSBoost()训练了一个二进制分类问题的集成模型()。此函数的训练是通过函数fitensemble().的输入参数“k折叠”执行10倍交叉验证。但是，如果我使用预测(模型，Xtest)，由该函数训练的输出模型不能用于预测新数据的标签。我检查了Matlab的文档，其中说我们可以使用kfoldPredict()函数来评估训练过的模型。但是我没有通过这个函数找到新数据的任何输入。另外，我发现训练后的交叉验证模型的结构与没有交叉验证的模型是不同的。因此，可以建议我如何使用该模型，这是与交叉验证训练，以预测标签的新数据？谢谢！

浏览 3提问于2015-06-16得票数 0

0回答

如何在StanfordNLP共指解析标签中指定自己的NER分类器？

stanford-nlp

我已经训练了自己的NER分类器，现在我想用它来做共指解析。我该怎么做呢？我尝试了这个：java -Xmx5g -cp stanford-corenlp-3.7.0.jar:stanford-corenlp-models-3.7.0.jar:* edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators ner,coref -loadClassifier ./classifiers/my_classifier.ser.gz -coref.algorithm neural -file my_file.txt，但它没有工作，错误消息：java.io.I

浏览 3提问于2017-06-06得票数 0

回答已采纳

1回答

如何在Python中为CRF POS标签器添加特定功能？

python、function、language-features、pos-tagger、crf

我在Python中使用CRF词性标记器，训练英文PTB样本语料库，效果很好。现在，我想使用CRF在一个大型越南语语料库上进行训练。我需要添加一些越南功能到这个标记器，如适当的名称，日期-时间，数字，...我试了好几天，但想不出该怎么做。我已经知道数据的格式，所以这不是问题。我对Python还很陌生。因此，任何详细的答案都会很有帮助。谢谢。

浏览 4提问于2016-03-02得票数 0

1回答

如何快速制作斯坦福核心NLP API？

performance、parallel-processing、stanford-nlp

我使用斯坦福核心NLP API；我的代码如下： public class StanfordCoreNLPTool { public static StanfordCoreNLPTool instance; private Annotation annotation = new Annotation(); private Properties props = new Properties(); private PrintWriter out = new PrintWriter(System.out);; private StanfordCoreNLPTool(

浏览 2提问于2016-03-03得票数 0

回答已采纳

1回答

XGBoost培训时间似乎太长

python、machine-learning、xgboost、training-data

我正在尝试使用XGBoost包在Python语言中训练xgboost分类器。我在分类器的所有参数上使用默认值，我的训练集有大约16,000个元素和每个元素的180,000个特征。我没有使用gpu来训练模型，但尽管如此，训练过程已经花费了五个多小时，而且还在继续。我有32 I7的内存和6核的英特尔I7。我想知道现在是不是用我拥有的数据量训练这个分类器的正常时间，因为我听说有人在几分钟内训练模型。

浏览 69提问于2020-01-06得票数 1

1回答

星火在独立集群中的应用效率低下

apache-spark、apache-spark-mllib

我正试图在独立集群上运行spark应用程序。在这个应用程序中，我使用tf-以色列国防军向量训练朴素贝叶斯分类器。我以类似于这个帖子()的方式编写应用程序。主要的区别是，我将每个文档标记化并标准化： JavaRDD<Document> termDocsRdd = sc.wholeTextFiles("D:/fileFolder").flatMap(new FlatMapFunction<Tuple2<String,String>, Document>() { @Override public Iterable&

浏览 1提问于2014-12-03得票数 0

回答已采纳

1回答

使用OpenCV进行-a MIRA训练时出错

c++、opencv

我正在做我的项目手势识别使用OpenCV，C++代码。在特征提取之后，需要进行训练和测试。为此，我从CRF++下载了另一个工具包的格式。我现在使用的是crf++-0.54版本。我用的是“crf_learn -a MIRA Templatefile Trainfile Model_crf”格式。我已经准备了'.CSV‘格式的模板和训练文件。但它显示了以下错误: MIRA不支持多线程。使用thread_num=1。正在等待解决方案.........

浏览 0提问于2013-05-27得票数 0

2回答

CustomVision项目的“迭代ID”(用于MSFlow操作)？

microsoft-cognitive

我正在构建一个MSFlow，它将一个SharePoint图片库发送给一个训练有素的CustomVision分类器，然后返回一个标签(例如“绿色”、“红色”等等)；挑战：我的MSFlow "CustomVision“操作失败，声明”该项目没有默认的迭代。请提供一个迭代ID“ 在CustomVision项目的设置页面上没有任何地方显示这个IterationID！如何/在何处找到这个迭代ID (似乎是一个GUID)？

浏览 0提问于2019-03-19得票数 1

2回答

使用Mallet加载模型并对输入进行分类

nlp、tagging、mallet

我已经有了一个经过CRF训练的模型，我已经使用SimpleTagger进行了训练。 SimpleTagger.main(new String[] { "--train", "true", "--model-file", "/Desktop/crfmodel", "--threads", "8", "--training-proportion

浏览 21提问于2020-04-07得票数 2

1回答

主动学习能发现有挑战性的案例吗？

classification、active-learning

假设我们有一组数据点，需要为分类任务贴上标签。在基于池的主动学习中，如果我们采用不确定性度量，AL方法是否能够检测到具有挑战性的案例？对于具有挑战性的案例，我指的是对\hat{y}的预测得分较高的样本(例如，>90%)，但最有可能的是，\neg\hat{y}是正确的预测。我的问题背后的理由是:在训练集中增加更多的样本是否总是提高分类器的性能？

浏览 0提问于2020-10-28得票数 3

回答已采纳

1回答

为RASA NER_CRF创建良好数据集的约定

rasa-nlu、crf、named-entity-recognition

我正在尝试为一种类型的实体创建一个用于训练RASA ner_crf的数据集。为了得到好的结果，请告诉我最少的句子数。当我对每个可能的句子都有一种类型时，NER_CRF不会给出好的结果。

浏览 2提问于2018-11-23得票数 1

1回答

停止CRF++运行并恢复其运行

nlp

我在我的项目中使用CRF++作为操作系统运行在Ubuntu12.04上，我有很多功能，所以训练步骤需要几天的时间。我想知道是否有可能停止CRF++的运行几个小时，然后从最后一次迭代(而不是从头开始)恢复运行。有人能帮帮我吗？谢谢!

浏览 3提问于2012-11-02得票数 0

1回答

我以编程方式训练了斯坦福NER，但没有得到模型文件

stanford-nlp

String prop = "austen.prop"; Properties props = StringUtils.propFileToProperties(prop); String to = props.getProperty("serializeTo"); props.setProperty("serializeTo", "C:\\ner-jxy-model.ser.gz"); SeqClassifierFlags flags = new SeqClassifierFlags(props); CRFClassifier&

浏览 2提问于2014-10-26得票数 0

1回答

斯坦福大学NER 3.4.1问题

java、stanford-nlp、text-extraction

我下载了NER 3.4.1 (08-27-14发布)来训练文章的特定领域(高度技术性)。希望了解以下情况： (1)是否有可能在每个提取的实体上输出偏移量？ (2)各提取实体的置信度是否可能输出？ (3)我曾在NER3.4.1上训练过多个CRF模型，看来斯坦福GUI只能显示一个CRF模型，有没有办法显示多个CRF模型而不编写包装器？

浏览 3提问于2014-11-25得票数 1

回答已采纳

1回答

训练级联分类器，同时还包括图像注释作为特性

opencv、annotations、computer-vision、classification、training-data

我理解OpenCV的级联分类器对图像进行训练，并使用级联训练器本身从图像中提取的特性。但是，在培训中是否可以在图像上添加一些注释？例如，我有大约600个图像作为阳性样本来训练分类器，但我需要用一个附加特征的简短向量来注释每幅图像，例如“空中视图”、“平面视图”或“城市背景”或“景观背景”。是否有可能构建一个分类器，将训练器提取的特征与手动提供的注释结合起来？

浏览 2提问于2013-11-13得票数 1

回答已采纳

1回答

斯坦福大学CRF分类器培训数据的格式应该是什么？

python、parsing、text、nlp、stanford-nlp

我正在尝试使用斯坦福CRF-NER来训练我自己的地址分类器模型，但是性能很低。我对我培训过的培训数据的格式感到困惑。培训数据通常是地区、城市、省份及其各自标签的列表。但是该模型并没有将相应的地址标记标记到其令牌上。培训数据的格式如下：巴拉特省马鲁古省马鲁古省卡布平摄政 SIMEULUE摄政卡布平摄政亚齐摄政这是一个csv格式的培训数据样本，有三个标签：省、摄政区和地区。以下是标记标记的输出：您可以将所有标记标记为“区域”，尽管我有“摄政”、“区”和“省”标签数据。我想知道我的训练数据格式是否正确，因为我看到斯坦福大学NER 在

浏览 0提问于2019-05-06得票数 0

1回答

基于朴素贝叶斯和支持向量机classifierJava的斯坦福自然语言处理核心情感分析

svm、stanford-nlp、sentiment-analysis、naivebayes

嗨，我是情绪分析的新手，我目前正在使用StanfordNLP核心应用程序接口。我能够从句子中获得情感，积极的，中性的和消极的。在使用api提供的不同分类器算法时，是否有任何示例可以效仿，例如朴素贝叶斯和支持向量机，以获得不同的情感得分进行比较。谢谢。

浏览 1提问于2015-12-16得票数 0

1回答

与NER一起使用的最佳分类是什么？

classification、named-entity-recognition

我想对分类技术进行比较，但现在我只把支持向量机作为分类技术之一。除了CRF和MNB之外，还有人推荐其他技术吗？谢谢

浏览 0提问于2021-06-15得票数 0

2回答

测量分类算法的性能

artificial-intelligence、machine-learning、nlp、classification、bayesian

我手头有一个分类问题，我想用机器学习算法来解决这个问题(贝叶斯或马尔可夫，这个问题与要使用的分类器无关)。在给定大量训练实例的情况下，我正在寻找一种方法来衡量实现的分类器的性能，同时考虑到数据过拟合问题。也就是说:给定N1..100个训练样本，如果我在每个样本上运行训练算法，并使用这些完全相同的样本来测量适应度，它可能会陷入数据过拟合问题-the分类器将知道训练实例的确切答案，而没有太多的预测能力，导致适应度结果无用。一个显而易见的解决方案是将手工标记的样本分成训练样本和测试样本；我想了解选择统计上有意义的样本进行训练的方法。白皮书，书籍指针，和PDF非常感谢！

浏览 3提问于2009-01-02得票数 8

回答已采纳

1回答

线程安全还是多线程CRF在Java中支持连续变量？

java、multithreading、machine-learning

我想使用Mallet在一个相当大的数据集上以离开一序列输出的方式运行条件随机字段。因此，我需要多线程计算来处理这个计算，要么通过并行训练多个CRF来处理，要么在单个线程上对每个CRF进行训练，或者2)以多线程的方式训练每个CRF。在Mallet中，我找到了一个CRF训练器的多线程版本，它实现了选项2。然而，在我的情况下，我需要对连续变量的支持，对于这些变量，fst似乎没有支持，而且它似乎需要支持。通过一个小小的调整，我设法让GRMM处理连续的输入。然而，对于GRMM，就我所能找到的而言，似乎没有像fst那样的通过选项2来支持多线程培训。作为另一种选择，我实现了备选方案1，在该选项中，我在不

浏览 1提问于2015-09-02得票数 1

回答已采纳