我是NLP的新手,我使用斯坦福NER工具对一些随机文本进行分类,以提取软件编程中使用的特殊关键字。
问题是,我不知道如何改变分类器和文本注解器来识别软件编程关键字。例如:
today Java used in different operating systems (Windows, Linux, ..)
分类结果应包括:
Java "Programming_Language"
Windows "Operating_System"
Linux "Operating_system"
请您帮助我如何定制StanfordNER分类器以满足我的需要?
当我试图对我的数据使用Logistic分类器时,我似乎不明白为什么我要得到一个IndexOutOfBoundsException。
当我运行这个程序的时候我就知道了。
java.lang.IndexOutOfBoundsException: Index: 11, Size: 11
at java.util.ArrayList.rangeCheck(Unknown Source)
at java.util.ArrayList.get(Unknown Source)
at weka.core.Instances.attribute(Instances.java:341)
at weka.filte
我正在试着做一个用对推特的情绪进行分类的应用。我想比较朴素贝叶斯和SMO分类器的结果。虽然朴素贝叶斯运行良好,但SMO崩溃并出现以下错误:
java.lang.ArrayIndexOutOfBoundsException: 6786
at weka.core.SparseInstance.toDoubleArray(SparseInstance.java:425)
at weka.filters.unsupervised.attribute.Normalize.batchFinished(Normalize.java:283)
at weka.filters.Filte
我正在将Weka集成到为另一个应用程序编写的插件中。我将weka.jar包含在我的类路径中,并且在很大程度上,事情似乎运行得很好。不幸的是,当我要更改某些分类器的选项时,我遇到了无法找到某些类的特定问题。例如,当我尝试在AdaBoost选项中更改分类器的名称时,我得到一个错误,结果如下:
java.lang.Exception: Can't find a permissible class called: weka.classifiers.bayes.BayesNet
Model options set to: -P 50 -S 1 -I 10 -W weka.classifiers.
我用的是Weka 3.7.12。一旦我更新了所有可用的软件包在Weka,我不能打开分类对话框在Weka。我能够在Weka中加载和预处理数据.但是,每当我想要执行分类时,Weka都会产生以下错误:
线程"Thread-159“中的异常org.rosuda.JRI.Rengine.rniSetupR([Ljava/lang/String;:java.lang.UnsatisfiedLinkErrororg.rosuda.JRI.Rengine.setupR(Rengine.java:170) org.rosuda.JRI.Rengine.run(Rengine.java:635) at