我是NLP的新手,我使用斯坦福NER工具对一些随机文本进行分类,以提取软件编程中使用的特殊关键字。
问题是,我不知道如何改变分类器和文本注解器来识别软件编程关键字。例如:
today Java used in different operating systems (Windows, Linux, ..)
分类结果应包括:
Java "Programming_Language"
Windows "Operating_System"
Linux "Operating_system"
请您帮助我如何定制StanfordNER分类器以满足我的需要?
我想打印出那本未分类的字典,但它是按顺序排列的。
这是我使用的代码(2.7.5Linux版本):
# id and name array are not the actual input. It is just a sample input. (So no hard-coding please)
# More importantly, I just want to figure out how to have the unsorted dictionary.
id = [1 ,4, 2]
name = ["John" , "Mary", "Alic
我有以下数据:
Rank Platforms Technology
high Windows||Linux Unity
high Linux
low Windows Unreal
low Linux||MacOs GameMakerStudio||Unity||Unreal
low GameMakerStudio
Platforms和Technology都是分类变量。这里的问题是它们可以有一个,或者是空的,或者,特别是像GameMakerStud
红帽是从哪里来的?它是直接源自发行版(2年前),还是源于BSD或System?我只是想知道如何在Linux世界中对Redhat进行分类。
1991
Linus Torvalds releases the Linux® kernel.
1993
Bob Young incorporates ACC Corporation, a catalog business
that sells Linux and UNIX software accessories and books,
and distributes a magazine called New York UNIX.
1994
Marc
我正在为一个问题寻找一个更好的解决方案,我昨天解决了,但我不高兴;)
My :使用创建一个功能齐全的更新站点(可用于更新和目标平台定义)
My problem:Nexus的P2站点的原始扩展只考虑插件()
不幸的是,考虑功能的叉子也过时了。但我在找到了一个解决办法。如果对插件进行了分类,则可以使用Eclipse安装它。
因此,我寻找一种方法来分类我的插件。我使用Tycho构建,但是Nexus不考虑Tycho的元数据。所以我不得不想办法让Nexus对我的插件进行分类,而不是Tycho。最终,我的 P2桥插件,并添加一个默认的类别到每个插件。此外,我们还可以用这种方式省略功能!
使用Eclipse