如何从wordnet中生成更一般的、更不一般的和等价的关系?
RitaWordnet中的wordnet相似度给出了一个类似于- 1.0,0.222或1.0的数字,但是如何得出单词之间更一般,更不一般的关系呢?哪种工具是最理想的呢?请帮帮我
我得到了java.lang.NullPointerException,在它打印出"the holonyms are“之后。
package wordnet;
import rita.wordnet.RiWordnet;
public class Main {
public static void main(String[] args) {
我正在尝试使用python在WordNet (which is Lexical database for English)中查找Synsets。
下面是我试图查找的同义词集和同义词集示例(作为参数传递):
from nltk.corpus import wordnet
synonynm=wordnet.synsets('friend')[2]#? wt does[0] mean
synonynm.name() #related synonyms wrds
synonynm.definition() #definition of passed words
wordnet.syn
我的目标是创建一个系统,能够接收任意的随机文本,提取句子,删除标点符号,然后,在简单的句子(其中一个)上,随机地用它们的meronym、holonym或synonim替换NN或VB标记的单词,以及使用来自WordNet同义词集的类似单词。前面有很多工作要做,但我一开始就有一个问题。
为此,我使用了模式和TextBlob包。这就是我迄今所做的..。
from pattern.web import URL, plaintext
from pattern.text import tokenize
from pattern.text.en import wordnet
from textblob im
我正在使用Python。我想找出代表一组词的最好的同步集。
如果我需要为“学校和办公室用品”这样的东西找到最好的同步,我不知道该怎么做。到目前为止,我已经尝试为单个单词找到同步集,然后计算出最好的最低普通超限,如下所示:
def find_best_synset(category_name):
text = word_tokenize(category_name)
tags = pos_tag(text)
node_synsets = []
for word, tag in tags:
pos = get_wordnet_pos(tag)
我正在使用(OMW) wordnet开发python/nltk,专门用于阿拉伯语。所有的函数在英语中都工作得很好,但是当我使用'arb‘标签时,我似乎无法执行其中的任何一个。唯一有效的方法是从给定的阿拉伯语同义词集中提取lemma_names。
下面的代码在u‘’arb‘上运行得很好:输出是一个阿拉伯词汇表。
for synset in wn.synsets(u'عام',lang=('arb')):
for lemma in synset.lemma_names(u'arb'):
print lemma
当我尝试
我正在做一个udemy课程(所有的例子都是英文的),但问题是当我开始使用西班牙语时,总是缺乏库或兼容性。我从https://www.datos.gov.co/Ciencia-Tecnolog-a-e-Innovaci-n/LAS-WordNet-una-WordNet-para-el-espa-ol-obtenida-c/8z8d-85m7下载了CSV格式的数据,但我正在尝试执行以下代码,但由于上下文的描述而崩溃,由于上下文的描述,有人知道如何处理它吗?谢谢 import nltk
#nltk.download("omw")
from nltk.corpus import w
首先,让我向大家介绍我的问题:对于一个项目,我必须将8000条问题分类,并将它们分为7类(宪法、体育、地理、历史、科学、教育和技术)。因为问题很短,支持向量机没有多大意义,所以我只是为每个类别创建了一个单词列表。为了提高准确性,我必须扩展这些列表,这样就可以将未标记的字符串放入类别中。在互联网上,我听说了WordNet来获取单词的同义词(这对我来说很有意义,因为我需要尽可能多的同义词)。但是现在出现了一个问题: WordNet显示在
from nltk.corpus import wordnet as wn
for synset in wn.synsets(word):
for lem
我正在使用bonsai.io,并希望将elasticsearch指向我的同义词文件。在开发过程中,这可以很好地工作,但我无法访问/var/websolr/apps/ and /current/config/将文件放在那里,Rails.root也没有给出应用程序在服务器上的绝对路径。如何在bonsai.io中使用同义词文件?有没有办法让它指向我的应用程序中的相对路径,或者甚至指向我控制的服务器上托管的同义词文件?
我正在尝试用python编写一个程序,它会对我输入的一段文字做笔记。它将整理出段落的第一句和最后一句,以及带有日期和数字的句子。然后,它会用同义词替换一些单词,并去掉无用的形容词。我知道python的泛型知识,但我对nltk和WordNet还不熟悉。我已经启动了一个原型程序,它将用所有随机的同义词替换句子中的单词,但是我一直收到一个错误,说WordNet有问题。我想我安装的是对的,但我可能错了。下面是我的代码:
import random
import sys
from nltk.corpus import wordnet
print('Enter your passage'
有没有可能找到一个单词的同义词,并根据它与基本单词的接近程度对这些同义词进行排名?下面是查找同义词的代码。我希望给每个同义词一个排名。我该怎么做呢?
import nltk
from nltk.corpus import wordnet
synonyms = []
for syn in wordnet.synsets("good"):
for l in syn.lemmas():
synonyms.append(l.name())
print(set(synonyms))