如何在Django中从数组中的单词列表中过滤句子_从列表中的句子中删除单个字母单词_识别列表中没有匹配单词的句子 - 腾讯云开发者社区

iphone、cocoa-touch、ipad

我有计划创建一个应用程序，它给我与我在我的文本中输入的文字相关的单词和句子的列表，让我详细说明。我在我的项目中有一个字典，由单词和可能的一些句子组成，然后我有一个文本box.Whenever我在该文本框中输入一些单词说我输入“玫瑰”，然后与单词相对应的单词，如“玫瑰”，“玫瑰”，“玫瑰是美丽的”等(这些单词和句子将在字典中)必须显示在列表上，当选择任何单词或句子时，则必须显示在文本框上，就像谷歌搜索引擎一样，我们输入一个单词，我们就会得到包含该单词的单词和句子的列表。因此，任何人对此有任何想法，请给我从哪里开始的方向。谢谢，克丽丝蒂

浏览 0提问于2011-05-04得票数 0

回答已采纳

2回答

如何在matlab中消除单元数组中的重复整数

arrays、matlab

我有单词*句子矩阵，其中句子有整数，表示文本文档中的句号，从这个矩阵中，我构造了1D数组，1*N表示单词，其中句子是按数排列的。一旦完成上述步骤，我就采用了交集来检查哪些单词一起出现，哪些句子中的代码如下： OccursTogether = cell(length(Out1)); for ii=1:length(Out1) for jj=ii+1:length(Out1) OccursTogether{ii,jj} = intersect(Out1{ii},Out1{jj}); end end celldisp(OccursTogether) 示例输出结果如下:第一个单词出现在句子{51016

浏览 3提问于2015-03-12得票数 0

回答已采纳

4回答

使用Python从语料库中提取句子

python、python-2.7

我正在尝试使用Python从文本中提取句子。文本中的每个单词都写在一行中，并带有与该单词相关的附加信息： Mary Noun Name loves Verb No-Name John Noun Name . Punct No-Name 句子边界用一条空线标记。我想要提取包含具有某些特定特征的单词的整个句子(例如，带有名称的句子)。到目前为止，我只提取了感兴趣的单词，而不是整个句子。我使用.readlines()逐行阅读文本。然后，我循环遍历这些行，并使用re和.split('\t')来拆分这些行，这样每一行都由一个包含3个元素的列表表示。然后，我将列表中的元素与所需的值进行匹

浏览 0提问于2012-10-16得票数 1

4回答

Python作业-比较列表

python、list

可能重复：这实际上是一个分数的家庭作业。程序使用者必须把句子写下来。而不是程序检查单词并打印错误的单词(如果错误的单词出现不止一次，程序必须只打印一次)。错误的单词必须按照句子中出现的顺序打印。我就是这么做的。但有一个问题。错误的词不是按相同的顺序排列的，而是因为内置的函数排序的缘故。是否有其他方法删除列表中的重复项？字典是从dictionary.txt导入的！！ sentence=input("Sentence:") dictionary=open("dictionary.txt", encoding="latin2").re

浏览 4提问于2012-10-21得票数 1

2回答

哪些单词需要省略？

nlp、similarity、stop-words

我正在尝试找出两个句子之间的一些相似性度量。为此，我利用了两个单词各自的语义相似性。但是字典里有很多单词是我从我的句子里造出来的。我想从句子中去掉一些我认为不能传达内容信息的单词。首先，我删除了字母较少的单词，但我不认为这是合理的，因为它还删除了一些信息丰富的单词。看看下面几个句子的部分 "Despite the fact that ..." "There's a debate such that ..." "To sum up ..." "Although ..., there is ..." 如果我有一个涉及这些单词

浏览 1提问于2012-12-20得票数 0

回答已采纳

2回答

从说话人的句子中学习SelectKBest单词

python、scikit-learn

我试图在一个包含两个发言者的句子的数据库中使用scikit-learn函数SelectKBest。我的目标是找出30个最好的词，可以作为功能分开这两个发言者，我想打印到屏幕上。这些句子存储在一个列表sentences[]中，我有关于每个句子的说话人的信息(存储在另一个列表speakers[]中)。我还需要为那些K最好的特征创建向量，并能够在这些向量上使用分类器。当前代码：(句子包含每个说话者10000句，排序) speakers = [0] * 10000 + [1] * 10000 vectorizer = TfidfVectorizer() vectors = vectorizer.

浏览 0提问于2018-12-09得票数 1

2回答

Django模板:删除下划线并大写每个单词

django、django-template-filters

Django中是否有任何过滤器可以删除下划线，也可以大写单词的每个字母或删除下划线和大写第一个句子？

浏览 3提问于2016-01-19得票数 2

回答已采纳

1回答

真的是普通的连接词，动词和代词列表吗？

nlp、word

我需要一个简单的单词列表来过滤一些句子。我只需要从句子中找到有意义的单词。如下所示： In mathematics, and more specifically in graph theory, a graph is a representation of a set of objects where some pairs of objects are connected by links. 我想得到这个： [mathematics, graph, theory, representation, set, objects, pairs, connected, links] 我想，一个真正普通的

浏览 2提问于2014-05-28得票数 0

回答已采纳

2回答

如何从单词中生成一个有意义的句子？

python、nlp、nlg

我想从单词列表中生成一个句子。我尝试过n-gram模型，但它只从已经存在的句子生成文本，即我们输入一个句子，它根据n的值输出下一个生成的单词。哪个模型将有助于仅从单词列表生成有意义的句子，以及应该使用哪个数据集来训练该模型？

浏览 8提问于2020-11-30得票数 0

2回答

如何在pandas数据帧中查找列，并在DF列中存在单词时制作列表

python、pandas、dataframe

我有一个以句子为列的数据框架，我想要做的是创建一个函数，它将在所有句子(句子列的每一行)中搜索列表中的单词：search_words = ['cat', 'dog', 'pet'] 然后，它将制作一个新的列表，其中包含每个单词的句子。例如：对于search_words列表中的其他单词，使用cat[]的句子列表、不使用cat[]的句子列表依此类推。

浏览 20提问于2021-08-29得票数 0

回答已采纳

1回答

从MYSQL数据库实时更新word云的建议

javascript、php、mysql、word-cloud

我希望创建一个动态的word云，尽可能实时地更新，从MYSQL数据库中提取单词和句子。然后，每隔几秒钟查询一次MYSQL，以更新单词云。我从谷歌找到了这个库，这对于一个静态的单词云是很好的。但不是在动态word云中当我更新单词列表数组时，比如说，我在列表数组中添加了一个单词，整个单词云就会刷新，而不仅仅是将新添加的单词添加到单词云中。那么，有什么方法可以实现动态单词云呢？谢谢你的大力帮助。

浏览 2提问于2014-03-27得票数 0

回答已采纳

1回答

如何在Django Mako模板中显示${'None'}？

python、django、mako

我正在尝试使用Mako-templates在Django网站上显示可能值列表中的单词(包括'None'，'Little‘和'More')。这三个单词中只有两个是实际呈现的。当我调用${variable}时，' None‘被解释为None，并被转换为空字符串。在故障排除中，我确定在mako模板中实际写入${'None'}会向浏览器返回一个空字符串。有没有办法让mako模板打印这个字符串？谢谢!

浏览 2提问于2012-10-02得票数 2

回答已采纳

2回答

Javascript从列表中提取不包含任何单词的句子

javascript、arrays、algorithm

我目前正在尝试从一个不包含单词列表中任何单词的列表中提取句子。列表中有字母和数字，大写和小写。我成功地提取了句子列表中包含的单词，但由于某种原因，我无法从不包含单词列表中任何单词的句子列表中提取句子。下面是输入的一些Pseaudo代码，与预期的输出相反，以使其可视化： //input var list1 = ["sentence with word1", "sentence with word2", "sentence without 3"]; var list2 = ["word1", "word2", &

浏览 5提问于2017-01-17得票数 1

回答已采纳

4回答

如何在c中动态分配结构数组？

c、file、memory-management、struct、linked-list

我想实现一个简单的单词统计程序，它将打开一个文本文件，它是作为命令行参数提供的，然后计算该文本文件中的单词数，非字母单词(例如: 1998，2-3等)的句子和段落的数量。假设两个空格之间的字符数组算作一个单词，并且非字母单词由数字、连字符等组成，则每个句子以‘’结束(点)字符，而段落则用换行符分隔。我将使用一个结构来保存每个段落的字数、非字母字数、句子数和起始行，如下所示： struct { int word; int sentence; int nonAlpha; int startingLine; struct Parag

浏览 0提问于2012-12-13得票数 1

3回答

如何在Django进行预先搜索？

python、django

目前，我在Django中工作，更确切地说是在filter方法方面。根据我的知识过滤器是这样工作的。如果我搜索“AppleiPhone7plus”，它就会在我的记录中找到整个句子，但我想以下面的方式修改这个过滤器。我希望将查询拆分成单词，然后在文档中查找要搜索的单词，就像上级查询应该返回包含"apple“和"iphone”& "7“和"plus”的记录一样。有人能告诉我如何改进我的查询吗？django的内置功能可以帮到我。我最近的代码如下. @api_view(['GET']) def Filter_Mobiles(request,q

浏览 0提问于2017-08-08得票数 0

回答已采纳

2回答

如何更快地从列表中删除包含特定单词的字符串

python、regex、list-comprehension

这里有一张sentences = ['Ask the swordsmith', 'He knows everything']的哨兵名单。目的是从单词列表lexicon = ['word', 'every', 'thing']中删除一个单词的句子。这可以通过以下列表理解来实现： newlist = [sentence for sentence in sentences if not any(word in sentence.split(' ') for word in lexicon)] 请注意，if

浏览 2提问于2020-02-25得票数 2

回答已采纳

1回答

基于RNN- LSTM语言建模的用户输入语序预测

python、nlp、deep-learning、lstm、rnn

我是深度学习和python的新手。我的任务是从用户给出的单词中预测句子的顺序。我看过很多关于单词预测的文章，但很少有关于句子预测的文章，这些文章让我了解了如何在句子中随机预测，但我必须从特定的输入为我的项目生成语义正确的句子。请帮助我，因为概念对我来说很清楚，但我发现很难code.The指向tensorflow教程解释语言模型的链接。它被设计为在给定先前上下文信息的情况下预测下一个单词。经过训练的模型将流畅地打印出有意义的句子。我想要建立一个语言模型来“从单词中预测句子的顺序”。例如，如果用户输入“苹果吃人”，我的语言模型应该能够产生语义上正确的句子i-e“人吃苹果”。

浏览 2提问于2017-08-22得票数 0

2回答

自动建议短语/句子补全

android

我正在构建一个应用程序，我想让我的应用程序能够在用户输入文本框时读取他们输入的内容，并根据到目前为止的句子向用户呈现两件事。 1)他们正在输入的可能短语的列表，以便轻松地自动完成，我猜我会使用一个预设的短语列表，我可以通过搜索来获得这些建议。 2)根据句子结构或简单地基于键入的最后一个单词，列出最有可能出现在句子中的下一个单词。我的问题是，还有其他像这样的东西吗？搜索数千个字符串以尽可能快速有效地找到匹配的最佳方法是什么？字符串应该存储在SD卡上的文本文件中，还是直接存储在代码中，或者存储在某种类型的数据库或xml文件中，甚至是cvs文件中？任何想法都会很棒

浏览 0提问于2012-11-27得票数 2

回答已采纳

2回答

用PHP中的句子删除数组中的重复单词

php、arrays、unique

我有一个包含单词和句子的字符串数组。例如： array("dog","cat","the dog is running","some other text","some","text") 我想删除重复的单词，只留下独特的单词。我想删除这些词，甚至在句子中。结果应该是： array("dog","cat","the is running","other","some","text") 我尝试了array

浏览 1提问于2019-04-10得票数 1

回答已采纳

11回答

如何使用NLTK标记器消除标点符号？

python、nlp、tokenize、nltk

我刚刚开始使用NLTK，我不太明白如何从文本中获取单词列表。如果我使用nltk.word_tokenize()，我会得到一个单词和标点符号的列表。相反，我只需要文字。我怎样才能摆脱标点符号？此外，word_tokenize不能处理多个句子:在最后一个单词上添加圆点。

浏览 0提问于2013-03-21得票数 138

4回答

从例句列表中找出具有相似相关含义的句子

nlp、natural-language-processing、google-natural-language

我希望能够找到具有相同含义的句子。我有一个疑问句，以及数百万个其他句子的长长列表。句子是单词，或者是一种被称为符号的特殊类型的单词，它只是一种表示正在谈论的对象的单词类型。例如，我的查询语句是：示例:将(x)与(y)相加(z) 我的数据库中可能已经有一个句子列表，例如: 1. (x)和(y)的和是(z) 2. (x)加上(y)等于(z) 3. (x)乘以(y)不等于(z) 4. (z)是(x)和(y)的和这个例子应该匹配我的数据库中的句子1，2，4，但不是3。另外，句子匹配应该有一些权重。这不仅仅是数学句子，任何句子都可以根据单词的意思与其他句子进行比较。我需要一些方法来比较一个句子和

浏览 2提问于2011-05-01得票数 4

回答已采纳

5回答

只在R中的句子列表中保留匹配的模式

我有句子列表和单词列表，我想更新每个句子，只保留单词列表中的单词。例如，我有以下几个词 “美国”、“英国”、“德国”、“澳大利亚”、“意大利”、“在”、“到” 以及下列句子： “我在德国住了2年”，“我从意大利搬到了美国”，“美国、英国和澳大利亚的人说英语”。我想删除单词列表中不存在的句子中的所有单词，以便预期输出如下句子：“在德国”、“意大利到美国”、“在美国、英国、澳大利亚” 我如何使用apply函数来做到这一点？ mywords=data.frame(words=c("USA","UK","Germany","Australia

浏览 0提问于2017-05-03得票数 1

回答已采纳

1回答

使用Javascript将句子/字符串中的单词随机化，并列出所有变体

javascript

我找了很多遍，但没有找到我想要做的事情。但这就是：我想在javascript中输入一个句子/字符串，并输出该语句的所有随机变体。示例输入：‘我的测试语句123’输出：‘测试我的句子123'，’我的句子123测试‘，'123句子我的测试’等等，在没有变化时停止。我已经把这个句子分成了一个数组中的单词，但是我有点拘泥于如何将单词随机化，并将它们加入到列表或新数组中的新句子中。目前为止的代码： let str = "my test sentence 123"; let words = str.split(" "); fo

浏览 4提问于2021-09-26得票数 0

回答已采纳

1回答

查找列表的子列表的长度

python、list

我目前正在编写一个程序，它需要在列表的子列表中找出单词的长度，然后将它们相加在一起。目前，我所拥有的代码可以将一个句子的列表划分为单个单词，现在我需要在子列表中找到单个单词的长度。每当我使用counter_split_list时，它都会对句子中的单词进行计数。这是我的代码： def split_by_whitespace (['It', 'is', 'a', 'truth', 'universally', 'acknowledged'], ['that', 'a',

浏览 2提问于2017-10-21得票数 0

回答已采纳

1回答

在OpenNLP中如何在标记化句子时跳过短语？

java、nlp、text-mining、opennlp

我正在使用OpenNLP JAVA API进行句子标记化，它使用空格字符对句子进行标记化，并拆分每个单词。有没有办法可以跳过某些特定单词的拆分或标记化。例如，在一个句子中。“一只敏捷的棕色狐狸跳过懒狗”。OpenNLP拆分/标记化句子为一个快的棕色狐狸跳跃结束懒人狗我想跳过单词“敏捷的棕色狐狸”和“懒狗”的标记化，因此预期的输出将是一个敏捷的棕色狐狸跳跃结束这个懒狗

浏览 1提问于2016-03-12得票数 0

2回答

在MySQL中检索3个或更少字符的单词

mysql、regex、metaphone

我有一个表，其中有一个字段，其中包含了一堆邻居的名字。其中一些社区有两个或更多单词的名字。我怎样才能得到三个或更少字符的单词列表，这些单词出现在名字中间，有三个或更多的单词？例如：湖=什么都不做，只有一个字金湖=什么都不做，只有两个字金湖=提取液本质上，当我构建metaphone句子时，我想列出一个“垃圾”单词列表来删除。

浏览 1提问于2010-12-27得票数 0

回答已采纳

1回答

从换行符分隔的不同列中的元组列表中写入文本文件

python、python-3.x、regex、pandas、nltk

我有一个数据框架，在一列中，我有一个全文，其中有多个非常长的句子。我使用NLTK对文本进行标记化，但现在我需要确保只从给定的完整单词的长列表中提取包含任意单词的句子。我写了下面的代码，但它的问题是，它不是作为一个整体检查文本中的单词，而是例如在搜索列表中找出一个给定的单词，比如'tic'，它选择一个包含单词‘统计’的句子。 symptoms = [long list of words ~ about 100] new_df = df[df['Sentence'].str.contains('|'.join(symptoms))] 就在这段代码之上

浏览 0提问于2020-10-17得票数 1

2回答

如何在elasticsearch中通过词条匹配多个单词

elasticsearch、pattern-matching、match

我对匹配多个单词的查询如下： {"query": {"bool":{"must":[{"terms":{"my_field":"word1 word2"}}]} 执行时，尽管存在以下查询的数据，但结果集为空。代替上述查询，如果我使用 {"bool":{"must":[{"terms":{"my_field":"word1"}}]} 那么elastic-search就会返回数据。如何匹配完整的句子？

浏览 0提问于2018-07-26得票数 7

1回答

从列表中查找单词列表中唯一的例句

python、string、list、sorting、substring

我有一个3000个单词的列表(大部分是唯一的)，按它们在英语中的频率排序。我还列出了3000句独特的句子。理想情况下，我希望使用Python为每个单词的使用生成一个示例语句的列表。所以每个单词都有一个句子，其中包含这个词，和它配对。但是，任何句子都不应该与多个单词配对，而且任何一个单词都不应该有多个与它相关的句子。但这是个陷阱，这是一个混乱的数据集，所以许多单词会出现在一个以上的句子中，一些单词只会出现在一个句子中，而许多单词不会出现在任何一个句子中。所以我不会得到我理想的结果。相反，我想要的是一个最理想的列表，列出与单词匹配的最多的句子。然后是被省略的句子列表。而且，理想情况下，排序列表应

浏览 5提问于2020-09-24得票数 1

1回答

在Oracle中使用值列表进行通配符搜索

oracle、plsql

我正在尝试创建一个针对表上的字段的搜索，它可以包含所有类型的字符串值的组合，例如单个单词或完整的句子。我要做的是创建一个查询，该查询在这个字段上进行搜索，并返回包含列表中的任何单词和单词组合的行作为我的谓词参数。有没有办法将此列表作为通配符搜索进行传递？

浏览 0提问于2020-06-28得票数 0

2回答

单句分类

machine-learning、nlp、nltk、lda、text-classification

我有4个不同的类别，我也有大约3000个单词，属于每个类别。现在，如果一个新的句子出现，我可以将句子拆分成单词，并获得更多与之相关的单词。所以说，对于每个新句子，我可以从句子中生成20-30个单词。现在，将这个句子归入上述类别的最好方法是什么？我知道一袋单词效果很好。我还研究了LDA，但它适用于文档，因为我有一个单词列表作为训练语料库。在LDA中，它查看word在文档中的位置。因此，我无法从LDA中获得有意义的结果。

浏览 1提问于2015-03-11得票数 0

2回答

从数据框架中的列表中移除句子中的停止词和衬垫语句

python、pandas、dataframe

是否有一种简单的方法可以从dataframe列的列表中的句子中删除某些(停止)单词，如果它们的长度小于最大长度，则(右)删除它们吗？示例： import pandas as pd stopwords = ['the', 'a', 'an'] df = pd.DataFrame(data={'sentence': [[["the", "deer", 'was', 'a', 'tasty', 'meal'], ["the"

浏览 25提问于2022-02-10得票数 0

回答已采纳

2回答

从列表中移除至少包含x值的所有数据行

python、pandas、dataframe、dictionary

我有一个有一排排句子的Dataframe。现在，我想从Dataframe中删除所有包含字典/列表中>= x (e.g. 2 or 3)字数的句子，这些词可以看上去如下：dict = {"ice", "water", "rain"} 例如，如果x=2，我想删除句子ice and water are similar to each other，因为它有字典中的两个单词，但是没有ice melts away when it's warm，因为它在字典中只有不到两个单词。我知道我能从字典中删除包含任何单词的句子： df[~df.Sente

浏览 4提问于2021-08-08得票数 1

回答已采纳

1回答

查询主键在给定范围内，辅键与给定值匹配的所有项

amazon-web-services、boto3、dynamodb-queries

我有一个存储句子的dynamoDB表。每个句子都有一个称为'id‘的主键(类型为int)和句子中每个单词的其他辅键。例如，条目"hello world“将有一些整数作为id，条目"hello"=1和"world"=1。我需要查询id在给定范围内并且包含给定单词列表中的一个单词的所有句子(words = word1，word2，word3，word4，word5)。到目前为止，我得到的查询是： while items == []: response = lyric_table.scan(

浏览 20提问于2019-05-13得票数 0