我需要的是:
匹配所有大写WORDS
将所有单词与第一个字母Capital匹配
将所有单词与字母之间的大写单词和点匹配,如F.M.I
将这个字母áéíóúÁÉÍÓÚÑñ包含在一个成功点1,2,3的单词中
排除带有首字母大写的单词列表,如:En La El Los Ese
排除所有字母大写的单词列表,如SALUD
我试图从文本文件中读取,并创建一个开始句子的种子词列表和一个包含所有相邻单词(不包括种子词)的第二个列表。
我遇到的问题是,包含撇号的单词在撇号之后被拆分,剩下的单词被省略。当它们出现在文件中时,您将如何保存它们?
文件中包含的文本:
This doesn't seem to work. Is findall or sub the correct approach? Or neither?
代码:
my_string = open('sample.txt', 'r').read()
starter = list(set(re.findall(r"
我正在尝试从以某个字母开头的单词列表中检索单词。此字母是通过变量char指定的。单词列表是使用请求从在线来源获取的。下面的代码不能正常工作。 def randomword(char):
# use char to find a word from the dictionary
print("The computer is attempting to find a word")
url = "http://www.mieliestronk.com/corncob_lowercase.txt"
res = requests.get
我必须从用户那里得到一个句子和一个整数,将这个句子分成单词。然后计算每个单词中的字符。如果每个单词的字符数超过用户输入的整数,则应打印该单词。所以如果用户输入句子"i love cats"和数字3。所有超过3个字符的单词(在本例中只有love)以及它包含的字符数(在本例中为4)都应该出现。问题是我不知道如何让程序计算每个特定单词中的字母。有没有一种方法可以把列表切成子列表,然后计算每个子列表中的字符数?
我有一个list;list_words_punc,它是input()中使用split()的所有单词的列表。然后我有另一个列表;list_words,它是同一input()中所有单词的列表,但没有标点符号(即.,?!)。sentence是input()。我希望程序检查list_words_punc中的所有单词,即每个字母都是一个字母,并且所有这些都被附加到我的新列表list_words中;任何其他标点符号都会被取消。我所犯的错误是,如果我使用for s in l: if s.isalpha(),然后将其追加到我的新列表中,该列表将将字母作为单独的单词追加,而不是在没有标点符号的情况下从sente
对我来说,这似乎不是一个小众问题,但令人惊讶的是,我在网上找不到任何关于它的东西。假设您有一个字母集(对我来说是常用字母表的前m个字母),并且您想高效地迭代字母表中的所有单词(例如,为了对它们进行一些分析)。在Python中很容易做到这一点;只需像这样做
import itertools
alphabet = 'abcdefghijklmnopqrstuvwxyz'[0:m]
for l in range(0, 200):
for word in itertools.product(alphabet, repeat=l):
#foo
然而,对于我的特定问
所以我有算法问题。假设,我们有一个单词,单词中的所有字母都必须按照它们出现的频率进行排序,从最频繁的字母开始。例如。“假设”将类似于"ppSsuoe“或"Ssppoeu”等等。
我想我应该把单词加到列表中,找到相同的字母,计算出我有多少相同的字母,并把它附加到列表的开头,只有匹配的字母可以随机打印。
但是,在逐字逐句地列出之后,我不知道该怎么办。如何找到相同的字母?如何对它们进行排序并附加到单词的开头?我应该使用临时列表吗?或者我应该用键:值字典?
name = 'Suppose'
list = []
for letter in name:
li
我正在尝试编写代码来检查用户按下的字母是否是字符串列表中任何单词的第一个字母,该列表是由urrlib从网页导入生成的,然后我有如下代码来检查pygame.init() pygame.display.set_mode((100,100))
while True:
for event in pygame.event.get():
if event.type == pygame.QUIT:
sys.exit()
if event.type == pygame.KEYDOWN:
if x[str(event.key
所以我有一个单词列表` `wordList = list ()。现在,我正在使用下面的代码计算整个列表中每个单词中的每个字母
cnt = Counter()
for words in wordList:
for letters in words:
cnt[letters]+=1
但是,我希望它以不同的方式计算。我希望这个函数能从列表中的所有单词中找到最常见的字母,但只对每个单词的每个字母计数一次(忽略某些单词可以有同一字母的多个副本的事实)。
例如,如果列表中包含“happy,harpy和hasty”,那么happy中的两个p应该只计算一次。因此,该函数应该返回
使用Python,我已经将文本文件数据块分成了如下列表(“我的列表”)。我需要弄清楚如何只提取单词记号及其相关的POS标记(包括在句子中)。我的目标是像这样的二元结构:(‘足球’,'NNP'),(‘巴尔的摩’,'NNP'),(‘拉’,'NNP'),('off',' in '),('a','IN'),(‘胜利’,'NN'),('.',‘’)。我不想看到额外的单词/字符,如'I-NP‘和'O’和':‘。然而,期间(。)逗号(,)很好
我有一个从文件导入的字符串列表(其他帖子只有一个单词或into ),我在使用嵌套循环将索引中的每几个单词分隔到自己的列表中,然后取每个单词的第一个字母来创建首字母时遇到了麻烦。 我试着拆分每个索引,并通过另一个循环处理它,以获得每个单词的第一个字母,但我得到的最接近的结果是从原始层的每个索引中提取每个第一个字母。 text = (infile.read()).splitlines()
acronym = []
separator = "."
for i in range(len(text)):
substring = [text[i]]
我在python中有一个函数,它告诉我必须接受3个参数,单词必须在手中,单词也必须在单词列表中。
def isValidWord(word, hand, wordList):
d = hand.copy()
for c in word:
d[c] = d.get(c, 0) - 1
if d[c] < 0 or word not in wordList:
return False
return sum(d.itervalues()) == 0
它在14个测试用例中有12个完美工作-
Function cal
我正在编写一个程序,当它从页面抓取HTML时,它返回HTML,我想获取所有大写字母的单词,然后将这些单词存储到数据库中。我现在的问题是,为了存储单词,我不能正确地使用算法来解析HTML的每一行。从本质上讲,这就是我正在使用的格式。您会注意到,大写字母单词总是第一位的,所以基本上我只需要查看每一行的第一个字母,然后决定整个单词是否是大写。如果是,那么我想把这个词添加到一个列表中,如果不是,那么我想转到下一个line...So,它看起来如下.
名称列表
亚伦..。
亚伯拉罕。
安吉拉..。
艾米..。
阿什利..。
AARON through ASHLEY should be add
我试着从熊猫列中提取一个选择的单词列表,这是一个段落,如果它们存在的话,创建一个只包含这些单词的列(这是指标列表)。当我应用自定义函数时,我会不断地得到随机批次的字母。下面是我尝试的一个不能工作的函数:
indicators = "|".join(("banana tree", "climate change", "warming", "dinosaurs"))
def indication_find(x):
for words in x:
if words in indicators: