我需要能够编写一个函数,该函数显示字符串中的重复单词,并按出现的顺序返回字符串列表,并忽略非字母
例如,在拥抱提示下
repetitions :: String -> [String]
repetitions > "My bag is is action packed packed."
output> ["is","packed"]
repetitions > "My name name name is Sean ."
output> ["name","name"]
有没有办法获得句子中任何选定单词周围的句子。假设我们的目标是在下面的例子中获得包含单词" champion“的当前句子,以及它周围的前一个和下一个句子,而不管它们的位置、标签或单词champion重复了多少次。 text = "This is sentence 1. We are the champions. This is sentence 3. This is sentence 4. This is sentence 5. You are champions too." 在上面的例子中,第2句和第6句中重复出现了“冠军”这个词,因此我们希望发送1、2、3、5、6,
我正在尝试用Python编写一个程序来检查文本文件中是否有重复的单词。(反过来,如果有或没有,则返回一个布尔值)
例如,我有一个名为"copy“的文本文件。在文本文件中是一行句子。“没有副本”(句子中有两个副本)
在另一个文件"nocopy“中,应该是一行"there is no nocopy”。(只有一个)
到目前为止,我已经完成了Python程序的构建:
def duplicate(fname):
'(file.txt) ==> (Boolean) Returns True if there are duplicate words'
inf
例如,我试图在python中使用regex删除带有单个重复字符的单词:
good => good
gggggggg => g
到目前为止,我尝试的是
re.sub(r'([a-z])\1+', r'\1', 'ffffffbbbbbbbqqq')
上面的解决方案的问题是它改变了good to god,我只想删除单个重复字符的单词。
我试图从给定的单词中删除元音,并返回这个单词。
例如:
word = "helleeEoo"
如果我使用如下所示的条带命令,我将得到“见鬼”的输出,而不是"hll“。
word = word.strip("aAeEiIoOuU")
但是,如果我使用join命令,如下所示,它可以正常工作:
word = ''.join(c for c in word if c not in 'aAeEiIoOuU')
我使用python 3,我想知道为什么在带状命令“e”出现在最终输出的情况下?
官方问题:编写一个控制台应用程序,它输入来自用户的句子(假设没有标点符号),然后确定并按字母顺序显示非重复的单词。对大小写字母一视同仁。提示:您可以使用不带参数的字符串方法Split,就像在sentence.Split()中一样,将一个句子拆分为包含单个单词的字符串数组。默认情况下,拆分使用空格作为分隔符。在LINQ查询的select和orderby子句中使用字符串方法ToLower来获取每个单词的小写版本。
这就是我到目前为止所知道的:
static void Main(string[] args)
{ // Creates list of type string
我在分析歌词。这些经常包含“啦啦”和“哦”。基本上是毫无意义的话。我想删除这些重复的词,或者至少先识别它们。下面是一些几乎可以完成这项工作的代码。
test <- data.frame(c("la la la yeah the meaning of life vive la France yeah yeah yeah"))
names(test) <- "V1"
test$V1 <- as.character(test$V1)
d <- unlist(strsplit(test$V1, split=" "))
test$
我编写了以下python代码来删除重复的代码:
lines_seen = set()
outfile = open("out.txt", "w")
for line in open("file.txt", "r"):
if line not in lines_seen:
outfile.write(line)
lines_seen.add(line)
outfile.close()
上面的代码正确地工作,并删除完全相同的重复,但我希望能够从一行中删除具有3个或更多精确单词匹配的重复项。例如
我正在为两个不同的查询尝试用' '查找和替换单词
查找和替换具有相同字符重复3次以上连续的单词
或
查找并替换具有的单词,任何特殊字符连续重复3次或多次。
查看以下查询:
re.findall(r'([a-zA-Z])\1{3,}', 'I doono if HELLO && AA+-AA should be here but hellllooooo or Whyyy should definitely be. So should ++, x+=-y --- ')
它给出了应该在['hellllo
我正在使用python中的regex,除了一个单词之外,我想搜索字符串中的所有单词。代码:
import re
string = "The world is too big"
print re.findall("regex", string)
如果我想得到所有单词,除了单词“太”(所以输出将是["The", "world", "is", "big"]),我如何在regex中实现这一点?
我是python的新手。 我有一个这样的字符串和列表 s='''Hello, Carry out the item with care
Louis, MS to Dallas, TX ''' LOC=['Dallas','Louis'] 如何根据字符串中单词的出现情况对列表进行排序? 所需输出: LOC =['Louis','Dallas'] 考虑到列表中的单词在字符串中不会重复多次。
早上好
我编写了一个函数,为我计算一个词的频率:
public static int tfCalculator(String[] totalterms, String termToCheck) {
int count = 0; //to count the overall occurrence of the term termToCheck
for (String s : totalterms) {
if (s.equalsIgnoreCase(termToCheck)) {
count++;
}
}
嗨,我在python中有一个压缩任务来开发代码,如果输入是
'hello its me, hello can you hear me, hello are you listening'
那么输出应该是
1,2,3,1,4,5,6,3,1,7,5,8
基本上,每个单词都被分配了一个数值,如果单词重复,那么单词也会重复。这是用python写的代码,请帮我谢谢
以以下字符串为例:
var string = "All is well if it ends well";
从这个字符串中,我想找到重复的单词,删除所有的重复,保持一个单词的出现,然后输出修改后的字符串,也可以反转。
在这个例子中,应该是:
var string = "ends it if is All"
我目前正在运行一些python代码,从列表中提取单词并创建这些单词的列表。
我使用的列表来自一个.txt文件,其中包含一些来自罗密欧和朱丽叶的行。
我在文件中阅读,修剪空格,分割每个单词,并将这些单词添加到列表中。
我现在正试图创建一个清单,其中不包括任何重复的单词。
我知道我需要创建一个循环来遍历列表,添加单词,然后丢弃重复的单词。
这是我目前的代码:
fname = input ("Enter file name: ")
#Here we check to see if the file is in the correct format
#If it is not, we
预处理器可用于使用#define将某些关键字替换为其他单词。例如,我可以执行#define name "George",每当预处理器在程序中找到'name‘时,它会将其替换为"George“。
然而,这似乎只适用于代码。我如何使用字符串和文本来实现这一点?例如,如果我在屏幕上打印"Hello I am name“,我希望”name“替换为"George”,即使它是字符串而不是代码。
我不想手动搜索字符串中的关键字,然后替换它们,而是希望使用预处理器来切换单词。
这个是可能的吗?如果是这样的话,是怎么做的?
我使用的是C++,但C语言的解决方案也是
我有一项任务,我必须在一个句子中按单词的长度打印单词。例如:
Sentence: I like programming in python because it is very fun and simple.
>>> I
>>> in it is
>>> fun and
>>> like very
>>> python simple
>>> because
如果没有重复:
Sentence: Nothing repeated here
>>> here
>>
我正在尝试根据保存在文档中的文本文件在python上创建一个列表。该列表包含英语词典中最常用的1000个单词,每个单词在文本文件中的一个新行上。
当我试着做:
wordlist = []
with open("C:\\Users\\Myname\\Documents\\words.txt") as file:
for line in file:
wordlist.append(line)
print(wordlist)
我得到的结果是:
['the\n', 'of\n', 'to\n', 'an
我想使用Python在字符串的开头去掉所有类型的标点符号。我的list包含字符串,其中一些字符串以某种标点符号开头。我如何从字符串中去掉所有类型的标点符号?
例如:如果我的单词与,,gets类似,我想从单词中删除,,,并希望结果是gets。此外,我还想从list中删除空间和numbers。我试过使用下面的代码,但它没有产生正确的结果。
如果a是一个包含一些单词的列表:
for i in range (0,len(a)):
a[i]=a[i].lstrip().rstrip()
print a[i]