如何使用DataFrame限制一列中的字符串(字符/单词)数量_如何限制Ruby字符串显示的单词数量？_如何限制XSLT中的单词数量？ - 腾讯云开发者社区

python、pandas、dataframe

这个问题类似于，但有一个不同之处:这里不是单个值，而是在一列dataframe中列出了一个值。假设我们有一只熊猫数据，其中有一个名为words的专栏。它包含文档中可用的单词索引。例如，在下面的dataframe中，有两个文档，其中第一个包含单词['a','b']，第二个包含['a','c','d']。 df = pd.DataFrame() df['words'] = [['a','b'],['a','c','d']]

浏览 2提问于2017-12-29得票数 0

回答已采纳

1回答

如何比较熊猫数据帧中的行？

python、python-3.x、pandas、dataframe、nlp

我有一只有两个栏的熊猫df。其中一个列包含单词字符串，一个列包含单个单词。我需要比较这两列，看看“Col_1”中的字符串是否包含“Col_2”中的单词，然后创建另一列，其中包含该元素的索引。这就是我所拥有的： data = {'Col_1': ['A B C D', 'A B C', 'A B C'], 'Col_2': ['D', 'B', 'Z']} df = pd.DataFrame(data) print (df) 这就是我需要的： data =

浏览 5提问于2022-02-18得票数 0

4回答

用Python中常见的拼写错误列表替换dataframe中的单词？

python、pandas、dataframe、replace

我有一个大型数据集，其中有一列包含频繁拼写错误的多单词名称。我们有一个单独的数据，有一列常见的拼写错误。我们希望用一个正确的拼写替换大数据集中的所有拼写错误。这就是我到目前为止尝试过的(使用简化的数据集)。它确实取代了这个词，但我发现每次都有额外的字符出现在单词的末尾。我相信，每次它发现一个常见的拼写错误时，它都会替换这个单词(但不是整个单词)，但如果它与拼写错误(但不一定是全名的拼写错误)完全匹配，我希望它替换整个单词。我猜我能用regex做点什么吗？ df = pd.DataFrame({'city': ['City of Cleveland', '

浏览 32提问于2022-09-21得票数 0

1回答

使用正则表达式匹配dataframe中的列

pandas、dataframe

希望执行正则表达式函数来将一列数据帧与另一列数据帧的第一个单词进行匹配。这些数据帧来自不同的来源，因此药物的名称相似，但并不完全匹配。如果忽略大小写并匹配第一个单词，它们就会匹配。我有两个数据帧:一个是药品名称，另一个是药品名称和各自价格的列表。出于举例的目的，水果被添加到药品名称中。 Dataframe A drug 0 drug1 apple 1 drug2 orange 2 drug3 lemon 3 drug4 peach Dataframe B drugB price Regex 0 DRUG2 2 ^([\w\-]+)

浏览 49提问于2019-08-13得票数 0

2回答

所有熊猫细胞的Lemmatization

python、pandas

我有一个熊猫数据帧。有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。如何使用nltk库有效地计算所有这些单词的引理？ import nltk nltk.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。我的数据看起来类似于： import pandas as pd data = [[['walked','am','stressed',

浏览 1提问于2017-11-30得票数 11

回答已采纳

2回答

循环遍历并替换数据帧中的文本

我有一个dataframe，它由一个包含多个单词的变量组成，如： variable "hello my name is this" "greetings friend" 另一个由两列组成的dataframe，其中一列是单词，另一列是这些单词的替代，例如： word "hello" "greetings" 替换： replacement "hi" "hi" 我试图找到一种简单的方法，用替换词替换“变量”中的单词，遍历所有的观察结果，以及每个观察中的所有单词。预期的结果是： variable

浏览 1提问于2017-10-27得票数 1

回答已采纳

3回答

如何根据列值的长度过滤数据框行

python、python-3.x、pandas、dataframe

我有一个dataframe，其中一列包含以下字符串： df=pd.DataFrame(['Hello world', 'World is good', 'Worldisnice hello'], columns=['A']) df A 0 'Hello world' 1 'World is good' 2 'Worldisnice hello' 我正在尝试获取包含一个长度为11个字符的单词的行我使用下面的

浏览 7提问于2021-01-09得票数 2

1回答

如何获得字符串数组数据的计数矢量化

python、pandas

我有一个dataframe df1如下所示： words_separated 0 [lorem, ipsum] 1 [dolor, sit, amet] 2 [lorem, ipsum, dolor, sit, lorem] 因此，每一行都包含一个单词数组。我想要一些类似于数据df2的东西 lorem, ipsum, dolor, sit, amet 0 1, 1, 0, 0, 0 1 0, 0, 1, 1, 1 2 2, 1, 1, 1, 1 因此，df2将为df1中出

浏览 3提问于2022-06-30得票数 0

2回答

将单词列表(在数据帧内)转换为一组单词

python、pandas、dataframe

在我的dataframe中，我有一列数据，比如cell，protein，expression，我想把它转换成一组单词，比如cell，protein，expression，它应该应用于整个dataframe列。请建议做这件事的可能方法。

浏览 0提问于2018-12-24得票数 0

3回答

统计Dataframe的每一列中非NaN条目的数量

python、pandas、dataframe、count、nan

我有一个非常大的DataFrame，我想知道是否有短的(一个或两个)方法来获得DataFrame中非NaN条目的计数。我不想一次写一列，因为我有将近1000列。 df1 = pd.DataFrame([(1,2,None),(None,4,None),(5,None,7),(5,None,None)], columns=['a','b','d'], index = ['A', 'B','C','D']) a b d A

浏览 8提问于2015-04-30得票数 96

1回答

如何使用MySql命令行将字符串转换为表的多行

mysql

我有一根绳子， “这是刺痛，我不知道我有多长时间” 我希望将字符串中的每个单词转换为sql表的一行，以便得到：这是一个字符串和我别知道等等。我需要能够用MySql命令行来完成这个任务。(我还需要一个相邻的列来填充每一行中的一列，以防帮助/改变您的答案)我想我可以使用INSERT String (Words, num) Values (@words, 1)，但是我不知道如何让它添加每个单词。有什么简单的方法吗？若否，如何处理呢？

浏览 1提问于2012-06-11得票数 1

1回答

熊猫数据串

python、arrays、string、pandas、dataframe

我的dataframe中有这一列，例如，它的字符串中有数字，比如"6,22,67,82"。我希望将这些字符串拆分为整数数组，并将数组保存在dataframe中。 h['htgt']=h['htgt'].split() 这不起作用，因为它试图分裂整个系列。

浏览 0提问于2018-09-07得票数 0

回答已采纳

1回答

如何在excel中复制包含字符串的单元格

excel、excel-formula

如果下一列中的单元格包含某个字符串，我如何在新工作表中复制同一列中的某些单元格？假设我有这两列，如果第二列中的单词是ALPHA，我想创建一个只包含数字的新列表： 1 ALPHA 2 BETA 3 ALPHA 4 ALPHA 5 GAMMA 6 DELTA 7 ALPHA 如何自动创建这样的新列表？ 1 3 4 7 列表应该会自动更新，这意味着我不希望在新列表的结果中出现空单元格

浏览 5提问于2014-11-10得票数 2

2回答

如何gsub匹配字符串，同时删除不匹配的字符串？

r、lapply、gsub

我有一个包含一列字符串列的dataframe，我希望将其进一步标记为以下类别:城市、国家和大陆。我使用gsub将所有城市替换为"City“，将所有国家替换为"Country”，将所有大陆替换为“Continent”。 #This is what I have dataframe Color Letter Words red A Paris,Asia,parrot,Antarctica,North America,cat,lizard blue A Panama,New York,Africa,dog,T

浏览 24提问于2019-06-04得票数 0

回答已采纳

2回答

我想把我的文本分成两部分-- asp.net

asp.net、javascript

以下是问题所在：我有几个页面，从数据库中获取其内容。内容显示在asp.net页上的文本控件中。这篇文章有时会很长，所以我想使用客户端脚本将内容分成两部分。不幸的是，我不能更改查询以拉取部分数据。所有的数据都必须要出来。我想要的是，当页面()或任何其他页面打开时，我在该文本控件中显示前500个单词。在500个单词下面生成一个链接，上面写着“单击此处查看更多...” 单击此链接时，将发生回发，此时会向用户显示整个内容。我知道需要额外的往返，但这对我的用户来说是可以的。如何创建这样的功能？请帮我写一下脚本。谢谢。

浏览 3提问于2009-07-03得票数 0

回答已采纳

2回答

用特定值替换空字符串单元格

spss

正如您所看到的，我在SPSS中有一个数据库，并且我遇到了一个问题，其中一列有空单元格。现在的问题是，该列中的数据类型是字符串。如果它是数字/整数，那么有很多视频展示了如何做到这一点，但没有一个是字符串单元格。我想用单词"null“或"none”填充空字符串单元格，但我找不到这样做的方法。帮助!

浏览 0提问于2020-03-10得票数 2

1回答

如果我有一个指向字符串(单词)的指针数组，我如何才能单独访问每个单词？

c、string、function、pointers

我正在写一个函数，它接收一个空的指针数组，该函数最多应该扫描的单词的数量( size )(顺便说一下，它可以扫描小于大小的单词)，以及单词的最大长度(我应该确保单词不会超过这个长度)。这是我的代码(我使用的是C&带箭头的行会给出一个错误)： void read_words(char* words[], int size, int max_str_len) { int i=0; while( (i<size ) && (scanf("%s", & *words[i]) != EOF )) { 1->

浏览 17提问于2021-06-08得票数 0

1回答

如果用户使用javascript键入了一系列单词，则为“检测”

javascript、jquery

我试着在我的网站上做一个复活节彩蛋，我想检测用户是否在30秒内按顺序输入了一些单词。这些单词不会在任何文本区域或输入中输入，就像你在页面上键入‘hello im Darius’一样，或者你在页面上四处张望，然后开始打字，计时器就开始了。我想这将类似于$(document).keyup(){...，但我不知道如何在给定的时间内按顺序追踪所有的单词。JQuery或vanilla，但如果可能的话，我更喜欢jquery。谢谢各位。编辑:这是我到目前为止所拥有的： $(document).keypress(function(event){ if (hotwords && timer)

浏览 6提问于2021-03-26得票数 0

回答已采纳

1回答

如果Pandas DataFrame列是一个长度不同的字符串，如何将该列拆分为多个列？

python、pandas、dataframe、split

我有一个Pandas DataFrame，它是通过读取带有表格的PDF表格创建的。PDF的解析并不完美，因此我最后在结果的DataFrame中将几个表列擦成了一个列。问题是PDF中的表列之一是文本，因此有时有一个词，有时有两个单词组成该列。示例： Col_1 Col_2 0 Hello X Y A 1 Hello world Q R B 2 Hi S T C 我想将Col_1分成3列。我不知道如何做到这一点，因为第一列有时由一个单词组成，如行0& 2，有时由两个单词组成，如第1行。我尝试过用Col_

浏览 3提问于2021-12-03得票数 1

回答已采纳

1回答

如何在nltk-collocation-finder的单词列表中转换pandas数据帧？

python、pandas、nltk、collocation

作为一名语言学家和python初学者，我希望在我自己的(德语)tweet语料库中找到单词搭配。如何将pandas dataframe (只有一列= tweet)中的tweet转换为单词列表，以便能够使用nltk-collocation-finder？我的版本(如下)创建了一个字母列表，而不是单词列表，只给出了字母搭配。任何建议都是很棒的！这就是我到目前为止所知道的： import pandas as pd data = pd.read_csv("tweets.csv") import regex as re def cleaningTweets(twt): twt

浏览 2提问于2021-04-04得票数 2

2回答

从特定列中移除单词(字母后面跟着空格)

text-processing、awk、grep、regular-expression

我有一个文件，格式如下： cat dog AHF123432 | 123432 | dhfshfjdh lion AFG23412 |23412 | dfshjhfjdhj 我需要从只包含字母的第一列中删除这些单词，即猫(后面是空格)和第一行的狗和第二行的狮子。我的输出将类似于： AHF123432 | 123432 | dhfshfjdh AFG23412 | 23412 | dhfshfjdh

浏览 0提问于2015-08-12得票数 1

回答已采纳

6回答

我怎么才能去掉标点符号，然后把单词一分为二呢？

python

我怎样才能把一个包含标点符号的单词分成两个不带标点符号的单词呢？例如，如果我有一个字符串"half-attained"，我如何使它可以去掉"-“，以及将单词拆分成"half”和"attained“。这就是我到目前为止所做的，它只删除了标点符号，并将单词放在一起。 for n in range(0,len(test_list)): no_punct = "" for char in test_list[n]: if char not in punctuations: no_punct = no_punct

浏览 0提问于2020-01-17得票数 1

2回答

查找每行的字数

string、r、apply

比方说，我想要找到数据帧每行中的字数。因此，在下面的示例中，我想找出第一列中的第一个值有3个单词，第二个值有4个单词，依此类推。我假设这是一个应用函数的任务，但是我没什么运气能弄清楚这个问题。 dat = data.frame(one=c("That is Cool", "I like my bank", "He likes pizza", "What")) 我是否需要使用strsplit()，还是在创建函数时使用apply()函数更好：apply(dat, 1, function(x)...

浏览 0提问于2011-06-03得票数 3

回答已采纳

1回答

是否有方法将用户输入的单词(用排字)映射到标准单词列表？

nlp、k-means、supervised-learning

现在，我有了一个数据集，其中有一列标准单词和一列用户输入的单词，例如，如果标准单词是"Heinz ketchup"，而用户的列是"heinz Ketchup“、"heinz”、"heinzketchup“、”Heinz沙司“，是这样的；我如何将用户输入的单词映射到标准单词？

浏览 3提问于2022-05-18得票数 0

2回答

删除括号前的字符，但删除R中前面的逗号之后的字符

r、regex、regex-lookarounds、lookbehind

我有以下数据： df<-c("red apples,(golden,red delicious),bananas,(cavendish,lady finger),golden pears","yellow pineapples,red tomatoes,(roma,vine),orange carrots") 我希望删除逗号和括号前的单词，以便输出： [1] "golden,red delicious),cavendish,lady finger),golden pears" "yellow pineapples,roma,vine

浏览 2提问于2020-08-06得票数 2

回答已采纳

3回答

根据两列之间的匹配值(确切值)筛选数据帧

r、dataframe、match

我有一个有两列的数据文件。一列包含句子列表，另一列包含单词。例如： words sentences loose Loose connection several times a day on my tablet. loud People don't speak loud or clear enough to hear voicemails vice I strongly advice you to fix this issue advice I strongly advice you to fix this issue 现在，我希望过滤这个数据框架，这样我只能

浏览 9提问于2016-09-30得票数 1

回答已采纳

2回答

将@user与正则表达式进行匹配

python、regex、twitter

如何匹配以@开头、以;、.、:或结尾的单词？单词可以包含任何字母数字字符，并且可以由下划线组成。我已经提出了^@([a-zA-Z0-9_])*[:;, ]$，它似乎只适用于单个单词的句子。

浏览 0提问于2012-06-11得票数 1

回答已采纳

1回答

在嵌套的for循环中添加数据框列

python、numpy、for-loop

我最近问了这个问题：Add new columns to a dataframe in for loop，但是问错了。我能够编写一个for循环，该循环每次向dataframe中添加一行，如下面的示例所示： from random import randint import numpy as np dataframe = [] for i in range(2): value = randint(0,10) for j in range(2): mean = np.mean(value) dataframe.append(mean) cols=['mean&#

浏览 27提问于2021-11-03得票数 0

回答已采纳

2回答

使用熊猫打印为csv时，从字符串数组中移除括号

python、pandas、csv

我想写一个.csv文件。其中一列是“单词”。每个类别的单词都排在一起，单元格“word”有一个单词列表，我将其读为： words = [] for i in range(len(category)): r = requests.post(base_url+'/'+url[i]) if r.ok: data = r.content.decode('utf8') words.append(pd.Series.tolist((pd.read_csv(io.StringIO(data), squeeze=True))

浏览 0提问于2019-05-13得票数 0

回答已采纳

3回答

Pandas:如果变量为true，则返回功能名称

python、string、pandas、boolean、filtering

我有一个大约2M字符串的列表和一个大约800个单词的列表。我已经创建了一个数据帧，其中字符串作为行，单词作为列。除了字符串变量之外，所有其他变量都是true或false值，与单词是否在字符串中相对应。不存在缺失值。即 import pandas as pd df = pd.DataFrame({'strings':['a string with california', 'a string with lobster',

浏览 21提问于2019-02-01得票数 1

回答已采纳

2回答

在R中，如何检查条目中的单词是否与另一个条目中的单词部分匹配

r、substring、match

具体来说，我想检查一列中条目的子字符串是否与另一列条目中的一个单词完全匹配，但非子字符串部分不能太长(超过四个字符)。如果我有数据 df <- data.frame("name"=c("Denzel Washington","Andrew Garfield Junior","Ryan G Gosling"),"check"=c("Denzelboss","Garfield","Goslin")) 我希望结果是 True, True, False 第一个是因为两

浏览 4提问于2017-08-02得票数 2

回答已采纳

1回答

在R中使用反连接

text-mining

我是R中的一个菜鸟，我试着比较两个数据帧，这两个数据帧是通过文本挖掘得到的，它有两列，一列有单词，另一列有计数。假设它们是dataframe1和dataframe2。我试图找出如何编写代码，以选择那些单词在dataframe2中存在，而在dataframe1中不存在。如果我们必须在excel中使用它，我们只需在dataframe2和VLOOKUP中使用word作为引用，从dataframe1中选择相同的单词列表，并选择存在的#N/A，然后根据最高计数对#N/A进行排序。下面是详细说明的图片: dataframe1 dataframe2：如您所见，C&F一词在

浏览 1提问于2021-04-23得票数 0

回答已采纳

1回答

如何计算数据数据中所有行的列列表中包含的单词数和唯一单词数？

python、pandas

我在我的熊猫数据中生成了一个列df['adjectives']，其中包含了另一个专栏df['reviews']的所有形容词的列表。 df['adjectives']的值采用这种格式，例如： ['excellent', 'better', 'big', 'unexpected', 'excellent', 'big'] 我想要创建一个新的列来统计df['adjectives']中的单词总数以及df['adjectives&

浏览 0提问于2019-07-17得票数 0

回答已采纳

3回答

在Dataframe Pandas中统计句子中最常用的100个单词

python、pandas

我在Pandas dataframe中的一列中有文本评论，我想要计算N个最频繁的单词及其频率计数(在整个列中-而不是在单个单元格中)。一种方法是使用计数器通过迭代每一行来计算单词数。有没有更好的选择？代表性数据。 0 a heartening tale of small victories and endu 1 no sophomore slump for director sam mendes w 2 if you are an actor who can relate to the sea 3 it's this memory-as-identity o

浏览 0提问于2015-04-28得票数 24

回答已采纳

1回答

在C中读入字符串

c、string

我正在寻找最有效的方法来读取文本文件中提供给我的单词集合。我正在编写的程序基本上就是拼字游戏。它将生成7个随机字母(已经完成)，然后用户需要从这些字母中输入任意数量的单词(就像拼字游戏一样)，程序将对该单词进行评分(也已经完成)。我现在面临的问题是如何读入单词。我们得到了一个包含80个单词的文件，就像这个项目的通用“字典”一样。我在考虑要么使用fopen()函数，要么手动输入单词(这会很糟糕……)。我面临着如何存储单词的另一个问题。我在想一个二维数组，其中每一列或每一行都是一个单词。有10,000个单词的限制，并且长度不能超过6个字母。任何关于如何做到这一点的提示都将是很棒的。

浏览 3提问于2012-08-27得票数 0

2回答

如何从每一列都是一个值列表的字典中生成数据帧？

python、pandas、list、dataframe、dictionary

我有一个字典，其中每个键是一个数字(索引)，每个值是一个单词列表(字符串)。我想创建一个包含两列的df，一列用于字典键的索引号，另一列用于单词列表(字典中的值)。现在我使用的是以下代码： pd.DataFrame.from_dict(tok_red_dict, orient ='index') 但这给了我一个数据帧，其中一列用于索引，一列用于单词列表中的每个单词。如何才能使每一列都包含整个列表，而不只是一个单词？

浏览 9提问于2021-05-10得票数 0

2回答

将VARCHAR列拆分为多个列

sql-server、sql-server-2014

我正在努力将列中的数据拆分为多个列。我有客户姓名的数据和数据需要清理，因为可能有重复，我也需要为未来的数据建立新的标准。我已经成功地拆分了字符串中的前两个单词，但无法拆分进一步的数据。我只有读取权限。所以我不能创建任何函数。例如：客户名称：伊利诺伊理工学院我的查询将只在一列中获取“伊利诺伊州”，而在另一列中获取“技术学院”。将分隔符视为“空格”，我希望将每个单词分隔到单独的列中。我不知道如何识别第二空间和进一步的空间。我也尝试过使用'parsename‘函数，但是我觉得它会给数据的清理带来更大的困难。 select name, left (name, CHARINDEX(&

浏览 0提问于2019-06-03得票数 1

3回答

将字符串列中的单词数和另一列中的值进行比较

apache-spark、dataframe、pyspark

我有一个星火DataFrame，由3列组成：text1、text2和number。我想根据以下约束过滤这个DataFrame： (len(text1)+len(text2))>number 其中，len返回text1或text2中的单词数。我尝试了以下几点： common_df = common_df.filter((len(common_df["text1"].str.split(" ")) + len(common_df["text2"].str.split(" "))) > common_df["n

浏览 0提问于2019-05-22得票数 0

回答已采纳

1回答

加快pandas datarame中的单词计数

python、pandas、performance、optimization、time-complexity

我有一列数据帧和一个字典，其中包含不同的类别及其对应的单词列表。我必须计算属于每个类别的单词在Pandas dataframe列中出现的次数。下面的代码对我有效，但我的真实数据集超过100k行，我的真实类别超过40个，每个类别中的单词超过500个。我花了1个多小时来运行代码。我正在尝试优化以下代码的速度。 dummy_dict={ 'psych_prob': ['he would be happy about it, but i am sad it does not make sense to her',

浏览 4提问于2021-04-19得票数 0

1回答

Pandas从一列获取值索引，以便在dataframe中应用于另一列。

python、pandas、dataframe

我有两个列的dataframe和一个单词列表。我希望通过这个列表过滤数据的一个列，并将该列的匹配行保存到一个新列表中，同时从另一个列中获取相同索引的值，以便将该值保存在第二个列表中。所以我基本上想用一列过滤我的数据，除了我有字符串，我想要和单词进行比较，所以我必须遍历它们。我的代码： dataframe: letter | sentence ---------------------------------------- L | "Lorem ipsum dolor sit amet" C | "consectetur adipiscing el

浏览 4提问于2021-03-19得票数 1

回答已采纳

1回答

使用pandas dataframe的nltk freqdist中的类型错误

python、pandas、dataframe、nltk、frequency-distribution

在对句子进行标记化之后，我尝试使用nltk的FreqDist从我的数据列(文本字符串)中获取最常用的单词。然而，在应用pandas dataframe之后，我得到了一列列表，而不是字符串。所以在运行时，我得到了错误: TypeError: unhashable type：'list‘ df['Tokenized'] = df['Description'].map(tokenize) word_dist = nltk.FreqDist(df['Tokenized']) #type error: unhashable type 现在我的标

浏览 40提问于2019-05-24得票数 0

1回答

使用迭代器创建正则表达式模式

python、regex、pandas、re

我有一个有很多列的DataFrame。每一列都有一个以该列命名的csv文件目录，但并不完全如此。列的名称包含在其文件名中，外加一些字母和单词。我要做的是为每一列创建一个正则表达式模式，以便获得文件名，将其导入pandas并合并两个Dataframe，但我无法设法将"r“放在模式前面。这就是我想要做的： import re import pandas as pd data={"one":[1,2,3,4,5],"two":[6,7,8,9,10]} left_df=pd.DataFrame(data) routes={"wordsone.cs

浏览 31提问于2020-11-08得票数 0

1回答

如何在python中拆分数据框中的数据？

python-2.7

我使用了以下代码： import pandas as pd pandas_bigram = pd.DataFrame(bigram_data) print pandas_bigram 我得到的输出如下 0 0 ashoka -**0 1 - wikipedia,**1 2 wikipedia, the**2 3 the free**2 4 free encyclopedi

浏览 4提问于2016-10-01得票数 1

1回答

如何根据包含的分号拆分df行；

python、pandas、dataframe

我的DataFrame在一行中有2个值，用分号分隔；每行(包含2个用分号分隔的值；) 如何将；之后的值拆分到下一列(其中两个值将在两列中并排)？标题##所需输出：将第一列中的第一个行值(之前的;)和第二个值(之后的;)放到下一个右列单元格中 sample of edit needed sample of my dataframe 我发现了将行值分成多行的代码(用，分隔) explode(df.assign(var1=df.var1.str.split(',')), 'var1')

浏览 23提问于2021-09-14得票数 0

2回答

部分匹配If语句Pandas

python、pandas、if-statement

我正在尝试在我的dataframe (Title)的某一列中查找部分字符串匹配。理想情况下，如果部分字符串匹配为true，我希望pandas创建一个true false列，如果字符串匹配为false，则创建false列。我想给你一个def函数，以便创建一个if/else语句，因为我的数据集非常大。如果“Title”列中有单词“dog”，那么在我的新列“Match”中的该行中放一个true。 Old Dataframe example: Title Author Name Dogs R Us John Smith Pigs can Fly Henry Wh

浏览 11提问于2017-02-16得票数 3

回答已采纳

4回答

在列表中查找单词，然后删除该单词和列中任何其他尾随的单词

python、string、pandas

如何找到列表中的单词并删除找到的单词之后的任何其他单词？例如： remove_words = ['stack', 'over', 'flow'] 输入： 0 abc test test stack yxz 1 cde test12 over ste 2 def123 flow test123 3 yup over 4562 我想从pandas dataframe列中的列表remove_words列表中找到单词，并删除这些单词和后面的任何单词。结果： 0 abc test test 1 cde test12

浏览 0提问于2018-07-13得票数 2

3回答

从Python的熊猫列的每一行中获取唯一的单词计数

python、pandas、nlp、unique

我对Python非常陌生，并试图为我的hiphop歌词NLP项目预处理一些文本数据。我有一个列在我的数据与(已经清理过的)歌词，并希望作出另一列包含长度的独特词在歌词列为每个艺术家。这是我的dataframe.tail() 我只用这段代码做了一组独特的单词。 unique_words = set() unique_wordsDF'clean_lyrics1'.str.lower().str.split().apply(unique_words.update) 打印(Unique_words) 我知道在某种程度上，我必须将set方法放到for循环中，以迭代所有的歌曲，

浏览 2提问于2022-06-02得票数 0

1回答

R-从dataframe中的列创建一个单词云

r、dataframe、word-cloud

如何从我的dataframe中的一列(它包含一些英文单词)创建一个单词云？我应该下载哪个包？以及如何将图像保存为jpeg或png文件？提前感谢！

浏览 0提问于2020-05-04得票数 0

1回答

使用Python脚本根据PowerBI中的当前数据集创建新表

python、powerbi、powerbi-datasource

我有一个csv文件作为源数据集。目前在表中有一列，我想使用Python循环并从每个单元格的字符串中提取数据。例如，在单元格中：数量变化了10，价格变化了90。我想使用Python并提取"Quantity，Price“和"10，90”来创建具有这些属性和值的新表。然后使用Python创建视觉效果，而不是使用PowerBI视觉效果。我该怎么做呢？这真的有可能吗？编辑:由于所有的混淆，我添加了一个我正在处理的专栏的屏幕截图。我想遍历Properties列中的所有行，获取每个单元格中的数据，然后提取它们以创建一个新表。例如，在本例中，新表将如下所示：属性|值未连接高

浏览 18提问于2021-03-07得票数 0

1回答

删除列包含特定子字符串的行

python、pandas、dataframe

如何消除有我不想要的单词的rown？我有这个DataFrame： index price description 0 15 Kit 10 Esponjas Para Cartuchos Jato De Tinta ... 1 15 Snap Fill Para Cartuchos Hp 60 61 122 901 21 ... 2 16 Clips Para Cartuchos Hp 21 22 60 74 75 92 93 ... 我正在尝试删除带有单词'esponja‘的行我想要一个这样的DataFrame

浏览 0提问于2020-06-09得票数 2