如何将一个dataframe字符串列拆分成多个列？_Pyspark:拆分Spark Dataframe字符串列并循环字符串列表，将匹配的字符串分成多列_如何将pandas dataframe中多个列的摘要聚合信息作为字符串列表？ - 腾讯云开发者社区

apache-spark、pyspark

我有几个“无”值的数据框架。通过StringIndexer，将字符串列转换为浮动列后，"None“值被替换为number。问题:如何将字符串列转换为浮动列，但将“无”值保留为“无”？谢谢。 # Transform nominal attributes to numeric attributes for columnName, columnType in self.rawData.dtypes: if columnType == "string": self.rawData = PreProcess.TransformNominalToNume

浏览 1提问于2018-04-29得票数 0

2回答

大熊猫在大型数据平台上的GroupBy

python、pandas、dataframe

我有一个包含150列的dataframe。在150列中，有15列类型为string，其余都是浮动列。 dataframe包含15个字符串列组合的相同记录，rest中的值可能不同。我想在这15个字符串列上做groupby，并对所有浮动列做一个和。如何在Python中轻松地做到这一点，而无需指定groupby语句中每个列的名称，因为dataframe是巨大的。

浏览 1提问于2019-09-22得票数 0

回答已采纳

2回答

如何将Spark Dataframe的时间戳列转换为字符串列

scala、apache-spark

我想把Spark dataframe所有的时间戳列转换成字符串列。有人能告诉我如何为每个数据帧自动做到这一点吗？时间戳列的位置可以改变，每个数据帧的列名也可以不同。例如，在其中一个数据帧中，它可以是DataFrame1 columnA，但在Dataframe2中，它可以是columnX。因此，我需要在任何给定表中使用有关列类型的信息，并将其转换为字符串列。你有什么想法吗？

浏览 66提问于2019-11-08得票数 1

3回答

连接列并创建列表

python、pandas

我想连接几个列，这些列可以是字符串列表，也可以是ints列表。到目前为止，我已经这样做了； data1 = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]}) data1['D'] = [' '.join(str(row)) for row in data1[data1.columns[0:3]].values] # add a new column by concatenating the existing columns A B C

浏览 0提问于2014-01-27得票数 0

回答已采纳

1回答

如何将函数应用于所有具有特定数据类型的列

python、python-3.x、pandas、string

我有带有字符串和数字列的大DataFrame。在字符串列中，值有重音，我需要将它们转换为“普通”字母。如何将函数应用于熊猫DataFrame中的所有特定类型列(在本例中我需要所有字符串列)？ import unicodedata def strip_accents(text): try: text = unicode(text, 'utf-8') except NameError: # unicode is a default on python 3 pass text = unicodedata.normaliz

浏览 5提问于2021-06-05得票数 1

回答已采纳

2回答

熊猫圈中的多重置换

python、regex、pandas、loops

我对regex还比较陌生，我正在尝试替换Pandas DataFrame中string列中的部分字符串。挑战是，我有多个字符串类型，希望在保留其余字符串的同时从列中删除这些类型。我的代码适用于1种类型的字符串，但是当我尝试使用for循环时，代码不起作用。我不知道如何在regex表达式中指定迭代器。下面是应用于1种类型的子字符串的代码： df = pd.DataFrame({'A': ['ba ca t', 'foo', 'bait'],'B': ['abc', 'bar', &#

浏览 5提问于2019-06-20得票数 0

回答已采纳

1回答

字符串列表的Dataframe列(带groupby)

python-3.x、string、pandas、list

我有一个dataframe，我想以字符串列表的形式获取其中的一列，这样就可以从如下内容中获取数据： df = pd.DataFrame({'customer':['a','a','a','b','b'], 'location':['1','2','3','4','5']}) 我可以得到数据帧，如下所示： a ['1','2','3']

浏览 15提问于2019-09-27得票数 0

回答已采纳

1回答

在Dask dataframe中在数字列中设置零

python、dask

此代码筛选列类型为int或float的dataframe中的所有列，如果存在NaN，则填充零： df_dask = df_dask.select_dtypes(include=['int64', 'float64']) df_dask = df_dask.where(df_dask.notnull(), 0) print(df_dask.compute()) 问题是原始的dataframe有字符串列，我需要将它们保留在最后的dataframe中，但是它们被删除在第一个过滤器中。如何将所有列都设置为零，其中列为数字，值为NaN？

浏览 1提问于2021-05-25得票数 0

回答已采纳

1回答

如何使用Julia中的字符串命名数据格式中的列？

string、dataframe、julia

我试图找到一种方法来命名一个数据的列，使用来自excel或刮取web的字符串。那么，如何将“冒名”转换为下面的名称呢？ df = DataFrame(colname = [1, 2]) 我试过了 df = DataFrame(symbol("colname") = [1, 2]) 或 df = DataFrame([1, 2], [symbol("colname")]) 还有很多其他的组合，但都没有成功。我看到了与删除基于字符串列名的列有关的问题，但从一开始就没有为列命名的问题/答案。

浏览 3提问于2015-08-30得票数 7

回答已采纳

1回答

对dataframe中的每个列应用一个条件，但一些字符串列的列表除外。

python、pandas、dataframe

我正在尝试将以下计算应用于dataframe的所有列，但包含3个字符串列的列表除外。问题是，尽管下面的代码基于示例数据很好地工作，但在现实中，月份列高于100+，并且每个月都在增加，而3个字符串列是固定的。月份列表应该包含每个月将为+1的100+列，因此我只想将/100应用于除Series、和Country列之外的视图描述==‘%更改’的所有列。如何修改列表，使其只包含3个字符串列，并将.loc应用于其他所有内容。 import pandas as pd df = pd.DataFrame({ 'Series ID': ['Food', 'Dr

浏览 6提问于2022-07-18得票数 0

回答已采纳

1回答

筛选Pandas DataFrame，仅显示包含字符串列表中所有字符串的行

pandas、filter

如果我们有一个DataFrame： Column1 Column2 0 Alpha This is bananas 1 Bravo This is not 2 Charlie This is not bananas 3 Delta This is not a banana 4 Echo This is not a Banana 5 Foxtrot This is not a banananananana 我们只想从一个字符串列表中选择包含所有字符串的行，我们如何创建一个函数来过滤这些字符串呢？对案件不敏感。例如，如果我想专门为['no

浏览 1提问于2021-03-15得票数 1

4回答

如何删除熊猫列Python中字符串列表中的重复项

python、list、pandas、numpy、duplicates

我正在尝试删除Pandas DataFrame中列下的字符串列表中的重复字符串。例如，以下的列表值： [btc, btc, btc] 应该是； [btc] 但是，我尝试过多种方法，但似乎没有一种方法起作用，因为我无法访问列表中的字符串值。任何帮助都是非常感谢的。 DataFrame： dollar_sign followers_count \ 0 [btc] 35946 1 [btc] 35946 2 [btc]

浏览 0提问于2018-04-04得票数 1

回答已采纳

1回答

包含字符串列表的Python DataFrame列不会展平

python、pandas、dataframe、counter、series

我在DataFrame (production_company)中有一个列，其中有一个字符串列表，这些字符串是电影的制作公司。我想搜索所有独特的制作公司在所有电影中出现的情况。在下面的数据中，我给出了一个production_company格式的列值示例。 "['Universal Studios', 'Amblin Entertainment', 'Legendary Pictures', 'Fuji Television Network', 'Dentsu']" "['Vill

浏览 0提问于2018-08-22得票数 2

2回答

用StringLookup列表列初始化Keras StringLookup

python、pandas、tensorflow、keras、keras-layer

我在一个具有以下格式的pd.DataFrame列中有数据： col 0 ['str1', 'str2', 'str3'] 1 [] 2 ['str1'] 3 ['str20'] 我使用以下代码构造查找层： lookup_layer = tf.keras.layers.StringLookup(max_tokens=335) lookup_layer.adapt(df.col) 在以下几个方面都失败了： ValueError: Failed to convert a NumPy array to a T

浏览 14提问于2021-11-05得票数 2

回答已采纳

4回答

通过组合索引#、字符串创建列

python、pandas

我有一个包含字符串列的dataframe。我想要创建一个新列，它将索引号和字符串列组合在一个列表理解中。下面的代码在循环中执行此操作： df=pd.DataFrame({'strings': ['string1','string2','string3']}) new_col=[] for i in df['strings'].index.values: new_col.append(str(i)+','+df['strings'][i]) df['new_col

浏览 5提问于2019-10-07得票数 1

回答已采纳

1回答

ValueError:无法从内存缓冲区创建对象数组

python、pandas、dataframe、memory、valueerror

因为我在连接熊猫数据文件时有内存错误，所以我决定以附加模式将熊猫数据文件写入二进制文件，然后读取这个二进制文件以获得整个数据格式。但是，我得到了“ValueError:无法从内存缓冲区创建对象数组” 如果所有数据文件都有数字列，则不会出现此问题。但是，如果其中一个列是string (在我的例子中，我的dataframes中有许多字符串列)，那么这个值错误就会弹出。下面是说明这种情况的代码。取消注释#works1或#works2 2以确保没有错误。但是，使用#下面的dataframe不起作用给出了ValueError import pandas as pd import numpy as np

浏览 0提问于2018-10-24得票数 0

3回答

根据列中的不同条目(逗号分隔字符串列表)过滤熊猫数据框架

python、pandas、string、filter

我有一个Pandas DataFrame，其中我想对所有在"TCK“(逗号分隔字符串列表)中有不同条目的”I“进行筛选，也就是说，对于所有条目都不是相同的。我的DataFrame看起来是这样的： df1 = pd.DataFrame({"ID": [1, 2, 3, 4], "TCK": [["AA, AA, AC"], ["LL, LL"], ["DD , DB, DF, DE"], ["LO , LO, LO, LO, LO, LO"]]}) 所需的输出应该如下所示：

浏览 4提问于2022-08-29得票数 2

回答已采纳

2回答

包含列表的Pandas列上的组操作

python、pandas

我有一个DataFrame，它包含一个列props，它包含字符串列表。理想情况下，我希望按本专栏进行分组，但可以预见，当我这样做时会得到一个错误： TypeError: unhashable type: 'list' 是否有一种合理的方法来重新安排我的DataFrame以便我可以使用这些值？

浏览 4提问于2013-10-28得票数 6

回答已采纳

2回答

给定一个包含数字的字符串，提取这些数字的最佳方法是什么？

list、haskell、types

我有一个如下的字符串列表； "75"，"95 64"，"17 47 82“ 如何将其转换为Int列表； [75,95,64,17,47,82] 我的直觉是使用map和匿名函数？

浏览 0提问于2013-12-05得票数 0

2回答

如何更新基于多个str值的列

python、pandas、numpy、dataframe

我正在创建一个小型财务管理程序，它将我的事务从CSV导入到Python中。我希望根据在‘details’列中找到的字符串为一个新列‘类别’赋值。我可以做一个，但我的问题是，如果我有一个庞大的可能的字符串列表，如何做到这一点？例如，str.contains('RALPHS')将该列值替换为‘杂货’，等等。例如，下面有一个字符串列表： dining = ['CARLS', 'SUBWAY', 'DOMINOS'] 如果在我的系列中找到这些字符串中的任何一个，那么它将更新相应的类别系列，使之成为“就餐”。下面是一个可运行的小例子。

浏览 0提问于2019-06-30得票数 0

回答已采纳

1回答

如何在DataFrames中将列类型从String更改为Date？

scala、apache-spark、apache-spark-sql

我有一个数据帧，它有两列(C，D)被定义为字符串列类型，但列中的数据实际上是data。例如，列C的日期为“20150401-APR-2015”，列D的日期为“2015”。我想将它们更改为日期列类型，但我没有找到这样做的好方法。我查看了需要将Spark SQL的DataFrame中的字符串列类型转换为Date列类型的堆栈溢出。日期格式可以是"01-APR-2015“，我查看了，但它没有与日期相关的信息

浏览 1提问于2016-04-30得票数 13

回答已采纳

2回答

对列列表应用条件的数据帧过滤

pyspark、databricks

如果列表中的任何字符串列为空，我想过滤一个pyspark dataframe。 df = df.where(all([col(x)!='' for x in col_list])) ValueError: Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame boolean expressions.

浏览 16提问于2019-09-08得票数 3

回答已采纳

2回答

使用python替换dataframe字符串列中的多个单词

python

我有一个带有字符串列的DataFrame 'df‘。我正试图从这个专栏中删除一个特殊值的列表。例如，如果‘FOur4’列是:number，我希望它更改为1；如果该列是number，我希望它更改为4 我使用了以下代码： for i in ['onE','TwO','ThRee', 'FOur']: print(i) df['new_number'] = df['number'].str.replace(i,'') 尽管print(i)显示了I遍历字符串列表，但

浏览 8提问于2017-07-27得票数 1

回答已采纳

2回答

QT c++中的QStringList

c++、qt

我想将字符串列表的每一项分配给另一个字符串列表，如下所示： stringlist_1 = ("k*k1*k2" , "s*s1*s2" , "b*b1*b2") 我想让它们像这样： stringlist_2 = ("k","k","k2") stringlist_3 = ("s","s1","s2") 等等。我该怎么做呢？我用托盘使用这个代码 for (int i=0 ; i<2 ; i++) { QStringList d = s

浏览 2提问于2016-03-30得票数 0

1回答

Julia:将包含多个字符串列的Dataframe转换为浮点数组

dataframe、julia

我有一个DataFrame，它有许多字符串列，它们应该是float64。我想一次转换所有列，并将dataframe转换为一个浮点数组。如何做到这一点呢？重要的是，还有一些浮动列。 df = DataFrame(a=["1", "2", "3"], b=["1.1", "2.2", "3.3"], c=[0.1, 0.2, 0.3]) # Verbose option df.a = parse.(Float64, df.a) df.b = parse.(Float64, df.b) matrix =

浏览 26提问于2021-10-12得票数 4

回答已采纳

2回答

如何在pandas中选择与字符串列表匹配的行，而不仅仅是一个特定的字符串？

python、pandas

假设我们有一个dataframe- df和一个标记为'A‘的列。对于选择与一个字符串匹配的行-'some_ string '，df‘a’.str.concludes(‘some_string’)效果很好。我的问题是，是否有一个相应的方法可以传递给包含字符串列表的方法，以便可以获得部分匹配？我可以给它一个字符串列表而不是'some_string‘吗？我试图避免使用for循环和切片数据帧并将其连接成新的数据帧。假设数据帧是 pd.DataFrame(np.array([['cat', 2], ['rat', 5], ['

浏览 9提问于2019-03-08得票数 2

回答已采纳

2回答

如何在Apache Spark中根据分隔符将单字符串列转换为多列

apache-spark、pyspark、apache-spark-sql

我有一个包含字符串列的数据框，我想在其中创建多个列。这是我的输入数据，pagename是我的字符串列我想从它创建多个列。字符串的格式是相同的- col1:value1 col2:value2 col3:value3 ... colN:valueN。在输出中，我需要多个列- col1 to colN，值作为每列的行。以下是输出- 我如何在spark中做到这一点？Scala或Python都适合我。下面的代码创建输入数据帧- scala> val df = spark.sql(s"""select 1 as id, "a:100 b:50

浏览 23提问于2021-06-02得票数 0

回答已采纳

2回答

需要使用使用pandas.str()的字符串列表从列中选择值

python、pandas

需要从字符串列表中搜索字符串列值。搜索列表中的字符串仅是列中值的子字符串。 df = pd.DataFrame(data={'text':['abc def', 'def ghi', 'poi opo', 'aswwf', 'abcs sd'], 'id':[1, 2, 3, 4, 5]}) Out [1]: text id 0 abc def 1 1 def ghi 2 2 poi opo 3 3 aswwf 4 4 abcs s

浏览 0提问于2019-05-28得票数 0

回答已采纳

2回答

根据要删除的字符串列表删除字符串末尾的子字符串

python-3.x、pandas、substring

我有一个字符串列表 x=['llc', 'corp', 'sa'] 我需要在包含字符串的dataframe列的末尾进行筛选： df = pd.DataFrame(['Geeks corp', 'toto', 'tete coope', 'tete sa', 'tata corp', 'titi', 'tmtm'] , columns =['Names']) 作为输出，我想。拥有： list = ['Geeks

浏览 2提问于2020-01-21得票数 2

回答已采纳

2回答

如何在熊猫数据中替换字符串中的子字符串

python、string、python-3.x、pandas、dataframe

我有一个dataframe，和一个字符串列表，我想从该dataframe的列中删除这些字符串。但是当我使用替换函数时，这些字符仍然保留。有人能解释一下为什么会这样吗？ bad_chars = ['?', '!', ',', ';', "'", '|', '-', '--', '(', ')', '[', ']', '{', '}', &#

浏览 1提问于2018-04-14得票数 3

回答已采纳

2回答

显示从列中的一组单词中找到的单词

python、pandas、text

我试图在python中搜索dataframe行中的一个列表中的单词，以获得两个新列，显示用逗号分隔的单词和另一个列，并对找到的单词进行计数这是我的字符串列表 string_list = ["never sounded", "she", "was time", "against"]

浏览 8提问于2022-03-14得票数 1

1回答

到纪元的日期时间字符串: pandas dataframe

python-3.x、pandas、datetime、epoch

我的一只熊猫df有日期时间字符串列。格式如下： TimeStamp value 11/12/2015 10:07:34 AM 24.5 11/12/2015 10:07:35 AM 55.1 so on 我尝试使用以下命令将列TimeStamp的值转换为纪元： dataframe['TimeStamp'] = pd.to_datetime(dataframe['TimeStamp']).values.astype(np.int64) // 10 ** 6 将日期时间字符串转换为unix时间戳时出现错误。帮助将是非常有价值

浏览 11提问于2019-02-28得票数 2

回答已采纳

1回答

Pandas dataframe通过查找子串替换多列中的字符串

python-2.7、pandas

我有一个非常大的pandas数据框，包含字符串列和整数列。我想在整个数据框中搜索特定的子字符串，如果找到，则用其他字符串替换完整的字符串。我发现一些可以通过指定要搜索的列来做到这一点，如下所示： df = pd.DataFrame([[1,'A'], [2,'(B,D,E)'], [3,'C']],columns=['Question','Answer']) df.loc[df['Answer'].str.contains(','), 'Answer'] =

浏览 1提问于2017-10-08得票数 3

回答已采纳

9回答

Python中多列的Fillna

python、pandas、dataframe

我有一只混合类型的熊猫dataFrame，有些是字符串，有些是数字。我希望将字符串列中的NAN值替换为“.”，而浮动列中的NAN值替换为0。考虑一下这个虚构的小例子： df = pd.DataFrame({'Name':['Jack','Sue',pd.np.nan,'Bob','Alice','John'], 'A': [1, 2.1, pd.np.nan, 4.7, 5.6, 6.8], 'B': [.25, pd.np.nan, pd.np.n

浏览 10提问于2016-01-21得票数 56

回答已采纳

1回答

用工作日历生成多年假期的DataFrame

python、pandas、calendar

import pandas as pd from workalendar.core import Calendar from workalendar.registry import registry CalendarClass = registry.get('US') calendar = CalendarClass() calendar.holidays(2019) #> [(datetime.date(2022, 1, 1), 'New year') ...] 您可以看到上面的输出，它输出两个元素的列表。如何将其转换为两列的数据格式，其中一个是日期

浏览 7提问于2022-05-16得票数 2

回答已采纳

1回答

火花的洗牌排序合并连接。一个DataFrame是桶状的。斯派克会利用这个机会吗？

apache-spark

我记得在使用RDD时，如果一个键值RDD (rdd1)有一个已知的分区，那么使用不同的、不分区的键值RDD (rdd2)执行一个连接就会提高性能。这是因为1)只有rdd2的数据需要在网络上传输，2) rdd2的每个元素只需要传输到一个节点，而不是所有节点，方法是将rdd1的密钥划分到rdd2的密钥上。我正在学习与DataFrames的洗牌排序合并连接。我正在读的这本书(学习火花，第二版)中的例子是为了加入两个基于DataFrames列的user_id。该示例试图演示如何从联接操作中消除Exchange阶段，因此，在连接之前，两个DataFrames将被加入的列放入相同数量的桶中。我的问题是

浏览 2提问于2020-08-06得票数 0

回答已采纳

1回答

Powershell 5.1 -文件名或扩展名太长。如何将带有动态参数的1命令拆分为更多的顺序调用？

powershell、command-line-arguments、pathtoolongexception

问题:在powershell 5.1中，我运行一个命令myProgram，并将逗号分隔的字符串列表(具有动态长度) $commaSeparatedList作为参数传递给它的-itemsToProcess标志。在$commaSeparatedList中，通常有太多的字符，有时是125000个字符，或者更多，甚至更少，这会导致下面所示的错误。 $commaSeparatedList = 'file1,file2,file3,file4 ... fileX' myProgram -itemsToProcess $commaSeparatedList 问题：如何避免这个错误？我如何将其

浏览 4提问于2021-01-08得票数 1

1回答

避免FOR循环将多个字符串追加到列表中

python、dataframe、for-loop、append、list-comprehension

我需要用选定行上的一些字符串来更新DataFrame列，我为这些行建立了索引。到目前为止，我已经通过列表理解实现了我所需要的东西： [data.particleIDs.values[idx[i]].append(particlenames[i]) for i in range(len(idx))] 其中data.particleIDs是需要更新的DataFrame列，particlenames是一个包含字符串的列表，idx是一个数组，对于每个字符串，该数组包含需要写入的DataFrame行。几个字符串对应于同一行，我需要将它们都写在DataFrame列中。假设我有一个DataFrame和我用

浏览 10提问于2020-02-11得票数 3

2回答

字符串和字符串列表之间的余弦相似度

python、scikit-learn、cosine-similarity

我有一个字符串，我正在尝试将其与字符串列表进行比较。目标是使用余弦相似度从最相似到最不相似对字符串列表进行排序。 original_string = 'abc' string_list = ['abc', 'abcd', 'abec', 'ab', 'abcde', 'qwe'] 到目前为止，这是我的代码： sparse_matrix = tfidf_vectorizer.fit_transform(string_list) doc_term_matrix = sparse_matr

浏览 0提问于2020-11-12得票数 0

2回答

有效地将一个新列添加到Pandas DataFrame中，其值是从现有列处理的吗？

python、numpy、pandas

我的DataFrame中有一个字符串列DataFrame。我需要创建一个新的列bar，它的值是通过一系列字符串处理操作从相应的foo值派生出来的--在这种特殊情况下，是一组str.split()和str.join()。做这件事最有效的方法是什么？

浏览 1提问于2015-03-09得票数 0

回答已采纳

1回答

使用regex移除或替换列熊猫中特定单词后面的单词。

python、pandas、regex、string、replace

我正在尝试使用regex来删除或替换dataframe中字符串列中特定单词后面的单词。这意味着我不想把这些空格替换掉。只是这个词指的是特定的单词 import pandas as pd df = pd.DataFrame({'STRING': [r"THERE IS NO REASON WHY THIS SHOULDN'T WORK!", r"I AM WITHOUT DOUBT VERY BAD AT REGEX", r"I CAN'T SOLVE A PROBLEM HAT HAS NO INTRINSIC

浏览 3提问于2022-11-04得票数 1

回答已采纳

2回答

如何将Pandas中的字符串列表爆炸为单个列表而不丢失数据点的顺序

python、pandas、amazon-redshift

由于Redshift不支持list []数据类型，所以我在Redshift中将一些整数值存储为字符串列表(Varchar类型)。现在，为了某种分析目的，我需要将字符串列表(包含整数值)转换为一维int数组。样本数据： dummy_df = pd.DataFrame({'customer_id':[1,2,3],'values':[['[1]','[1,8]'],['[3,7]','[3]'],'[5]'] }) print(dummy_df) 产出数据： final_df = pd

浏览 6提问于2021-01-27得票数 1

2回答

如何将列表中的项附加到数据帧中的特定列？

python、python-3.x、pandas、list、dataframe

假设我有一个包含n个项目的字符串列表，比如： list1 = ['a','b',..'y','z'] 我不想将整个列表附加到一个dataframe (这会创建n列)，而是只想将第一项附加到第一列，将最后一项附加到最后一列，并将两者之间的所有内容组合到中间列。我试过了 df = pd.DataFrame(list1) 但这会为每个字符串项创建单独的列，从而产生n列我希望输出是3列的数据帧，如下所示： 0 1 2 0 a b+c+d+.. z 请

浏览 0提问于2019-08-26得票数 4

2回答

如何不循环地将python行转换为dataframe列

python、pandas、dataframe

我试图找出如何在不使用循环的情况下完成以下工作。我有一个dataframe，它有几个列，包括一个带有JSON字符串的列。我要做的是将JSON字符串列转换为他们自己在dataframe中的列。例如，我有以下数据： Column 1 | column 2 | Json Column 123 | ABC | {"anotherNumber":345,"anotherString":"DEF"} 我想转化为： Column 1 | column 2 | anotherNumber | anotherString 123

浏览 3提问于2016-10-25得票数 1

回答已采纳

1回答

数据单元X，传递大量字符串

delphi、dunit、dunitx

我需要将许多字符串值传递给测试过程，字符串参数以commatext字符串列表的形式传输，代码如下 [test] [testcase(test1,'xxxx,yyyy,zzz, ........')] procedure Test_transmitmany strings(S1, S2, S3, .... Sx String); 如果我的字符串列表超过255个字符，我会得到下面的错误 [dcc64 Error] Unit_TClass.test.pas(197): E2056 String literals may have at most 255 elements 将许多字

浏览 4提问于2021-12-03得票数 0

3回答

App Engine，如何检查列表中的所有值是否都在数据存储中的字符串列表中

python、google-app-engine

如果数据存储区中有一个字符串列表，其中包含以下值： a、b、c 如果字符串列表中的每个值都出现在列表中，那么如何将其与列表进行比较，以便只返回true？ “a”、“b”将返回false “a”、“b”、“c”将返回true “a”、“b”、“c”、“d”、“e”将返回true 仅使用GQL就可以做到这一点吗?或者我是否需要拉出字符串列表并对其进行循环？

浏览 3提问于2010-11-30得票数 0

2回答

使用字符串列表计算dataframe列中单词的出现情况

python、pandas、dataframe、text

我有一个字符串列表和一个带有文本列的dataframe。在文本列中，我有一行文本。我希望计算字符串列表中每个单词在文本列中发生的次数。我的目标是在dataframe中添加两列；一列包含单词，另一列具有出现次数。如果有更好的解决办法，我愿意接受。学习不同的方法来完成这一点将是很棒的。我最终想要一份数据文件。 string_list = ['had', 'it', 'the'] 当前数据：在代码中的数据： pd.DataFrame({'title': {0: 'book1', 1: 'book2&#

浏览 4提问于2021-12-10得票数 0

回答已采纳

2回答

将字符串从特定字符剥离到末尾

python、pandas

我在dataframe中有一列字符串列，比如Warsaw (Warsaw University of Technology)，我想去掉从(开始到字符串末尾的部分。括号中包含的部件在每行中都是不同的。我该怎么做呢？

浏览 26提问于2020-05-07得票数 0

回答已采纳

1回答

将嵌套的数据帧转换为多索引

python、pandas、dataframe

从数据类列表中 from dataclasses import dataclass @dataclass class Row: name: str age: int hobbies: pd.DataFrame charles_hobbies = pd.DataFrame({'activities': ['video_game'], 'sports': ['tennis']}) dash_hobbies = pd.DataFrame({'activities': ['eat

浏览 14提问于2021-11-02得票数 0

回答已采纳

1回答

从熊猫dataframe中每一行的字符串列表中删除空字符串

python、pandas、string、list、dataframe

我有一个熊猫数据，其中一个列包含一个字符串列表，例如： “”，“你好”，“房子很暖和”，“”，“几点了” 对于dataframe的每一行，字符串是不同的，但是每一行上的所有列表都包含空字符串。我怎么才能移除这些？该列称为“描述”。我尝试了以下方法： df['Description'] = df['Description', [i for i in df['Description'] if i]] while("" in df['Description']): df['Description

浏览 2提问于2022-12-03得票数 0

回答已采纳