从文本字符串中提取数字并将其移动到dataframe中的单独列中

文章/答案/技术大牛

发布

1回答

python、pandas、dataframe、split、extract

我有一个作为一列导入的油井数据的dataframe，我像这样拆分： df = pd.read_csv(r'df.txt', header=None)df我的一些数据包含井名，这些井名的编号附加在名称上。代码将其作为一个实体读取，并将其放入第0列。名称和编号之间有空格的井被排序到第0列和第1列<em

浏览 17提问于2020-11-27得票数 1

回答已采纳

5回答

如何将包含作为文本和数字存储的值的Pandas列分隔为两个单独的列

python、python-3.x、pandas

我有一个Pandas专栏，其中包含调查结果，这些结果要么是免费文本，要么是1-5中的数字。我正在以JSON格式从API中检索这些信息，并将它们转换为DataFrame。我的目标是为文本答案创建一个单独的列，并将原来为空的字段保留为空，这样我们就可以为文本结果和数字结果提供单独的列</e

浏览 0提问于2019-07-02得票数 6

回答已采纳

1回答

从混合字符串中获取数值值

excel、excel-formula

我正在研究一个从VIN数字中计算校验数字的公式；17个字母数字字符，每个字符都有自己的值(数字有自己的值，字母被指定为1到9之间的值)。不幸的是，使用MID单独提取字符作为文本提取数字，给出了VLOOKUP中的一个错误。我最初尝试只使用MID([@[VIN / Cargo ID]];

浏览 1提问于2019-07-03得票数 1

回答已采纳

2回答

从字符串中提取第n个出现次数

string、excel、excel-formula

我有一个列，其中包含文本字符串的单元格，其中包括文本和数字。我发现了一个很棒的公式，它可以找到字符串中的第一个数字，并将其提取到相应的单元格中。文本字符串：“初始佣金为99 9,999.99，然后从99个月起续订佣金为99 9.9” 在单元格旁边输入此公式=LOOKUP(99

浏览 0提问于2016-06-09得票数 1

1回答

Pandas DataFrames:提取信息和折叠列

python、pandas、dataframe

我有一个pandas DataFrame，它包含列中的信息，我想将其提取到新列中。最好从视觉上解释： df = pd.DataFrame({'Number Type 1':[1,2,np.nan], 'Number Type 2':[np.nan该表显示了包含Number Type 1和NumberType 2列的

浏览 15提问于2019-02-27得票数 1

回答已采纳

2回答

将JSON文本字符串转换为Pandas，但每个行单元格都以内部值数组的形式结束

arrays、json、python-3.x、pandas、json-normalize

我设法从一个门户网站上提取了价格的时间序列。数据以json格式到达，我将它们转换为pandas dataFrame。不幸的是，不同波段的数据是以文本字符串的形式出现的，我似乎无法将它们正确提取出来。 data = pd.DataFrame(r.json()['price

浏览 8提问于2018-10-01得票数 1

1回答

熊猫:在Pandas的一栏中间分割一根字符串，然后创建一个新的列？

python、pandas

如何从列中的字符串中拆分或提取第一个数字序列(即200828)，并将其作为新列“Temp”添加到Dataframe中，并将其丢弃？

浏览 4提问于2020-08-28得票数 0

回答已采纳

1回答

从dataframe列中获取字符串的前3个字母

python、pandas、dataframe

如何从dataframe列中的字符串中提取前3个字母并将它们存储在新列中。从列'A‘中提取前三个字母/数字，并将其存储在列'C’中 A B 14654 22354 24798 3268

浏览 5提问于2022-10-27得票数 0

回答已采纳

1回答

如何将火花数据输出到具有不同列的csv文件中？

python、csv、apache-spark、pyspark、apache-spark-sql

我的代码第一次使用regex提取数据，并将数据写入文本文件(字符串格式)。然后，我尝试从文本文件的内容中创建一个dataframe，这样我就可以有单独的列，这会导致一个错误。(将其写入csv文件，将整个内容写入一列中)。我所要做的就是在执行写操作之后，创建一个具有单独列<em

浏览 2提问于2016-09-01得票数 1

回答已采纳

1回答

Power查询倾斜数据

excel、powerbi、powerquery

我在power查询中遇到了一个问题，我的数据来自一个分成多个页面的报表，其中一些页面将数据倾斜到不同的列。我认为可能有一种基于错误的解决方案，但我希望它更加多余，而不是依赖于文本和数字的纠错。我还必须对数据进行一些处理，以给出不同转换的示例，并说明从不同页面拆分的记录。数据集中有12条记录，每条记录最终将包含一行。第一页是从源文档中剥离的原始数据。这些是检查历

浏览 5提问于2017-02-09得票数 1

2回答

如何从r中的文本中提取信息并创建新列？

r、string、extract

我的数据中有一列包含有关产品的信息：预期输出将是"age:"，14之后的数字。可能我需要使用stringr包并尝试使用str_extract函

浏览 0提问于2018-04-22得票数 1

5回答

是否有一个正则表达式可以在两个斜杠之间和一个特定字符串之后找到一个字符串？[R]

r、regex、regex-lookarounds

我有一个包含如下URls的列的dataframe：我只尝试将该列的nameofpage部分提取到一个新列中我不知道如何在那个位置提取字符串。字符串有时包含文字".“、文本和数字。

浏览 0提问于2019-03-30得票数 2

回答已采纳

1回答

用于system.time()用户时间提取的r代码

我需要对数字1:N的阶乘函数运行system.time循环，并将结果存储为带有2列、编号和用户时间的数据，以便使用递归和循环来监视阶乘函数实现的性能。我能够在Usefor循环中运行system.time()，但不能只提取user.self的值。例如这给了我一些输出 0.006 0.000 0.006 但是，我只想提取数

浏览 2提问于2018-01-17得票数 1

回答已采纳

1回答

从aKorean文本字符串中提取整数，以其内容为条件，并将其转换为在熊猫中浮动

python、regex、pandas、format-conversion

)','3일령','1.5개월령(추정)']}根据字符串包含的条件，我需要在几天内计算年龄。父母(추정)中的文本可能出现在字符串中，也可能不出现在字符串中，意思是“估计的”。括号前的文本可以是년령(年份)、개월령(月份)或일령(天数)。最后，文本之

浏览 1提问于2018-08-12得票数 1

回答已采纳

4回答

从制表符分隔的表中提取文本子字符串

linux、perl、sed

我有一个由制表符分隔的列(225,000行乘16列)的非常大的文件，我想从每行提取一个子字符串并创建一个单独的文件。例如，这里有一行字符，我想提取gi|和|之间的数字516315992，并对所有225,000行执行此操作。这是表中的一行作为示例： M01522:132:000000000-A4LNU:1:211

浏览 6提问于2014-05-03得票数 0

1回答

如何广播pandas数据帧列中的文本字符串的子集

python、pandas

我试图从存储在dataframe列中的乱七八糟的文本字符串中提取年份和降雨量值，并将其保存到新列中。在用不同的切片方法测试失败后，我通过列表理解做到了这一点。列表理解是提取用于广播的字符串子集的最佳方法吗？非常感谢所有人！df = pd.DataFrame(['

浏览 7提问于2018-12-25得票数 0

回答已采纳

3回答

部分转换Python dataframe中的列

python、pandas、dataframe、group-by

我在Python dataframe中有一列，如下所示： Product_ID12342345EFGH 它当前存储为对象数据类型。但是，我确实希望将这些数字合并(即1234与0001234的乘积相同)。因为列中还有文本字符串，所以我不能将其转换为整数 df['Product_ID'] = pd.to_numeric(df['Product_ID']) V

浏览 27提问于2019-03-09得票数 1

回答已采纳

2回答

从pandas dataframe的列中提取字符串中的数字

python、pandas、dataframe、data-cleaning、feature-extraction

我需要使用dataframe house_price中的‘feature’列进行特征提取。列功能具有以下一组数据 house_data['Amenities'] 4 1 bed 1 bath，浴缸和停车场的数量，并将它们存储在3个单独的列中。2096 3 2097

浏览 25提问于2020-10-17得票数 0

回答已采纳

1回答

从文件夹中读取文件并将其存储到R中的数据

r、text、input、import

我的最终目标是建立一个分类器--类似于垃圾邮件检测器。但是，我不知道如何读取包含文本的文本文件，这些文本文件将提供分类器并将其存储到dataframe中。因此，假设我已经组装在一个文件夹文本文件中--原始文本最初存储在记事本中，然后保存在txt文件中--其名称表示它们的内容，例如，xx_xx_xx__yyyyyyyyyyy_zzzzz，其中xx

浏览 1提问于2017-10-24得票数 0

回答已采纳

1回答

将字符串列拆分为R中的多个新列

r、regex、string、list

我有一列数据如下所示：我想提取所有的数字(从字符串中提取数字)，但是我想将它们保存在单独的列中。理想的结果是： Row 1: 6

浏览 1提问于2020-11-24得票数 1

回答已采纳

点击加载更多