从字符串中提取元素作为列Pandas_从pandas中的列字符串中提取值_Pandas dataframe:从列中的字符串中提取浮点值 - 腾讯云开发者社区

python、pandas、jupyter

我有一个非常大的数据，其中一个列是字典本身。(比方说第12栏)。那本字典是超链接的一部分，这是我想要的。在木星中，我想显示一个具有0和2列的表，以及已完成的超链接。我想我需要：从dataframe中提取字典从中获取一个特定的键值。从提取的值创建完整的超链接复制dataframe并用上面创建的超级链接替换该列让我们来处理第一步，我将为接下来的步骤提出其他问题。如何将数据文件中的值提取到我可以使用的变量中？ import pytd import pandas client = pytd.Client(apikey=widget_api_key.value,

浏览 2提问于2019-08-07得票数 2

1回答

在pandas列中存储列表的最有效方法是什么？

pandas、dataframe、twitter

我有一个包含1亿条tweet的熊猫数据帧。我已经从数据中提取了URL，目前已将其作为列表存储在pandas列中：我想在这些URL上运行分析(比如按域名排序，找出哪种类型的用户发布了哪些域)。是否可以像这样存储：其中的URL列是具有动态大小的pandas系列，以便我可以轻松处理？否则，在应用pandas操作和速度的同时，存储urls的最好方法是什么？

浏览 0提问于2019-03-05得票数 1

2回答

Pandas将数据插入MySQL

python、python-2.7、pandas、csv、mysql-python

我尝试使用Pandas (Python)将我从.csv文件中提取的数据列插入到MySQL中。以下是我到目前为止拥有的代码。 import pandas as pd from pandas.io import sql from sqlalchemy import create_engine engine = create_engine('mysql://username:password@localhost/dbname') with engine.connect() as conn, conn.begin(): df = pd.read_csv('File.csv&

浏览 1提问于2017-07-25得票数 7

回答已采纳

2回答

Python :计算从csv文件导入的两列的差异，并存储到python脚本中的另一列

python、python-3.x、pandas、data-analysis

我已经在我的python程序中导入了一个.csv文件，它包含了许多使用熊猫模块的列。在我的代码中，我只是导入了前三列。代码和示例文件如下所示。 import pandas as pd fields = ['TEST ONE', 'TEST TWO', 'TEST THREE'] df1=pd.read_csv('List.csv', skipinitialspace=True, usecols=fields) 示例文件如何在我的python程序中找到列测试、一个和测试两个的不同之处，并将其存储在代码中的单独位置/列/

浏览 0提问于2018-03-19得票数 0

回答已采纳

1回答

如何在Python中将数据从excel列提取到列表中？

python、excel、list、pandas

我正在尝试从excel中的列中提取数据到Python中的列表。我有以下代码： #Extracting Labels read = pd.read_excel('Test-data-results.xlsx', sheetname=0) # can also index sheet by name or fetch all sheets labels = read['Labels'].tolist() print(labels) 当我运行这段代码时，我得到一个关键错误：.... File "pandas/_libs/index.pyx", lin

浏览 97提问于2018-08-13得票数 1

回答已采纳

1回答

熊猫read_sql

python、sql-server、pandas、sqlalchemy

我遇到了以下不规则性，并想分享我的解决方案。我正在使用Pandas和SQLALCHEMY在Python中从Microsoft sql Server读取SQL表。有一列名为“发生时间”，格式如下："2017-01-01 01:01:11.000“。使用SQLAlchemy读取“发生时间”列，所有内容都以NaN的形式返回。我尝试在pandas.read_sql()方法中设置parse_date参数，但没有成功。是否还有其他人在使用SQLAlchemy/Pandas从SQL表中读取日期时间列时遇到问题？

浏览 1提问于2017-07-20得票数 0

3回答

在python中从字符串中提取数字

python、pandas

我试图从pandas数据帧中的列中仅提取区域编号: 568平方英里(1,471 km2)这里我只想要568，数字和sq之间的空格是牢不可破的空格。

浏览 4提问于2020-05-09得票数 0

1回答

使用pandas系列从pandas DataFrame中提取值

python、pandas、dataframe、indexing

我有一个包含键-值对的pandas Series，其中键是我的pandas DataFrame中列的名称，值是DataFrame中该列的索引。例如：系列：然后在我的DataFrame中：因此，从我的DataFrame中，我希望从'A‘的DataFrame中提取索引12处的值，即435.81。我想将所有这些值放入另一个序列中，所以类似于{ 'A'：435.81，'AAP'：468.97，...} 我的声誉很低，所以我不能将我的图片作为图片发布，而不是链接(有人能帮我解决这个问题吗？谢谢！)

浏览 30提问于2017-08-15得票数 0

2回答

从熊猫数据帧中提取单个数据

python、pandas、dataframe

如何从给定的Dataframe提取值(string)，从不同的列提取特定的值。例如，我希望得到'Adrs‘where 'Value'=2 import pandas as pd df = pd.DataFrame({'Adrs':["AAA","BBB"],'Value':[1,2]}, index=[0,1]) print(df) print("") df2 = df[df['Value']==2] string = df2.Adrs print(string) 输

浏览 1提问于2016-01-29得票数 0

回答已采纳

1回答

从excel中提取日期并使用python将其追加到列表中。

python、python-3.x

我在excel中有一个列，它的日期格式为'' 17 -12-2015 19:35‘’。我如何提取前2位数字作为整数并将其追加到列表中?在这种情况下，我需要提取17并将其追加到列表中。是否也可以使用pandas来完成？到目前为止的代码： import pandas as pd Location = r'F:\Analytics Materials\files\paymenttransactions.csv' df = pd.read_csv(Location) time = df['Creation Date'].tolist() print (

浏览 4提问于2016-01-07得票数 1

1回答

在pandas DataFrame中转换/提取json数据的循环不起作用

python、json、pandas、loops、jupyter-notebook

我正在尝试完成EDA演练，并通过使用循环处理包含json数据的列来转换/提取dataframe中的json数据。为此，我为循环设置了一个要遍历的列表，然后设置for循环来加载json数据并提取每列每一行的name字段。在处理了列表中的第一列之后，它抛出了一个“the JSON object the be str，bytes or bytearray，not‘list’”错误。我尝试通过添加和删除列来修改列表，以查看它在哪里失败，它总是在第一列起作用，但在第一列之后就放弃了。对于只有一列的列表，这一点仍然成立。我认为问题在于传递的'json.loads(data)‘仍然以某种方式

浏览 27提问于2019-07-04得票数 2

1回答

提取在Pandas中dtype是“object”的列的索引

python、pandas、numpy

如何从Pandas中的所有列中提取特定dtype的所有列的索引

浏览 0提问于2018-07-27得票数 3

回答已采纳

1回答

如何使用Python从excel中的列中获取子字符串？

python、excel、pandas、xlrd

我有一个Excel文件，我想在这个Excel文件中读取一个特定的列，我用以下代码来完成这个操作： import pandas as pd import xlrd file_location = input('Where is the file located? Please input the file path here. ') column = input('In what column is the code? ') code_array = pd.read_excel(file_location, usecols=column) for i in c

浏览 0提问于2020-06-03得票数 0

回答已采纳

1回答

Pandas列清理

pandas

我在pandas中有一个包含复杂列的数据集。其中一列product_info具有各种类型的内容： #Input type1 df['productInfo'][0] #Output type1 'Salt & pepper shakers,Material: stoneware,Dimensions: H6.5cm,Dachshund designs,1x black and tan, 1x brown,Hand painted,Dishwasher safe' #Output type2 'Pineapple string lights,D

浏览 6提问于2017-12-27得票数 2

1回答

Pandas DataFrames:提取信息和折叠列

python、pandas、dataframe

我有一个pandas DataFrame，它包含列中的信息，我想将其提取到新列中。最好从视觉上解释： df = pd.DataFrame({'Number Type 1':[1,2,np.nan], 'Number Type 2':[np.nan,3,4], 'Info':list('abc')}) ? 该表显示了包含Number Type 1和NumberType 2列的初始DataFrame。我想提取类型并创建一个新的Type列，并相应地重

浏览 15提问于2019-02-27得票数 1

回答已采纳

5回答

熊猫DataFrame中棘手的str值替换

python、string、pandas、dataframe、replace

问题概述我试图清理从CSV文件加载到Pandas DataFrame中的库存数据。我执行的索引操作有效。如果我调用print，我可以看到我想要的值是从框架中提取出来的。然而，当我试图替换这些值时，如截图所示，熊猫忽略了我的请求。最终，我只是尝试从一个列中提取一个值，并将其移到另一个列中。熊猫文档建议使用.replace()方法，但这似乎不适用于我试图执行的操作。这是的一张照片。和for循环(如图中所引用的)： for i, j in zip(all_exchanges['MarketCap'], all_exchanges['MarketCapSym'])

浏览 5提问于2016-12-01得票数 2

回答已采纳

1回答

从[pandas.core.frame.DataFrame]变量中提取特定数据

python-3.x、pandas、dataframe

在使用pandas从.csv文件中提取数据时，我希望收集该文件中各种列的标签。而不是硬编码，我试图从我从以下代码创建的变量中提取它： train_data = pd.read_csv("Anydatasheet.csv") features = ["Pclass","Age", "Fare", "Parch", "SibSp","Sex","Embarked"] X = pd.get_dummies(train_data[features]) X.head() (上

浏览 57提问于2020-07-24得票数 0

回答已采纳

1回答

从pandas数据帧获取时间戳

python、pandas

我不知道如何从pandas列中提取时间戳。使用以下代码，我将获得以下信息。 print("Nested ----------------------------") print(type(nested_full['data.tick_timestamp'])) ts2 = nested_full['data.tick_timestamp'] print("type of timestamp") print(ts2) diff_seconds = util.seconds_since_mightnight(ts2) # Fail

浏览 1提问于2019-11-22得票数 0

2回答

删除基于pandas数据帧行的条件

python-2.7、pandas、dataframe

我的pandas dataframe有一个列，其中每一行都是一个对应于一个文件名的字符串。我从JSON文件中读取数据并提取列，如下所示： df = pd.read_json("mergedJSON.txt",lines=True,orient='columns') df2 = df.set_index("subject") for key,value in some_dict.iteritems(): df2.loc[value,"file_name"].to_csv(outfile,index=False, header=F

浏览 11提问于2017-08-23得票数 2

回答已采纳

2回答

从pandas中提取字符串

python-3.x、pandas

我有数据帧，我想从其中提取数字，如果‘转移’字在8列，它应该从位置13，15个字符提取，否则它应该从位置21，15个字符提取 =IF(LEFT(C10,8)="Transfer",MID(C10,13,15),MID(C10,21,15)) i want same excel from formula in pandas Particular Expected Result On-Line Transfer - 01901091900014 01901091900014

浏览 18提问于2019-10-13得票数 0

2回答

使用regex将一列中的字符串中的文本仅提取到python dataframe中的另一列时出错

python、regex、pandas

我正在尝试从pandas dataframe中列的行中的字符串数据中仅提取文本部分到新列中。当我尝试这样的东西时： import pandas as pd import re df = pd.DataFrame({"Id": [1,2] , "Text" : ["This is 20/06/2019; 00:13:45; Time stamp", "This is another 23/04/2019 11:23:35 Time stamp"]}) print(df) 我得到了一个数据帧，如下： Id

浏览 20提问于2019-06-18得票数 2

回答已采纳

2回答

从pandas DataFrame中的列中提取JSON数据

python、json、pandas

如果我们有一个包含Car_Info列的pandas dataframe df1。我们如何将以下字符串中的信息提取到新列中？例如，使用正则表达式还是pd.read_json()？请注意，"car_id“和"wheel_id”的格式与"price“和"count_results”的格式略有不同。 Car_Info '{"car_id":"100","wheel_id":"80-ABC-999","price":14,"count_results":1051}

浏览 2提问于2018-08-29得票数 4

2回答

用Python从多个Excel文件中提取必要的列

python、excel、pandas

我正在尝试从19个Excel文件中提取选定的列并将其组合到单个excel文件中。我能够提取所需的列从单个文件与以下代码。 import pandas as pd import openpyxl file = pd.read_excel("Shift Handover To A - 05-25-2021.xlsx", "25th May") dataframe=pd.DataFrame(file[["S No", "Issue Reported By", "Shift", "Severity",

浏览 28提问于2021-06-19得票数 0

回答已采纳

2回答

操作包含列表的pandas数据框列

python-3.x、pandas

我在pandas中使用了下面的代码和of ()函数来创建一个列，该列包含一个唯一值的列表： import pandas as pd from collections import OrderedDict dct = OrderedDict([ ('referencenum',['10','10','20','20','20','30','30','40']), ('Month',['Jan','Jan'

浏览 16提问于2019-02-06得票数 1

回答已采纳

4回答

向量化或加速PANDAS列上的Fuzzywuzzy字符串匹配

python、pandas、performance、fuzzywuzzy

我正在尝试在充满组织名称的PANDAS列中寻找潜在的匹配项。我目前正在使用iterrows()，但它在大约有70,000行的数据帧上非常慢。在查看了StackOverflow之后，我尝试实现了一个lambda row (apply)方法，但这似乎几乎不能加快速度。数据帧的前四行如下所示： index org_name 0 cliftonlarsonallen llp minneapolis MN 1 loeb and troper llp newyork NY 2 dauby o'connor and zaleski llc carmel IN 3 wegner c

浏览 4提问于2018-10-04得票数 14

1回答

Pandas DataFrame错误: ValueError: StringArray需要字符串序列或pandas.NA

python-3.x、string、types、int

正在尝试将kaggle titanic pclass列数据类型从int转换为string。使用pandas 1.0.5。 df.Pclass.head() 0 3 1 1 2 3 3 1 4 3 Name: Pclass, dtype: int64 代码如下： df['Pclass'] = df['Pclass'].astype('string') 抛出的错误如下： ValueError: StringArray requires a sequence of strings or pandas.NA 注意:这是第一次

浏览 3提问于2020-07-30得票数 1

1回答

使用recfromcsv的输出

matlab、numpy、python-2.7

我正在将Matlab脚本移植到Python。以下是摘录： %// Create a list of unique trade dates DateList = unique(AllData(:,1)); %// Loop through the dates for DateIndex = 1:size(DateList,1) CalibrationDate = DateList(DateIndex); %// Extract the data for a single cablibration date (but all expiries) SubsetIndice

浏览 2提问于2012-09-12得票数 1

回答已采纳

2回答

编写python代码以使用条件语句从现有列创建新的csv列

python、pandas、python-2.7

我是python编码的新手，我想根据现有列上的条件语句创建一个新列。我使用python 2.7版本，并在CentOs上运行代码。 import pandas as pd file1 = pd.read_csv("/root/Documents/temp_file_{}.csv".format(timestr)) file1['FileName'] = '' file1['FileName'] = file1['Fi

浏览 30提问于2019-05-28得票数 0

回答已采纳

2回答

从pandas Dataframe中提取在特定列中具有特定值的所有行

python、pandas、dataframe

我是Python/Pandas的新手，正在努力从pd.Dataframe中提取正确的数据。我实际拥有的是一个包含3列的Dataframe： data = Position Letter Value 1 a TRUE 2 f FALSE 3 c TRUE 4 d TRUE 5 k FALSE 我想要做的是将所有真正的行放入一个新的Dataframe中，这样答案将是： answer = Position Letter Value 1 a TRUE 3

浏览 1提问于2013-07-02得票数 11

回答已采纳

1回答

当CSV内容读取为列表时，pandas read_csv()返回带有.1和.2的重复条目

python-3.x、pandas

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。 target_df = pandas.read_csv(file_absoulte_path, nrows=0, engine='python').columns.tolist() 并将上面返回的列表与另一个列表(expected_columns)进行比较，如下所示。 if(colums_expected==target_df): logger.info("Column names are CORRECT, as expected!"

浏览 2提问于2021-07-15得票数 1

1回答

Pandas read_sql_query将整型列转换为浮点型

python、pandas

我有下面这行代码 df = pandas.read_sql_query(sql = sql_script, con=conn, coerce_float = False) 它使用sql脚本从Postgres中提取数据。Pandas不断地将一些列设置为float64类型。它们应该只是int。这些列包含一些空值。有没有办法在不让Pandas将数据设置为float64的情况下提取数据？谢谢!

浏览 16提问于2016-09-15得票数 4

1回答

RoR，Ruby如何将数据从数据库中分离出来并与其一起使用计数

sql、ruby-on-rails、ruby、split、ruby-hash

我试图从数据库中提取数据，并将其与饼图一起使用。我能够从数据库中提取“浏览器”列中的数据，该列是一个字符串，格式为："Mozilla/5.0 (X11；Linux x86_64；rv:45.0) Gecko/20100101 Firefox/45.0“ 当我在查询中使用“计数”方法时，数据将被保存为如下所示的散列： {"Mozilla/5.0 (X11；Linux x86_64；rv:45.0) Gecko/20100101 Firefox/45.0"=>5，Mozilla/5.0 (X11；Ubuntu；Linux i686；rv:51.0) Gecko/2

浏览 0提问于2017-05-02得票数 0

回答已采纳

1回答

如何从Bigquery表中提取空值作为TableRow对象

google-bigquery、google-cloud-dataflow

我正在尝试使用Google Cloud Dataflow从BigQuery表中提取数据。我的BigQuery表有很少的空值(对于String数据类型)和null (对于Numeric数据类型)。当我尝试使用BigQueryIO.readTableRows().fromQuery(select * from table_name)提取数据流中的数据时，我看不到具有空值的列。我如何才能将所有列都作为TableRow对象的一部分呢？任何帮助我们都将不胜感激

浏览 1提问于2019-12-16得票数 1

1回答

如何剥离可能出现在字符串列值开头或结尾的货币字符？

python、dataframe、special-characters

我有一个名为Cost的pandas数据帧列，它的值可能是or 2394.21或2435.68 or或$1753.32或$ 7854$。我想提取货币符号，它可能在开头或结尾，并将其存储在一个新列中。我怎样才能做到这一点呢？更复杂的是，我不知道用什么编码来存储这些符号。我试图找到货币符号在列中的位置，并将其存储在一个名为“索引”的新列中。下面的代码将索引返回为-1，因为我可能没有使用正确的编码检查or或$。 sub = '£' df['indexes'] = df['Cost'].str.find(sub) sub = '$' d

浏览 12提问于2019-02-02得票数 1

1回答

从Pandas数据帧中的单元格中提取字符串

python、numpy、pandas

我有一个数据框，df Filename Weight 0 '\file path\file.txt' NaN 1 '\file path\file.txt' NaN 2 '\file path\file.txt' NaN 我有一个输入文件名的函数，它会从文件中提取一个浮点值。我想要的是将来自Filename的文件路径从df的每一行调用到我的函数中，然后将数据输出到Weight列。我当前的代码是： df['Weight'] = df['Weight'].app

浏览 0提问于2015-10-02得票数 2

回答已采纳

2回答

从pandas列的单元格中提取小时和分钟

pandas、time

Example 如何从pandas dataframe列中的04:38 :00AM拆分或提取04:38？

浏览 187提问于2021-02-07得票数 0

回答已采纳

3回答

熊猫-从系列中提取数据

python、regex、pandas

我正在尝试从类型为pandas.core.series.Series的列中提取数据的位置。我试过了 df['col1'] = df['details'].astype(str).str.findall(r'name\=(.*?),') 但上面的返回值为空。给出了数据在列df['details']中的样子 [{'id': 101, 'name': 'Name1', 'state': 'active', 'boardId': 101,

浏览 0提问于2019-11-20得票数 1

回答已采纳

3回答

选择DataFrames之间的补列

python、pandas、dataframe

假设我有一个pandas.DataFrame x，x被提供给filter函数，并返回y，这是一个从x中删除了一些列的DataFrame。该函数是一个黑盒，列数很大。我怎样才能找到'x‘中被删除的列？或者，y.columns是x.columns的子集，我如何在x中找到不在y中的列示例： x = pd.DataFrame(np.array([[1,2,3],[4,5,6]])) x.columns = list('abc') y = x.iloc[:, :2].copy() >>> x a b c 0 1 2 3 1 4 5 6

浏览 0提问于2018-11-01得票数 1

2回答

Python大熊猫regex提取到4个新列

python、pandas

import pandas as pd df = pd.DataFrame(data={'data': ['2 (B) - 15 (K)']}) print(df) 当前DataFrame： data 0 2 (B) - 15 (K) 我想要做的是将2、B、15和K提取到同一数据same中的4个新列中。这能直接使用pandas.regex吗？

浏览 5提问于2022-10-05得票数 1

回答已采纳

2回答

read_csv混合类型列作为字符串

python-3.x、pandas

熊猫的read_csv函数中是否有任何选项可以自动将object的每一项转换为str。例如，在尝试读取CSV文件时，我得到以下信息： mydata = pandas.read_csv(myfile, sep="|", header=None) C:\...\pandas\io\parsers.py:1159: DtypeWarning: Columns (6,635) have mixed types. Specify dtype option on import or set low_memory=False. data = self._reader.read(nrow

浏览 3提问于2015-02-23得票数 3

回答已采纳

1回答

从变量中的Excel文件名获取日期

excel、ssis

我需要创建一个SSIS包，它将从Excel源提取数据并将其加载到Server目标中。 Excel文件名将有一个日期，通常文件名类似于emp_20110909.xls，其中11是月份，09是日期，09是年份。现在，我想捕获这个日期，并在目标表中添加另一个名为"Extracted_Date“的列，并填充从该excel提取的所有记录的捕获日期。有人能告诉我怎么做吗？

浏览 2提问于2018-04-25得票数 0

2回答

从pandas dataframe中的列中提取唯一的json键

json、pandas

我有一个pandas dataframe，下面的列是json格式的。我需要从下面的dataframe中的所有行中获取唯一的json键。我不确定pandas是否有内置的函数来做这件事。 Col3 {"a": 2000, "b": 1} {'c': 'Go bug go','d': 'go_line21','e': 'movie','duration': 2166}

浏览 22提问于2019-12-07得票数 1

1回答

在`pandas.read_csv`中，‘`str`’和‘`object`’数据类型有什么区别？

python、python-3.x、pandas

根据，pandas.read_csv允许我为CSV文件中的列指定一个dtype。 d类型：列->类型的类型名称或dict，对于数据或列默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (引擎=‘python’不支持)。使用str或object来保存而不是解释dtype。若要将每一列视为文本数据，我可以使用 df = pandas.read_csv(... , dtype=str) 或 df = pandas.read_csv(..., dtype=object) 据我所知，这两种方法的行为总是完全相同的。这两种方法是否有不同行为的情况？如果是的话，

浏览 2提问于2016-05-17得票数 6

回答已采纳

2回答

Pandas DataFrame到键->行表示的快速转换

python、pandas、dataframe

我需要用于我的Pandas DataFrame的键行索引，其中key是Pandas DataFrame的id列，data是行数据。数据是稀疏的-我只需要访问几个键的数据，但是我不知道我需要访问哪个键。我目前正在使用iterrows这样做： pair_map = {} for pair_id, data in df.iterrows(): pair_map[pair_id] = data 然而，对于非常多的行(大约100 k-1M)，这会变得很慢。有没有更快的方法来为Pandas创建稀疏的密钥行索引，这样任意访问任何行的速度就会更快吗？更好的是，如果指数稀少，数据是从潘达斯按需提取

浏览 3提问于2022-09-07得票数 1

回答已采纳

1回答

使用Python脚本根据PowerBI中的当前数据集创建新表

python、powerbi、powerbi-datasource

我有一个csv文件作为源数据集。目前在表中有一列，我想使用Python循环并从每个单元格的字符串中提取数据。例如，在单元格中：数量变化了10，价格变化了90。我想使用Python并提取"Quantity，Price“和"10，90”来创建具有这些属性和值的新表。然后使用Python创建视觉效果，而不是使用PowerBI视觉效果。我该怎么做呢？这真的有可能吗？编辑:由于所有的混淆，我添加了一个我正在处理的专栏的屏幕截图。我想遍历Properties列中的所有行，获取每个单元格中的数据，然后提取它们以创建一个新表。例如，在本例中，新表将如下所示：属性|值未连接高

浏览 18提问于2021-03-07得票数 0

1回答

pandas的等价物是否适用于pyspark？

apache-spark、pyspark

我真的希望能够在spark数据帧的整个列上运行复杂的函数，就像我在Pandas中使用apply函数所做的那样。例如，在Pandas中，我有一个apply函数，它接受一个混乱的域，比如sub-subdomain.subdomain.facebook.co.nz/somequerystring，然后输出facebook.com。我怎么在Spark中做到这一点？我看过UDF，但我不清楚如何在单个列上运行它。假设我有一个如下所示的简单函数，我从pandas DF列中提取日期的不同位： def format_date(row): year = int(row['Contract

浏览 23提问于2020-04-05得票数 2

2回答

标识分组后查找字符串

python、regex、pandas

我使用pandas遍历了csv文件中几千行杂乱的数据。我正在迭代其中一个dataframe列，该列通常包含相当短的完全不同的串联客户信息(姓名、位置、客户编号、电话号码等)。客户号码和电话号码之间没有太多可识别的区别，尽管df列中的大多数行都在电话号码的字符串文本中包含电话标识符，如下所示(其中0123456是客户号码，55555 5555是电话号码)：曾傑瑞0123456电话: 55555 5555所在地城市我可以从TEL:指示符后面的数字中清除空格，但似乎不能形成一个仅提取TEL:指示符后面的文本的正则表达式。我在新的df"TEL“列中的理想输出应该是555555555。到

浏览 2提问于2019-01-18得票数 0

2回答

如何在python中使用pandas读取csv文件的所有行？

python、csv、pandas

我使用pandas模块从.csv文件中读取数据。我可以编写以下代码来提取属于单个列的数据，如下所示： import pandas as pd df = pd.read_csv('somefile.tsv', sep='\t', header=0) some_column = df.column_name print some_column # Gives the values of all entries in the column 但是，我现在尝试读取的文件有5000多列，并且写出了以下语句 some_column = df.column_name 现在是

浏览 2提问于2016-11-25得票数 3

回答已采纳

1回答

将CMS (基于PKCS#7的)签名转换为适合xmldsig <ds:SignatureValue>字段的值

x509certificate、signature、signing、pkcs#7、xml-dsig

我有内容管理系统(基于PKCS#7的)签名作为输入，我想创建一个等效的xmldsig出来。我可以从CMS消息中提取X509证书，但我不知道如何提取签名散列(在xmldsig字段中重用)。有没有办法从CMS消息中提取签名哈希？

浏览 5提问于2020-03-12得票数 1

2回答

从列中获取字符串的第一个字母

python、pandas

我在和熊猫打架，现在我输了。我有一个类似于下面的源表： import pandas as pd a=pd.Series([123,22,32,453,45,453,56]) b=pd.Series([234,4353,355,453,345,453,56]) df=pd.concat([a, b], axis=1) df.columns=['First', 'Second'] 我想用列' first‘中的值的第一个数字将新列添加到此数据框中: a)将列’first‘中的数字改为字符串b)从新创建的字符串中提取第一个字符c) b)b)结果b另存为数据框中

浏览 1提问于2016-02-22得票数 60

回答已采纳