如何从另一列中创建一个包含字典计数的pandas列？_Pandas :从另一列中的字典列表创建新列_从pandas数据框创建字典。on列包含集合 - 腾讯云开发者社区

python、json、for-loop、dictionary、pandas

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

1回答

Python:如果列具有键值对格式的数据，如何读取csv数据

python、pandas、csv

我是python的新手。我需要读取csv文件，它有不同的列。在csv文件中，一列包含像键和值对这样的数据。使用pandas如何从csv中提取该列的键和值。例如:列名：fruit 该列中的数据： { ""apple": "1,2,3,4", "orange":"5,6,7,8"} 如何从csv文件中获取水果列的键及其值？有什么建议吗？

浏览 3提问于2018-06-01得票数 0

1回答

对一列单词对进行求和，并检查频率？

python、pandas

有没有可能用Pandas对一列单词组合进行求和？假设有一列包含给定文本的列，其中每个单元格都是一个句子。如何检查由句子1中的2个单词组成的单词对是否也出现在其他行中，如果是，则这种出现的计数应递增1。它应该看起来像这样： | | text |count| |---:|:-----------------------------------------|-----| | 0 | My Name is Anton and I like driving cars | 6 | | 1 | My Name is He

浏览 0提问于2020-03-02得票数 1

1回答

在Jupyter Notebook中创建矩阵

python、jupyter-notebook

我有一个Jupyter Python Notebook，它有一个数据矩阵，其中包含SFrame文档中某些单词的外观数据。列名是'great'，'bad'，....并且每一行都有列表中不同行的出现次数(对不起，我在从VM获取屏幕截图时遇到了问题)。所以行值是非负整数0,1,2，... 我想创建一个有2列和11行的矩阵，其中有两个条目:一个包含每个单词的名称，另一个条目包含单词的总计数(固定列的所有行的rows.Each )。这些单词是名为“选定单词”的列表的一部分。我有点糊涂，我知道如何为现有的SFrame创建新的列，但不知道如何创建新的SFrame或其他一些Py

浏览 1提问于2016-12-06得票数 0

3回答

将int赋值给pandas中列表列中的字符串

python、pandas

我有一个Pandas dataframe，其中包含一个带有字符串列表的列。 <code>A0</code> 如何开始为列表中的每个值分配一个唯一的id，使其在整个列中都是相同的？ <code>A1</code>

浏览 35提问于2020-11-16得票数 3

回答已采纳

1回答

如何从保存在NSDocument中的另一个对象访问NSMutableArray对象？

cocoa、nsdocument

这实际上是对的扩展问题我有一个NSDocument类，它包含两个属性：text ( NSString )和phrases (带有NSString的NSMutableArray of NSObjects )。在Doc文件中，我有一个带有两列的TextView (用于显示短语)。第一列绑定到ArrayController并显示NSString。那还行。我希望计数NSString在text中出现的次数，并在第二列中显示。我试过什么在我的NSObject中定义一个指向TextView的静态变量。一旦加载了NIB，它就会将这个静态变量设置为包含TextView字符串的text。如果我打开一个窗

浏览 0提问于2011-10-09得票数 0

回答已采纳

1回答

基于另一列中的文本在pandas中创建列

python、pandas、string、dataframe

我在python中有一个pandas Dataframe，它有一个名为"Description“的列，其中包含一组由"\n”分隔的文本元素。我想通过拆分文本元素在相同的Dataframe中创建新列。例如，我有： Description '\nA: Elephant\nB: Cats\nC:Dog' 我想用关联的元素获得相应的列数，如下所示： Description A B C '\nA: Elephant\nB: Cats\nC:Dog' Elephant

浏览 11提问于2021-01-21得票数 0

1回答

如何迭代地在python中创建具有不同名称的向量

python、pandas、dataframe

我有pandas data.frame temp = pd.DataFrame({'country':['C1','C1','C1','C1','C2','C2','C2','C2'], 'seg': ['S1','S2','S1','S2','S1','S2','S1',

浏览 0提问于2018-02-02得票数 0

回答已采纳

1回答

将列的数据提取到变量中

python、pandas、jupyter

我有一个非常大的数据，其中一个列是字典本身。(比方说第12栏)。那本字典是超链接的一部分，这是我想要的。在木星中，我想显示一个具有0和2列的表，以及已完成的超链接。我想我需要：从dataframe中提取字典从中获取一个特定的键值。从提取的值创建完整的超链接复制dataframe并用上面创建的超级链接替换该列让我们来处理第一步，我将为接下来的步骤提出其他问题。如何将数据文件中的值提取到我可以使用的变量中？ import pytd import pandas client = pytd.Client(apikey=widget_api_key.value,

浏览 2提问于2019-08-07得票数 2

2回答

按主题抽取关键词

python、nlp、nltk、gensim

我有一个结构化的数据集，其中包含“text”和“topic”列。有人已经进行了单词嵌入/主题建模，因此“text”中的每一行都被分配了一个主题编号(1-200)。我想用主题编号和代表该主题的前5-10个关键词创建一个新的数据框架。我以前也这样做过，但我通常从头开始运行LDA模型。然后使用LDA创建的对象查找每个主题的关键字。也就是说，我是从我的主管给我的一个中间点开始的，它把我抛到了一边。数据结构如下： import pandas as pd df = pd.DataFrame({'text': ['foo bar baz', 'blah blin

浏览 21提问于2019-06-27得票数 0

1回答

如何使用filedialog.askopenfilename()从TkInter Python3中的另一个方法获取所选文件的路由

python、tkinter

我刚刚开始使用TKInter在python 3中使用GUI，我只想打开一个文件，读取它并在另一个excel文件上写入其中的一些列，所以我创建了一个方法来询问我想要读取的文件的路径： def UploadAction(event=None): filename = filedialog.askopenfilename() print('Selected: ', filename) lblOriginFile = Label(window, text='Select origin file: ') btnOriginFile = Button(w

浏览 4提问于2020-08-10得票数 1

回答已采纳

4回答

根据pandas中的另一个列值有条件地填充列值

python、python-3.x、pandas、dataframe、numpy

我有一个包含几列的DataFrame。一列包含正在使用的货币的符号，例如欧元或美元符号。另一列包含预算值。例如，在一行中，它可能意味着5000欧元的预算，而在下一行中，它可能意味着2000美元的预算。在pandas中，我想在我的DataFrame中添加一个额外的专栏，使欧元预算正常化。因此，基本上，对于每一行，如果货币列中的符号是欧元符号，则新列中的值应该是预算列中的值*1；如果货币列中的符号是美元符号，则新列中的值应该是预算列中的值* 0.78125。我知道如何添加一列，用值填充它，从另一列复制值等，但不知道如何根据另一列的值有条件地填充新列。有什么建议吗？

浏览 4提问于2012-05-23得票数 56

回答已采纳

2回答

如何计算一个值在使用Python的csv文件中发生的次数？

python、python-3.x、csv

我有一个csv文件，其中包含酒店和他们的星级评级(1星到5星)的列表。 B列承载每个酒店的星级等级，从第2行开始(第1行是标题"Review“)，每个单元格有一个星值(1-5)。我需要为Python编写一个脚本(v.3.6.4)来计算"5“在列"Review”中发生的次数。因此，公司中有多少人获得了五星级评级。例如，如果我有2000家酒店，其中800家拥有5星级评级，我需要python返回"800“。到目前为止，我已经写到： import csv from decimal import * import math import pandas as pd w

浏览 0提问于2018-06-14得票数 2

回答已采纳

1回答

一组行可以包括使用制表器的自定义摘要吗？

javascript、tabulator

我尝试创建一个单行，汇总分组数据。在线框中，您将看到按部门分组的员工信息。您还会注意到，在组标题下，有一行汇总信息(线框中的蓝色箭头)。到目前为止我已经尝试过很多事情了。最有希望的方法似乎是使用rowFormatter嵌入带有一行、一列w/汇总文本的嵌套表。这种做法的问题是：找到了一种只在组头之后插入表一次的方法。我想我可以从row.getPosition(true)中看到它在组中的位置，只有当它是0时才插入，但是位置似乎是全局位置。如果有一个组位置可以查看，这将解决这个问题。注意，而不是提供单独的列摘要(例如，不查找每一列的计数、和、计算值等)。其意图是为每一组提供一组数据的文本摘要

浏览 3提问于2020-02-24得票数 0

回答已采纳

2回答

识别Pandas DataFrame列的类型DataFrame值的numpy数组

arrays、pandas、numpy、dataframe、types

我正在编写连接使用Pandas Dataframes和Numpy数组的库的胶水代码，并且在确定Numpy数组中哪些列是“object/string”时遇到了一些问题，这些列最初是从Pandas创建的。 import pandas as pd test_df = pd.DataFrame({"a": [1, 2, 3], "b": ["one", "two", "three"]}) test_arr = test.values test_df2 = pd.DataFrame(test_arr) test_df.dt

浏览 2提问于2020-02-09得票数 2

回答已采纳

2回答

Python嵌套字典中的内部值没有明确的原因而改变

python、pandas、dictionary、nested

我正在尝试创建一个嵌套字典，该字典由Pandas dataframe中的两列索引，但是每次将新键添加到内部字典时，内部值都会发生变化。我的意图是有一个字典，它的键是一个dataframe列中的值，其值是字典，它的值是来自另一个列的键，其中内部字典的值来自第三列。我从嵌套字典的空白结构开始，遍历dataframe的行，并相应地更新字典值。 (我将展示我的意思，以及我尝试过的虚拟价值观。) import pandas as pd df = pd.DataFrame({'label': ['a1', 'a1', 'a1', '

浏览 0提问于2019-08-21得票数 2

回答已采纳

1回答

基于dict创建组合列的熊猫功能

python、pandas、dataframe、dictionary

我试图在pandas.DataFrame中创建一个加权列我有一个python dictionary，键是pandas.DataFrame列名，值是相应的权重。我想创建一个基于dictionary和引用pandas.DataFrame列值加权的新列。考虑到我的dictionary配置会改变并包含“错误配置”，有什么有效的方法来做到这一点呢？为例： import pandas as pd import numpy as np weights = {'IX1' : 0.3, 'IX2' : 0.2, 'IX3' : 0.4, '

浏览 1提问于2019-02-14得票数 3

回答已采纳

1回答

当CSV内容读取为列表时，pandas read_csv()返回带有.1和.2的重复条目

python-3.x、pandas

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。 target_df = pandas.read_csv(file_absoulte_path, nrows=0, engine='python').columns.tolist() 并将上面返回的列表与另一个列表(expected_columns)进行比较，如下所示。 if(colums_expected==target_df): logger.info("Column names are CORRECT, as expected!"

浏览 2提问于2021-07-15得票数 1

1回答

从列表中的字典中提取值

python、pandas、list、dictionary

我有一个DF列，它是一个列表中的字典。我想在字典中创建一个包含“value”的新列，即“I源更改2022年”，但通过下面的内容，我得到了NaN值。 import pandas as pd data = [10,[{'self': 'https://elia.atlassian.net/rest/api/3/customFieldOption/10200', 'value': 'IT-Sourced Changes 2022', 'id': '10200'}],30] df = pd.DataFra

浏览 17提问于2022-09-15得票数 1

回答已采纳

2回答

在Pandas中计算整个数据帧中特定字符串的数目，并将其值添加到新列中

python、pandas、dataframe

我有一个5列数据框架，我需要找出第一列(A)中每个元素重复多少次，并在一个新列(F)中将该元素前面的数量相加，例如第一列(A)中的'a‘在整个数据帧中重复5次，因此需要在第0行的相关单元格中创建列()和添加5，等等。感谢您的支持。我是python的新手，需要你的宝贵评论。以下是原始数据框架： A B C D E a - b a - c a - d b a - e d b a - 优先采用的数据框架是： A B C D E F a -

浏览 0提问于2021-01-16得票数 2

回答已采纳

4回答

“熊猫词典”栏中的项目计数

python、pandas、counter

我有一个包含字典的列的数据格式。我想要计算字典键在整个列中出现的次数。这样做的一个方法是： import pandas as pd from collections import Counter df = pd.DataFrame({"data": [{"weight": 3, "color": "blue"}, {"size": 5, "weight": 2},{"size": 3, "color": "red"}]}) c = Counter

浏览 0提问于2019-08-26得票数 3

回答已采纳

2回答

为什么熊猫的NaN数据不能作为字典密钥使用？

python、pandas、hashtable、nan

我试图在下面的数据帧中使用values列的元素作为字典中的键。 In [1]: import numpy as np ...: import pandas as pd ...: rng = pd.date_range('2021-06-01', periods=4) ...: values = [1, -1, 0, np.nan] ...: df = pd.DataFrame(values, index=rng, columns=['values']) In [2]: df Out[2]: values 2021

浏览 1提问于2021-06-07得票数 2

回答已采纳

4回答

查找df列是否以值开头，并根据该值剥离或设置为none

python、pandas、dataframe

我是pandas的新手，我想知道我们是否可以编写一行代码来检查和转换使用lambda的列。 pandas列包含PL和TM之间的值。其思想是创建函数转换器，以便在“PL123”或“TM123”设置为“missing”时从列中剥离PL。提前感谢您的帮助！

浏览 23提问于2021-07-06得票数 0

11回答

如何在保持列的顺序的同时创建DataFrame？

python、pandas

如何在保持列的顺序的同时，从多个DataFrame数组、Pandas系列或Pandas DataFrame创建一个Pandas？例如，我有这两个numpy数组，我想将它们合并为一个Pandas DataFrame。 foo = np.array( [ 1, 2, 3 ] ) bar = np.array( [ 4, 5, 6 ] ) 如果我这样做，bar列将排在第一位，因为dict没有保留顺序。 pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) } ) bar foo 0 4

浏览 7提问于2016-04-11得票数 52

回答已采纳

1回答

如何替换熊猫的细胞？

python-3.x、pandas

我有一个从CSV创建的Pandas数据帧，其中包含以下报头： podcast_name,user_name,description,image,ratings,category,itunes_link,rss,email,latest_date,listener_1,listener_2,listener_3,listener_4,listener_5,listener_6,listener_7,listener_8,listener_9,listener_10,listener_11,listener_12,listener_13,listener_14,listener_15,listen

浏览 4提问于2019-08-17得票数 1

回答已采纳

10回答

Pandas 'count(distinct)‘等同

python、pandas、count、group-by、distinct

我使用Pandas作为数据库的替代品，因为我有多个数据库(、等)，并且我不能为SQL等效项创建一系列命令。我在DataFrame中加载了一个表，其中包含一些列： YEARMONTH, CLIENTCODE, SIZE, etc., etc. 在SQL中，要计算每年不同客户端的数量，应为： SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH; 结果将会是 201301 5000 201302 13245 我如何在Pandas中做到这一点呢？

浏览 11提问于2013-03-14得票数 350

回答已采纳

1回答

解析python pandas dataframe中字典列中的多个列

python、pandas、dictionary、dataframe

我有一个由两列组成的pandas数据框架。一列是ID，另一列是100+键和值的嵌套字典。我试图将字典列解析为多个列(每个键对应一个列)，但我无法弄清楚。我能够做的是手动指定每个列的名称，并使用apply函数从字典中提取值： def get_col(row): d = ast.literal_eval(row["dictionary_col"]) js = json.dumps(d["key1"]) return js df["key1"]=df.apply(lambda row: get_col(row),axis

浏览 1提问于2016-11-15得票数 0

1回答

Pandas DataFrames:提取信息和折叠列

python、pandas、dataframe

我有一个pandas DataFrame，它包含列中的信息，我想将其提取到新列中。最好从视觉上解释： df = pd.DataFrame({'Number Type 1':[1,2,np.nan], 'Number Type 2':[np.nan,3,4], 'Info':list('abc')}) ? 该表显示了包含Number Type 1和NumberType 2列的初始DataFrame。我想提取类型并创建一个新的Type列，并相应地重

浏览 15提问于2019-02-27得票数 1

回答已采纳

2回答

在pandas dataframe中基于另一列创建列

python、pandas

我有一个pandas dataframe，其中一列只包含字符串。 df= pd.DataFrame( { "A": [2,4,7,17,39], "B": ["apple","apple","broccoli","rose","apple"] } ) 我想要检查列"B“，并查找字符串包含单词的特定部分的所有时间。然后，我创建了一个新的列"C“，它包含一系列字符串，当"app”出现在行中时，这些字符串就会说“水果”；当"ros“

浏览 0提问于2017-05-01得票数 2

1回答

For循环在创建Pandas系列时不起作用

python、pandas

我有一个数据集，其中有一列包含个人的姓名。我正在尝试创建一些基于每个名称是否包含特定字符串的虚拟变量。我有这些字符串的列表，并将names列提取为pandas序列。我正在尝试以下代码，但无法使for循环工作。有没有人能帮我指出我正在犯的错误？ import pandas as pd ds = pd.read_csv('address to .csv') names = ds['name'] list = ['n1', 'n2', ...] for l in list: l = names.str.contains(l,

浏览 15提问于2020-01-06得票数 0

4回答

如何从包含嵌套字典的字典创建Pandas Dataframe？

python、json、pandas、dataframe、dictionary

我正在从事一个项目，在这个项目中，我从JSON获取GraphQL数据。收到数据后，我对数据使用json.loads()，然后访问所需的JSON部分，然后将其存储在包含另一个字典的字典中。字典是： {'placement': 1, 'entrant': {'id': 8554498, 'name': 'Test'}} {'placement': 2, 'entrant': {'id': 8559863, 'name': 'Test'}}

浏览 84提问于2021-10-21得票数 0

回答已采纳

1回答

如何在spark sql dataframe中映射一列以创建新列？

python、pandas、dataframe、apache-spark

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

1回答

从Array创建Pandas数据帧

python、pandas、loops、dataframe

如何创建以数组中每个条目命名的新数据框架？我有一个从Pandas数据帧列创建的数组。看上去有点像下面。 [In] company_id = df.COMPANY_IDENTIFICATION.unique() [In] company_id [OUT] array(['BBG000QFYJ26', 'BBG000C0ZQY2', 'BBG000LNZ408', ..., 'BBG000QXGV57', 'BBG0022MJRB2', 'BBG0025394S5'], dtype=obje

浏览 1提问于2018-04-05得票数 1

回答已采纳

6回答

Pandas列访问，列名包含空格

string、pandas

如果我导入或创建一个不包含空格的pandas列，我可以这样访问它： df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)}) df1.data1 它会为我返回那个序列。但是，如果该列的名称中包含空格，则无法通过该方法访问该列： df2 = DataFrame({'key': ['a'

浏览 83提问于2012-12-07得票数 59

回答已采纳

1回答

TypeError:令人难以理解的类型：“迪克”-熊猫群

python、pandas

我正试图在我的DataFrame上运行一个熊猫群。 import pandas as pd # Groupby cols = ['col1','col2'] df = df.groupby(cols, as_index=False).agg({'r': lambda x: list(x)}) 有些列可能以dicts作为值。我试图找到它们并转换成如下字符串： # Find columns containing dicts col_dict = [i for i in df.columns if isinstance(dfd[i][0],dic

浏览 5提问于2022-07-15得票数 0

3回答

从包含dict的单个变量创建熊猫的数据

python、dictionary、pandas

我试图从这个函数中获得dataFrame： def total_sum(self): c = defaultdict(int) for slot in self.data: c[slot['accountLabelType']] += slot['totalPrice'] return(c) 它返回一个变量，该变量包含一个带有键:value结构的整块数据。当我试图像这样创建熊猫的数据时： def source_revenue(self): # df = pandas.DataFrame(self.data

浏览 4提问于2016-03-04得票数 3

回答已采纳

2回答

数组中的NSMutableDictionary输入在输出时不知何故丢失了信息。

objective-c、nsmutablearray、nsmutabledictionary

我有一个可变数组(downloadQueue)，它包含自定义对象(AssetNode)，每个对象都有一个NSMutableDictionary作为属性。 @interface AssetNode : NSObject { NSMutableDictionary* allData; } @property (nonatomic, retain) NSMutableDictionary* allData; 当我从AssetNode中删除downloadQueue时，其他AssetNode对象的.allData属性会被修改，并最终丢失一些值/键对。 -(void)removeAssetNod

浏览 2提问于2013-09-19得票数 2

回答已采纳

2回答

使用Python对DataFrame中的标头进行排序

python、header、dataframe、pandas

如何对数据帧的头部进行排序。 from pandas import * import pandas import numpy as np df2 = DataFrame({'ISO':['DE','CH','AT','FR','US'],'Country': ['Germany','Switzerland','Austria','France','United States']}) print df2

浏览 0提问于2013-05-27得票数 1

回答已采纳

1回答

如何将包含其他列中的值出现次数的列附加到现有的Dataframe？

python、python-3.x、pandas、dataframe

我有一个数据框架，其中包含从StackOverflow帖子中提取的下位词和上位词对。您可以在以下内容中看到其中的摘录： 0 1 2 3 4 linq query asmx web service THH 10 a linq query as an asmx web service application bolt THH 1 my application is a bolt on data visualization... area r time

浏览 17提问于2021-09-22得票数 1

回答已采纳

2回答

如何在现场感知的分解机器中使用散列技巧

scikit-learn、recommender-system、field-aware-factorization-machines、hashing-trick

事实证明，现场感知分解机 (FFM)在点击率预测任务中是非常有用的.他们的优势之一来自于散列技巧 (特性散列)。当你使用从sci-kit-学的散列技巧时，你会得到一个稀疏矩阵。那么，如何使用这样一个稀疏矩阵来实现字段感知的分解机器呢？SKLearn没有FFM的实现。编辑1:我想要执行功能哈希/哈希技巧，以确定，以便能够规模的FFM到数百万的功能。编辑2:熊猫不能扩展到许多领域。我还希望将任意CSV (包含数值和分类特性)转换为LIBFFM (字段:index:value)格式，并同时执行散列技巧(最好不使用Pandas)。即使在执行散列技巧之后，Pandas2FFM也不会扩展。

浏览 0提问于2020-06-01得票数 4

回答已采纳

1回答

如何计算日期出现在列表中的次数？

python、csv、counting、arcpy

所以我有个问题。我正在尝试创建一个脚本，它将查看ArcMap中的一个层(我们使用10.2.2)，创建一个csv文件，为最终的输出提供技术人员的名称和他们在某一天查看过的域的数量。要做到这一点，我认为我需要创建一个字典，它是针对每个技术人员的，并将日期作为键，并将其作为值出现的次数。这就是我被困的地方。我如何创建一个字典来统计一个日期出现的次数？到目前为止，我已经包含了我的代码，我非常不知道该去哪里，或者我是否在正确的领域。此外，我也不确定如何使csv文件与我需要的所有三列(名称，日期，计数)。 import arcpy, datetime from arcpy import mapping

浏览 2提问于2015-05-13得票数 0

回答已采纳

2回答

重复属性的Pandas和

python、csv、pandas

我正在使用Pandas操作一个包含多个行和列的csv文件，如下所示 Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce Wayne 10 . . Frustration John Joe 20 .

浏览 0提问于2015-04-12得票数 24

回答已采纳

2回答

从Python数据帧中提取值

python、pandas、dataframe

我有一个如下格式的Pandas数据帧： ID|Date|Values 1234|2021-01-01|{"Reason":"Change", "New Value":"Segment 2", "Old Value":"Segment 1"} 我想解析values列并创建一个新的dataframe： ID|Date|Old|New 值的顺序有时是不同的。如何在Python中提取这些值？

浏览 0提问于2021-06-03得票数 0

2回答

如何从Bokeh ColumnDatasource中提取数据

python、pandas、data-visualization、bokeh

我试图避免使用ColumnDataSource，而是将pandas dataframe列直接传递给Bokeh plots。不过，我很快就不得不实现一个HoverTool，它需要将数据放在ColumnDataSource中。所以，我开始使用ColumnDataSource。现在，我正在创建一个框注释，我必须使用数据中某一列的最大值来定义框的上边框。我可以使用pandas很容易做到这一点： low_box = BoxAnnotation( top=flowers['petal_width'][flowers['species']=='setos

浏览 4提问于2016-08-01得票数 8

回答已采纳

1回答

使用pandas数据帧修改csv中的数据

python、pandas、csv

我有一个这样的结构；用来创建一个pandas数据帧： my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas"], 'age' : [20,27, 35, 55, 18, 21, 35], 'designation': ["VP", "CEO

浏览 6提问于2019-07-15得票数 0

回答已采纳

1回答

Python:函数中的一个新列名()

python、pandas、function、dataframe

在下面的代码中，我创建了一个函数来返回一个DataFrame，其中包含一个新列new_col，其值为ori_col。但是，输出的新列名为new_col，而不是B。我在这里错过了什么？ import pandas as pd def add_col_diff(dframe, ori_col, new_col): shift_1 = dframe[ori_col].shift(1) return dframe.assign(new_col=shift_1) data = {'A': [10, 11, 12]} df = pd.DataFrame.from_dic

浏览 0提问于2018-12-29得票数 2

回答已采纳

1回答

将字典列表转换为pandas列

python、dictionary、pandas

我有一个pandas dataframe，它的一个列包含如下字符串： "Hex:6; HexNAc:3; NeuNAc:1}" "Fuc:1; Hex:7; HexNAc:2}" 我编写了以下函数，将此文本转换为具有键值对的字典，如下所示： def create_monosacch_columns(glycan_ident): glycans = glycan_ident.split("}")[0].split("; ") monosaccharides = [] for entry in glycans: key, va

浏览 1提问于2015-08-26得票数 1

3回答

Pandas Dataframe :使用count函数过滤数据

python、pandas、dataframe、count

我有一个pandas dataframe，我想通过应用基于count函数的过滤器来创建一个新的dataframe，以便只选择计数等于指定数字的那些列。例如在下面的数据框中： month_end Col A Col B Col C Col D 200703 NaN NaN NaN NaN 200704 0.084 0.152 0.142 0.0766 200705 0.124 0.123 0.020 Na

浏览 24提问于2020-09-07得票数 4

回答已采纳

1回答

如何在Bokeh中导入CSV作为ColumnDataSource，而无需通过Pandas？

bokeh

要在Bokeh中使用数据集，通常也会导入熊猫，并使用熊猫DataFrame作为数据。也可以从Pandas DataFrame创建ColumnDataSource。但是，有没有可能直接从csv文件(或任何其他表格源数据)转到Bokeh，而不使用Pandas作为桥梁创建，以及如何创建？

浏览 1提问于2017-08-14得票数 0

2回答

将excel电子表格读入pandas DataFrame时将数字转换为字符串

python、excel、pandas

我正在使用read_excel将一些excel电子表格(xlsx格式)读入pandas，它通常工作得很好。我遇到的问题是，当列包含数字时，pandas会将这些数字转换为float64类型，而我希望将它们视为字符串。在读取它们之后，我可以将列转换为str： my_frame.my_col = my_frame.my_col.astype('str') 这对于为列分配正确的类型是有效的，但是当我查看该列中的值时，字符串的格式是科学格式的，例如8.027770e+14，这不是我想要的格式。我想弄清楚如何告诉pandas将列作为字符串读取，或者稍后进行转换，以便获得原始(非科学)格式

浏览 17提问于2014-01-07得票数 4