当尝试合并多个数据帧时，如何解析"ValueError:如果使用所有标量值，则必须传递索引“ - 腾讯云开发者社区

python、pandas、merge、dataframe

我有两个数据帧，每个数据帧都有两个索引列。我想把它们合并。例如，第一个数据帧如下： V1 A 1/1/2012 12 2/1/2012 14 B 1/1/2012 15 2/1/2012 8 C 1/1/2012 17 2/1/2012 9 第二个数据帧如下： V2 A 1/1/2012 15 3/1/2012 21 B 1/1/2012

浏览 3提问于2016-04-11得票数 90

回答已采纳

1回答

无法在熊猫中使用群比函数进行数据处理

python-3.x、pandas、pandas-groupby

我有一个带有100+行的dataframe，其中需要使用groupby提取值w.r.t 'High‘列。但我做不到。我的数据样本是： Date Open High ... Volume Date Open High ... Volume 0 24-04-2020 1840.10 1851.60 ... 93384 1 23-04-2020 1786.00 1891.70 ... 453645 2 2

浏览 3提问于2020-05-06得票数 0

7回答

熊猫read_json：“如果使用所有标量值，则必须传递索引”。

python、json、pandas

我在用熊猫导入JSON文件时遇到了一些困难。 import pandas as pd map_index_to_word = pd.read_json('people_wiki_map_index_to_word.json') 这是我得到的错误： ValueError: If using all scalar values, you must pass an index 文件结构简化如下： {"biennials": 522004, "lb915": 116290, "shatzky": 127647, "woode

浏览 13提问于2016-07-14得票数 57

回答已采纳

1回答

Pandas将第一行计数为标题，但它不应该这样做

python、python-3.x、excel、pandas、dataframe

我正在从excel导入一个表，并将其转换为pandas数据帧。由于某些原因，即使我没有header命令，它也会继续将第一行数据计数为header。 df2=pd.DataFrame(pd.read_excel(r"/path/to/File.xlsx", sheet_name="Sheet2")) print(df2) 这将返回 +-+--+--+ |1|20|70| +-+--+--+ 0|4|27|50| +-+--+--+ 1|2|25|30| +-+--+--+ 2|7|23|80| ... 但我需要它回来 0 1 2 +-+--+

浏览 61提问于2021-03-29得票数 0

回答已采纳

1回答

Python :通过比较不同的数据帧列获得一个值

python、numpy、dataframe

我需要帮助，因为我试图通过比较不同的dataframes列来获得一个值。首先，我尝试使用"for循环“来达到目标，但是我有很多行，所以需要很多时间。现在，我想以这样的方式使用numpy.where：我有两个数据帧：- df1，其中每一行与其他行不同(列ID是唯一的主键)- df1'ID‘、'status’、‘df2’-只包含几行，而且每一行与其他行不同->df1 2‘code’、‘段’、'value‘。现在，我需要为dataframe1创建一个名为“权重”的新列。我试图以这样的方式创建列“权重”： df1['weight'] = n

浏览 4提问于2017-08-03得票数 0

回答已采纳

1回答

pandas方法，str- df.apply，“如果使用所有标量值，则必须传递索引”

python、pandas、apply

我有一个Pandas-df，看起来像这样： pods_infos = pd.read_csv("data.txt", delimiter = ";", index_col = 0, header = None, names = ["Position", "Capacity","Capacity reversed", "Storage tag", "Ready for refill", ""

浏览 0提问于2020-08-04得票数 0

1回答

Pandas多索引数据帧合并问题

python、pandas、dataframe、merge、multi-index

我想合并两个数据帧，df1和df2，它们有多个索引列： mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['variable', 'year']) mi2 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2019')], names=['variable', 'yea

浏览 61提问于2020-12-15得票数 0

回答已采纳

2回答

如何访问一个数据帧的(多)索引？

indexing、group-by、pandas

我有一个数据框，并使用其中的一些列执行group by grouped = df.groupby(['col1', 'col2']) 现在我使用mean函数从上面创建的groupby对象中获得一个新的data frame对象： df_new = grouped.mean() 现在我有两个数据帧(df和df2)，我想使用col1和col2合并它们。我现在遇到的问题是df2没有这些列。在groupby操作之后，col1和col2被“移位”到索引。因此，为了解决这个问题，我尝试创建以下列： df2['col1'] = df2['index

浏览 0提问于2013-05-23得票数 2

回答已采纳

3回答

在Pandas中为两个列和单个数据行创建DataFrame

python、pandas

我对Pandas和DataFrame的概念很陌生，并通过实验学习。在创建一个新的DataFrame时，我尝试使用以下代码，但给出了一些错误。请建议一下。 import pandas as pd akshit = pd.DataFrame({'Name': 'Akshit', 'Last': 'Gupta'}) 我预期会创建dataframe，但是我得到了以下错误： ValueError:如果使用所有标量值，则必须传递索引

浏览 0提问于2019-06-02得票数 1

回答已采纳

1回答

Pandas中iloc函数的用例是什么？

python、pandas

在下面的代码中，有2个数据帧具有相同的标签(recent_grads和all_ages)： majors = recent_grads['Major'].unique() rg_lower_count = 0 for m in majors: recent_grads_row = recent_grads[recent_grads['Major'] == m] all_ages_row = all_ages[all_ages['Major'] == m] rg_unemp_rate = recent_grads_row.

浏览 1提问于2017-08-14得票数 2

1回答

为什么我得到的潘达斯数据帧只有一列vs系列？

python、pandas、dataframe、series

我注意到了几次单列数据帧(下面的例子)；但在其他大多数情况下，单列数据框架只是一个系列。对于为什么返回一列DF，有什么押韵或理由吗？示例： 1)当用布尔掩码索引列时，掩码只有一个真值 df = pd.DataFrame([list('abc'), list('def')], columns = ['foo', 'bar', 'tar']) mask = [False, True, False] type(df.ix[:,mask]) 2)当对只有两列的DataFrame设置索引时，首先： df = pd.Data

浏览 5提问于2014-09-18得票数 5

回答已采纳

23回答

从变量中的值构造pandas索引会给出"ValueError:如果使用所有标量值，则必须传递索引“

python、pandas、dataframe、scalar

这可能是一个简单的问题，但我想不出该怎么做。假设我有两个变量，如下所示。 a = 2 b = 3 我想用下面的代码构建一个DataFrame： df2 = pd.DataFrame({'A':a,'B':b}) 这会生成一个错误： ValueError:如果使用所有标量值，则必须传递索引我也试过了： df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() 这会给出相同的错误消息。

浏览 161提问于2013-07-25得票数 548

回答已采纳

1回答

在Python中计算相关性时出现问题

python、correlation

我有以下数据框我需要计算所有列的相关矩阵。问题是:当我分别计算两列时，得到的值与使用df.corr()计算每一对的所有值时不同。我构建数据帧的方式是将第一列与其他列合并，这种合并过程导致两个数据帧的行长不同。例如:第一列( btc_logreturns )和第二列(gold_logreturns)最初有2000行，而btc_logreturns和ewz_logreturns有2100行。但是所有列加起来有2459行。在计算相关性时，函数.corr()是否考虑了NaNs？对于我得到的不同相关值，数据帧的长度是否是一个潜在的问题？

浏览 1提问于2021-05-07得票数 0

1回答

使用datetime索引创建Pandas数据帧的时移副本

python、pandas、datetime、merge

我想对两个数据帧进行时间序列关联；原始数据帧和旧数据帧。我已经创建了我的第一个数据帧的时移副本，名为shifted_raw，与旧版本进行比较。我用过 shifted_index=vraw_os_flight_data_df.index+timedelta(seconds=timeshift) shifted_vraw_os_flight_data_df=vraw_os_flight_data_df.copy() shifted_vraw_os_flight_data_df.index=shifted_index shifted_vraw_os_flight_data_df.columns=

浏览 10提问于2020-04-17得票数 0

1回答

狮身人面像搜索多指标和源

search、sphinx

我正在制作一个动态的CMS，所以CMS的每个实例都会在一个MYSQL中有它的表。到目前为止，一切都正常。环境： 8不同网站的内容不同。它们只共享DB名称，但都有不同的表($sitename_posts)search enigne SPHINX。现在我坚持这样做:例如，当用户在站点1上进行搜索时，我希望搜索所有表，$sitename_posts并返回最佳结果。作为搜索引擎，我使用斯芬克斯。我尝试过使用两个源和两个索引，但是当我搜索时，例如： $sphinx = new SphinxClient; $sphinx->setServer($sphinx_host, $sphinx_por

浏览 4提问于2011-09-18得票数 0

回答已采纳

5回答

Pandas联接问题:列重叠，但未指定后缀

python、join、pandas

我有以下数据帧： print(df_a) mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print(df_b) mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 7 当我尝试连接这些数据帧时： join_df = df_a.join(df_b

浏览 251提问于2014-10-30得票数 175

回答已采纳

1回答

如何从列表中提取每个字典并将其放入dataframe中？

python、list、dataframe、dictionary

我有一个这样的列表：['{"a":0,"b":1,"c":2},{"a":1,"b":2,"c":3},{"a":1,"b":2,"c":3}'] 它在列表中只有一项。我想提取每个字典，并将它们放入一个数据帧中。

浏览 23提问于2021-03-26得票数 0

1回答

Pandas join提升KeyError / merge提升ValueError

python、pandas、join、merge

我正在尝试使用公共列(tct)连接两个数据帧(df_out和j)。 df.head()返回： tct 0 10000.00 1 10001.00 2 10002.00 3 10003.01 4 10003.02 首先，我尝试了： df_out = df_out.join(j, on='tct', how = 'left', lsuffix='_left', rsuffix='_right') 并接收到 KeyError: 'tct' 当j.head()返回时： tct

浏览 3提问于2017-08-05得票数 1

回答已采纳

1回答

删除后Pandas重复的索引

python-3.x、pandas、duplicates、pivot

我得到："ValueError:索引包含重复条目，无法重塑“ 我正在处理的数据非常庞大，我不能提供样本数据，也不能用较小的数据集复制错误。我试图用虚拟数据生成副本来复制我的原始帧，但由于某种神秘的原因，代码只适用于虚拟数据，而不适用于我的真实数据。这就是我所知道的我正在处理的形状。 <code>A0</code> 现在我想找出哪些行是重复的。 <code>A1</code> 为了确保我删除了所有的副本，只保留了第一个： <code>A2</code> 这是我拿到ValueError的时候： <code>

浏览 17提问于2020-08-01得票数 0

回答已采纳

3回答

在pandas中合并数据帧-继续获取键错误？

python、pandas

我正在尝试合并两个数据帧，testr和testc，但我一直在"Channel ID“上得到一个关键错误，并且不确定问题是什么。数据帧是否必须具有相同的大小或具有相同的数据类型才能使pd.merge工作？下面是我在每个数据帧上与.info()合并的代码： def matchID_RC(rev,cost): rc = pd.merge(rev, cost, on='Channel ID', how = 'outer') return rc testr.info() <class 'pandas.core.frame.DataF

浏览 1提问于2015-06-20得票数 2

2回答

向dask.dataframe添加dask.array列

python、dataframe、dask

我有一个dask数据帧和一个dask数组，它们以相同的逻辑顺序具有相同的行数。数据帧行通过字符串进行索引。我正在尝试将一个数组列添加到数据帧中。我尝试了几种方法，但都以其特定的方式失败了。 df['col'] = da.col # TypeError: Column assignment doesn't support type Array df['col'] = da.to_frame(columns='col') # TypeError: '<' not supported between instances

浏览 15提问于2018-01-09得票数 8

1回答

对dataframe对象执行计算，并将它们附加到按对象分组的多索引级别上，使用python中的熊猫。

python、pandas、dataframe、pandas-groupby、multi-index

我试图将一行添加到多索引级别，并执行基于未分组数据row中的各个行构造的计算。然后将计算结果添加到分组数据帧中。 import numpy as np import pandas as pd import random years = [2000, 2001, 2002] products = ["A", "B", "C"] num_combos = 10 years = [random.choice(years) for i in range(num_combos)] products = [random.choice(products)

浏览 8提问于2022-06-19得票数 0

回答已采纳

1回答

Faunadb在子项目字段上创建索引

faunadb

我试图在文档中获取子项字段的索引。数据如下： [ { "ref": Ref(Collection("ColA"), "111111111111111111"), "ts":1659241462840000, "data":{ "name":"Test a", "members":[ { "userId":"1

浏览 6提问于2022-07-31得票数 0

回答已采纳

1回答

如何在pandas中将索引转换为无毫秒的日期时间

pandas、datetime、datetimeindex

我有一个数据帧，我希望将其索引转换为日期时间格式：%Y%m%d%H:%M:%S。我已经尝试了以下代码：pd.to_datetime(dfn.index,origin=pd.Timestamp('2012-01-01 00:00:00')) 但是，返回的DateTime格式将索引值归于毫秒，如下所示。指定格式时，我得到错误消息: ValueError:时间数据'1325376000000000000‘与格式'%Y%m%d%H:%M:%S’不匹配(匹配) 我想要将索引值归因于小时数，我如何才能这样做？原始数据如下所示。

浏览 2提问于2020-05-28得票数 0

2回答

熊猫read_csv

python、pandas、csv

这是我的密码： import os import pandas as pd path = os.getcwd() files = os.listdir(path) df = pd.DataFrame() for f in files: data = pd.read_csv(f, usecols = ['A','B','C','D','E']) df = df.append(data) 我得到回溯： File "C:\Users\dbhadra\AppData\Local\Conti

浏览 0提问于2019-05-09得票数 0

回答已采纳

1回答

如果另一个数据帧之间的另一个列条目匹配，则从另一个数据帧的行条目填充pandas列

python-3.x、pandas

我正在尝试向数据帧中添加一个新列。首先，我想检查每一行的id是否存在于另一个数据帧中。如果是，那么我想用来自另一个数据帧的值填充我的行条目。例如，我想要查找的数据帧如下所示： id replays 0 2 1 1 5 1 2 6 2 3 8 3 4 12 1 我想要为其创建新列的dataframe最初看起来像这样，只有id： id 0 2 1 5 2 6 最终，应该使用如下所示的新列填充此dataframe，其中重放条目是那些与第一个dataframe中的id匹配的条目： id replays 0 2 1

浏览 11提问于2020-12-18得票数 0

回答已采纳

2回答

如何在不使用任何联接的情况下水平和直接附加3个数据帧？

python、pandas

我有一个仅包含国家/区域列的数据框架只包含已确认列的第二个数据帧。第三个数据框架仅包含死亡列。问题是如何在不使用任何复杂方法的情况下直接附加上述三个数据帧？我想要的结果是：

浏览 0提问于2021-12-10得票数 -1

回答已采纳

1回答

在spark scala中使用caseclass与structtype

scala、dataframe、apache-spark

什么时候应该使用Structtype，什么时候应该使用case类。我正在尝试创建spark数据集。我有一个输入CSV文件，我正在尝试首先创建一个数据帧，然后使用df.as[]将其转换为数据集。现在，为了生成模式，我应该使用structtype还是case类？请帮帮忙。

浏览 0提问于2019-11-24得票数 0

2回答

熊猫:创建索引后合并中的关键错误

python、pandas、dataframe

我有大量的数据帧要合并，以确保合并是以多处理方式进行的，我决定使用索引。但是在创建索引之后，我得到了键错误。例如： df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3']}) (Pdb) df1 A B 0 A0 B0 1 A1 B1 2 A2 B2 3 A3 B3 但是第二个DataFrame： df

浏览 2提问于2016-11-20得票数 2

回答已采纳

1回答

如何读取csv文件，跳过描述(在几行中)到dataframe？

python、pandas、dataframe、csv

我有几个csv文件。每个csv文件都有其跨几行的描述(15行在几个文件中，100行在其他几行中等等)。我想把csv文件读入数据格式。我尝试使用pandas.DataFrame('file1.csv')将数据读入数据。不管怎么说，我得到了以下错误。 Traceback (most recent call last): File "snowdepthData.py", line 5, in <module> depthDF = pd.DataFrame('Alaska_SD_Sep2019toOct2020.csv') F

浏览 2提问于2021-02-13得票数 1

回答已采纳

2回答

为什么我不能将包含在引号中的浮点值转换为Python中的int数据类型？

python

当我试图将包含在引号中的浮点数据类型转换为整数数据类型时，有人能解释为什么会出现ValueError吗？发生ValueError的例子： print(int("7.3")) 但是，当我试图转换一个值时，例如： print(int(7.3)) 当尝试将7.3不包含在引号中的7.3转换为整数数据类型时，没有发生错误

浏览 14提问于2022-03-13得票数 0

1回答

我如何基于一个公共的列，研究站点“名称”来组合2个熊猫数据帧？

python、pandas

我是Python和一般编程的新手。我正在尝试用python自动化一些地下水模型输出数据的处理。一个pandas数据帧测量了具有不同类型的多个列的数据流(左)，另一个对数据流进行了建模(右)。我尝试在列"Name“上使用pd.merge，以便将正确的建模输出值链接到相应的测量站点值。当我使用下面的脚本时，我得到相应的错误： left = measured_df right = modeled_df combined_df = pd.merge(left, right, on= 'Name') ValueError:列标签'Name‘不是唯一的。对于多索引，标签

浏览 8提问于2020-03-31得票数 2

回答已采纳

2回答

UART帧控制器的实现

c、data-structures、interrupt、stm32、dma

我正在STM32板上编程，我对如何使用我的外围设备感到困惑:轮询、中断、DMA、DMA中断. 实际上，我编写了一个发送基本数据的UART模块，它以轮询、中断和DMA方式工作。但我希望能够发送和接收长度可变的特定帧，例如：启动我也有传感器，我想在这些UART帧中与传感器交互接收到的数据。所以，我不明白的是：如何编程UART模块在“帧”模式下工作？(缓冲？循环DMA？打断一下？在哪里，何时.) 当我能够用UART发送或接收帧时，与传感器交互的最佳方式是什么？(在计时器中断内？在状态机里？用外生变量？) 将来，我们的想法是在freertos上运行这个应用程序。谢

浏览 6提问于2017-04-12得票数 1

1回答

将数据拆分成多个SQLite表或数据库会更快地检索数据吗？

sql、sqlite

我正在为位置数据创建一个SQLite数据库。大约有1000万行，我希望尽可能快地获得SELECT语句。我只需要发布一次数据库，我不在乎创建阶段需要多长时间。用户将只同时查看地图的一部分，因此需要同时访问地理位置相近的数据。我已经把我的数据分成了几块。每个瓷砖对应于一个纬度和经度区域。我的问题是，对于最快的查找时间，我是否应该：有多个数据库，每个瓷砖有一个数据库，或有一个数据库，包含多个表，每个瓷砖一个表，或有一个只有一个表的大数据库，因为分割数据不会使搜索速度更快。我可以尝试每一种方法，但我真的很想了解解决方案。

浏览 3提问于2012-11-21得票数 1

回答已采纳

2回答

如何使用自动增量索引从字典中创建数据

pandas、dictionary

我理解要创建一个数据格式，我需要从我的字典中指定索引，否则我们会得到'ValueError:如果使用所有标量值，您必须传递一个索引‘错误。但是，如何从字典中创建数据，其中索引只是一个自动增量数字？

浏览 1提问于2016-07-06得票数 3

回答已采纳

1回答

Python :用日期时间对象列表覆盖索引

python、datetime、indexing、pandas

我在标题中有一个带有时间戳的输入CSV，如下所示(形成列的时间戳的数量为数千)： header1;header2;header3;header4;header5;2013-12-30CET00:00:00;2013-12-30CET00:01:00;...;2014-00-01CET00:00:00 在Pandas0.12中，我能够做到这一点，将字符串时间戳转换为datetime对象。下面的代码去掉时间戳字符串(translate())中的“CEST”，将其读入为一个日期时间(strptime())，然后将其本地化到正确的时区(localize())。这种方法的原因是，至少在我的版本中

浏览 1提问于2015-04-23得票数 1

回答已采纳

1回答

多头数据帧的Pandas合并

python-3.x、pandas、dataframe、merge

对于一个日常分析脚本，我想要递归地将多头数据帧与另一个多头数据帧合并。所以基本上我的每个数据框都会有一个公共的列&其余的列将按日期添加。代码： import pandas as pd L = [('Category','Fruits','colors'),(d,'A','C')] cols = [(new, c) for new, start, end in L for c in df1.loc[:, start:end].columns] df1.columns = pd.MultiIndex.fr

浏览 146提问于2020-06-14得票数 0

2回答

wsgi如何处理同名的多个请求头？

python、http、wsgi

在WSGI中，头部在环境中表示为'HTTP_XXX‘值。例如，值Cookie:标头存储在环境的HTTP_COOKIE密钥中。如何表示具有相同头部名称的多个请求头部？

浏览 0提问于2009-11-26得票数 10

回答已采纳

2回答

pandas merge_asof键在排序后必须排序错误

python、pandas、merge

我想将一个数据框中的目标列合并到另一个数据框中。合并的数据帧有更多的关键点，它们很接近，但与原始数据帧不完全匹配。下面是一个例子：原始数据帧(FDMA) DMA 130506 130510 130512 130555 130556 合并数据帧(ZC) DMA Distance (Miles) 1305060 303.87 1305061 305.35 1305062 278.80 1305065 299.94 1305067 291.83 pd.merge_asof(FDMA,ZC[['DMA','D

浏览 0提问于2018-03-01得票数 5

回答已采纳

1回答

将字典转换成熊猫数据

python、pandas、dataframe

尝试过这个： df = pd.DataFrame(list(sample.items()),columns = ['id','age','chest_pain_type', 'blood_sugar','rest_electro','max_heart_rate', 'exercice_angina','rest_blood_pressure']) 得到了这样的结果：8列被传递，传递的数据有2列，并且在这一行中出现了错误： columns = _va

浏览 1提问于2021-05-12得票数 0

回答已采纳

1回答

boost::asio读取-从套接字读取所有数据后返回，无需等待EOF

c++、http、boost、boost-asio

我是boost::asio的新手，我遇到了一个问题，我真的不知道怎么解决，你能帮我吗？总的来说，我正在尝试实现基于boost::asio的代理。我使用async_read_some函数从服务器读取响应，如下所示： _ssocket.async_read_some(boost::asio::buffer(_sbuffer), boost::bind(&connection::handle_server_read_body_some, shared_from_this(),

浏览 0提问于2013-05-16得票数 1

回答已采纳

2回答

从时间索引数据帧中删除行

pandas、time-series、delete-row、dataframe

我试图通过简单地传递日期和时间来删除Pandas数据帧中的一行。数据帧的结构如下： Date_Time Price1 Price2 Price3 2012-01-01 00:00:00 63.05 41.40 68.14 2012-01-01 01:00:00 68.20 42.44 59.64 2012-01-01 02:00:00 61.68 43.18 49.81 我一直在尝试使用df = df.drop('2012-01-01 01:00:00

浏览 1提问于2013-05-17得票数 12

回答已采纳

2回答

我是否应该连接功能和目标数据帧，以便与scikit-learn一起使用？

pandas、scikit-learn

我正在尝试创建一个回归模型来使用设计参数(dataframe 1)来预测可交付成果(dataframe 2)。这两个数据帧都有一个id号，我将其用作索引。是否可以使用两个数据帧为sklearn创建一个数据集？或者我需要加入他们？如果我需要加入他们，那么最好的方式是什么？ # import data df1= pd.read_excel('data.xlsx', sheet_name='Data1',index_col='Unnamed: 0') df2= pd.read_excel('data.xlsx', sheet_nam

浏览 0提问于2021-04-12得票数 0

3回答

如何在python中从索引中取回列名？

python、pandas

我有数据帧，从我转换成ndarray开始， X = df.iloc[:].values 然后我做了特征选择，给出了一些列3,45,67,89,101,145，... 由于有许多列，我可以知道如何在数据帧中取回相应的列名反之，我可以使用下面的代码 cols = ['Amount','Savings_Amount','Loan_Term'] [df.columns.get_loc(c) for c in cols if c in df] 但我需要从索引中找出名字。

浏览 11提问于2019-07-29得票数 0

回答已采纳

1回答

无法使用python以DataFrame格式打印字典

python、pandas、dictionary

我有包含字典文本文件，当尝试在类中使用pandas导入和打印数据帧时，它显示错误为"ValueError: dataframe构造函数未正确调用！“。但当尝试导入并打印在单元中的jupyter笔记本时。它能够打印数据帧。不知道哪里会出错。数据帧格式如下。 {'id_1' : {'name': 'person1','height': u'150', 'weight': 56, 'age' : 20, 'DOB' : ''02 Aug 2005&

浏览 0提问于2019-03-11得票数 0

1回答

熊猫合并两个数据帧是否存在已知问题，每个数据帧都有一个日期时间类型的索引

pandas

我合并了两个数据帧，每个数据帧都有一个日期时间类型的索引，因此得到的数据帧的行数比原来的多。这两个数据帧具有相同数量的记录，每个和相同的索引值。看一下--我发现同一索引上有重复的记录--这是一个已知的问题吗？守则： df_merged = df1.merge(df2, left_index=True, right_index=True)

浏览 2提问于2022-01-18得票数 0

4回答

MySQL可以对单个查询使用多个索引吗？

mysql、indexing、database-indexes

假设有一个表有多个列，比如id, a, b, c, d, e。我通常选择by id，然而，在客户端应用程序中有多个查询，它对列的子集使用各种条件。当MySQL在具有多个列的多个WHERE条件的单个表上执行查询时，它真的可以利用在不同列上创建的索引吗？或者，提高速度的唯一方法是为所有可能的查询创建多列索引？

浏览 3提问于2012-09-01得票数 59

回答已采纳

1回答

合并/连接Pandas数据帧

python、pandas、dataframe、join

我有两个数据框，第一个来自岛上的一家摩托车租赁公司，它包括关于摩托车类型、持续时间、开始和结束时间以及许多其他字段的数据，第二个包括来自这个岛屿的气象数据。由于每天的气象数据每3小时有8个记录/测量(例如，在凌晨1点、4点到22点)，我将第一个数据帧中的开始时间转换/削减为8个框，以便为每个记录组合相应的天气条件。我如何将这两个框架组合在一起，以便每个租金都具有相应的天气条件？假设我有字段df1.rent_id、df1.rent_day、df1.starting hour(从1到8)和df2.day、df2.hr(从1到8)、df2.temp等等如何组合/连接这两个数据帧以获得我想要的

浏览 2提问于2019-06-16得票数 0

1回答

如何根据两列中的值查找和引入另一个数据帧中的值

python、pandas、dataframe、mapping、vlookup

我有两个数据帧。我需要从右侧(第二个)数据库中提取一个值，并基于两个数据帧中存在的另外两个列，将其作为列添加到左侧(第一个)数据帧中。这样做时，我需要在左边的dataframe中为这个列指定一个不同于在右边的dataframe中调用的名称。我排除了merge和join，因为dataframes有成百上千的列，我只需要带出一列，并且在这样做的时候还需要更改列名。相反，我正在尝试map它。例如： import pandas as pd emp_data = { 'Name':['Tom', 'Tom', 'Ste

浏览 6提问于2019-05-01得票数 1

2回答

如何在迭代pandas数据框时创建新列和插入行值

python、pandas、iteration、dataframe

我正在尝试创建一个逐行迭代pandas数据帧的函数。我想基于其他列的行值创建一个新列。我的原始数据帧可能如下所示： df: A B 0 1 2 1 3 4 2 2 2 现在，我想在每个索引位置创建一个用列A-列B的行值填充的新列，结果如下所示： df: A B A-B 0 1 2 -1 1 3 4 -1 2 2 2 0 我的解决方案有效，但仅当我不在函数中使用它时： for index, row in df.iterrows(): print index

浏览 0提问于2015-12-07得票数 19

回答已采纳