如果日期时间在彼此的特定时间内，则在Python中连接两个数据集，并创建一个不匹配的数据集

在Python中连接两个数据集并创建一个不匹配的数据集，可以使用pandas库来实现。pandas是一个强大的数据分析工具，提供了丰富的数据处理和操作功能。

首先，我们需要导入pandas库：

import pandas as pd

接下来，我们可以使用pandas的DataFrame对象来表示数据集。假设我们有两个数据集，分别是df1和df2，它们包含日期时间列和其他列。

# 创建df1数据集
df1 = pd.DataFrame({
    '日期时间': ['2022-01-01 10:00:00', '2022-01-02 12:00:00', '2022-01-03 14:00:00'],
    '数据1': [1, 2, 3]
})

# 创建df2数据集
df2 = pd.DataFrame({
    '日期时间': ['2022-01-01 09:00:00', '2022-01-02 11:00:00', '2022-01-03 13:00:00'],
    '数据2': [4, 5, 6]
})

接下来，我们可以使用pandas的merge函数将两个数据集连接起来。merge函数可以根据指定的列进行连接，默认情况下使用内连接方式。

# 连接两个数据集
merged_df = pd.merge(df1, df2, on='日期时间')

上述代码中，我们指定了'日期时间'列作为连接的依据。如果两个数据集中的'日期时间'列的值在彼此的特定时间内匹配，那么它们将被连接在一起。

如果我们想要创建一个不匹配的数据集，可以使用merge函数的how参数指定连接方式为'outer'，这样就会保留不匹配的行。

# 创建不匹配的数据集
unmatched_df = pd.merge(df1, df2, on='日期时间', how='outer')

上述代码中，我们使用了'outer'连接方式，这样不仅会保留匹配的行，还会保留不匹配的行。

至于推荐的腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，我无法给出具体的推荐。但是腾讯云提供了丰富的云计算服务，包括云服务器、云数据库、云存储等，可以根据具体需求选择适合的产品。

总结起来，以上是在Python中连接两个数据集并创建一个不匹配的数据集的方法。通过使用pandas库的DataFrame对象和merge函数，我们可以方便地进行数据集的连接和操作。

在DataFrame中不创建辅助列的情况下执行合并日期字段

python、pandas、dataframe、datetime

在蟒蛇大熊猫中做下面的DataFrames： | date | counter | |-----------------------------|------------------| | 2022-01-01 10:00:02+00:00 | 34 | | 2022-01-03 11:03:02+00:00 | 23 | | 2022-02-01 12:00:05+00:00 | 12 | | 2022-03-01 21:04:02

浏览 6提问于2022-05-13得票数 2

回答已采纳

2回答

比较两个数据格式并返回公共值

python、pandas、dataframe

我有两个数据帧，需要获取基于两个数据帧的“名称”列的system_type列。我有500000行df1作为格式名称时间戳使用AXCS 2022-01-01 5 BGXD 2022-02-01 70 HFSD 2022-03-01 45 AEVC 2022-01-01 25 BHRF 2022-02-01 12 和550000行df2作为名称System_Type HFSD测试BGXD产品AEVC Prod测试我使用了以下编码 pd.merge(df1, df2, on="Name") 它需要大量的时间来处理，是否有其他的方法/方法来处理它。请指教

浏览 5提问于2022-03-14得票数 0

回答已采纳

2回答

需要根据年份使用Pandas迭代比较两个数据

python、pandas、dataframe、numpy

我有两个数据帧，需要迭代比较，不匹配的行必须存储在csv中。因为它有历史日期，所以需要根据年份进行比较。如何才能在潘达斯实现这一点？ product_1 price_1 Date of purchase 0 computer 1200 2022-01-02 1 monitor 800 2022-01-03 2 printer 200 2022-01-04 3 desk 350 2022-01-05 product_2 price_2 Date of purchase 0 computer 9

浏览 5提问于2022-03-14得票数 0

3回答

如何基于日期和时间两栏在熊猫中创建日期时间列？

python、python-3.x、pandas、datetime

让我说我有下面的DataFrame import pandas as pd df = pd.DataFrame({"Date":["2022-01-01", "2022-01-02", "2022-01-03"], "Time":[0,1,10]}) 我想要另一个列，它是一个使用日期和时间列的datetime。预期结果 Date Time DateTime 0 2022-01-01 0 2022-01-01 00:00:00 1 2022-01-02

浏览 6提问于2022-02-23得票数 1

回答已采纳

4回答

如何对熊猫的数据进行分组和重采样？

python、pandas、dataframe

我有不同日期不同客户的销售数据。但是日期并不是连续的，我想把数据重新整理到每日的频率上。我该怎么做？米维 import numpy as np import pandas as pd df = pd.DataFrame({'id': list('aababcbc'), 'date': pd.date_range('2022-01-01',periods=8), 'value':range(8)}).sort_values('id&#

浏览 5提问于2022-08-29得票数 3

回答已采纳

2回答

熊猫使用列值匹配上的另一个dataframe值更新数据格式。

python、pandas、dataframe

我有一个带有股票代码名和日期的数据文件，作为两列，我想从另一个匹配这2列的更大的dataframe中用价格值更新这个数据have。例: df1： ticker Date AAPL 2022-01-03 GE 2022-04-18 df2： ticker Date Close AAPL 2022-01-02 120 AAPL 2022-01-03 122 AAPL 2022-01-04 125 AAPL 2022-01-05 121 . . . GE 2022-

浏览 2提问于2022-07-10得票数 2

回答已采纳

2回答

DataFrame :根据来自另一个DataFrame的有效索引将DataFrame的值设置为NaN

python、pandas、dataframe、numpy

我有两个DataFrames： df1: ticker A B C date 2022-01-01 NaN NaN 100 2022-01-02 NaN 200 NaN 2022-01-03 100 NaN NaN 2022-01-04 NaN NaN 120 df2: ticker A B C date 2022-01-02 145 233

浏览 4提问于2022-10-20得票数 1

2回答

如何避免火花中使用for循环(python)

python、apache-spark、pyspark、bigdata

我是pySpark的新手，希望有人能帮我。我有一组文件搜索结果的数据文件： +------+-----------+----------+----------+-----+ |origin|destination| from| to|price| +------+-----------+----------+----------+-----+ | TLV| NYC|2022-01-01|2022-01-05| 1000| | TLV| ROM|2022-03-01|2022-04-05| 480| | TLV|

浏览 21提问于2022-07-18得票数 0

回答已采纳

1回答

熊猫:拆下一条数据通道

python、pandas、join

我在熊猫中有一个很大的数据表，可以更好地表示为多个关系表。是否有一种方法可以选择要在新的dataframe中使用的列，并对剩馀的列进行索引以允许联接重新创建原始表？例如，假设我们有一个数据集，其中一些列在几行中重复多次： data = { '1': ['A', 'Abe', 'Bucket', '2022-01-01', 1,0], '2': ['A', 'Abe', 'Bucket', '2022-01-0

浏览 5提问于2022-09-08得票数 0

回答已采纳

1回答

在dataframe中为每个不同的ID添加缺少的时间戳

python、pandas、date、datetime、unique

我有两个数据格式(简单的例子如下所示)： df1 df2 time column time column ID column Value 2022-01-01 00:00:00 2022-01-01 00:00:00 1 10 2022-01-01 00:15:00 2022-01-01 00:30:00 1

浏览 6提问于2022-07-25得票数 1

回答已采纳

1回答

当不存在公共记录时，Pandas merge将删除添加的列

python、sql、pandas、merge、jupyter-notebook

我留下了基于键的连接数据帧A到B。合并后，我发现在右边的dataframe上没有任何记录与右边的dataframe具有相同的键，但是右边的表中的列仍然被添加。如果没有公共记录，如何阻止Pandas添加新列？

浏览 0提问于2019-07-24得票数 0

2回答

Python:根据最近的索引将两个DataFrames的列相乘

python、pandas、dataframe、mapping、multiplication

我有两个DataFrames： import pandas as pd df1 = pd.DataFrame() df1['time'] = ['2022-01-01 17:03:32', '2022-01-01 17:04:30', '2022-01-01 17:04:32', '2022-01-02 00:12:02', '2022-01-02 11:23:16', '2022-01-02 18:13:30', '2022-01-02 21:23:52&

浏览 13提问于2022-03-10得票数 0

回答已采纳

5回答

熊猫群中有“宽”数据

python、pandas、pandas-groupby

我的数据格式是“宽”格式，因此列包含不同实体的数据，行是日期，例如，产品的时间成本： import pandas as pd cost = pd.DataFrame([[10,20,30,40],[11,22,33,44],[111,222,333,444]], columns=['Knife','Fork','Spoon','Spatula'], index=pd.date_range('2022-01-01','2022-01-03')) Knife Fork Sp

浏览 11提问于2022-02-10得票数 2

2回答

python、pandas、merge、out-of-memory、dask

我在熊猫里有两个数据帧。我想合并这两个数据帧，但我总是遇到内存错误。我可以使用的替代方案是什么？下面是设置： import pandas as pd df1 = pd.read_cvs("first1.csv") df2 = pd.read_csv("second2.csv") print(df1.shape) # output: (4757076, 4) print(df2.shape) # output: (428764, 45) df1.head column1 begin end category 0 class1

浏览 1提问于2016-11-24得票数 2

1回答

熊猫:如何组合两个表，并插入空白行的缺失值？

python、pandas

我正在尝试合并两个表(见屏幕快照)，它们共享一个订单编号列，但不知道如何处理它(Python非常新)。我想要制作一个有order列的表，然后列出该订单的所有类型及其相应的费率，然后对item&rate列出相同的类型。问题是，有些订单的类型比项多，因此在这种情况下，我们只需为任何缺少值的列插入一个空行。因此，我想要做的是，如果一个表对于同一顺序有更多的行，那么将空白单元格插入到另一列中。这是我想要得到的输出这是我第一次接触Pandas，所以任何提示和建议都会有帮助。

浏览 2提问于2020-03-17得票数 0