Pandas:根据开始/结束拆分点的字符串列表(重叠)将字符串列拆分为组件列 - 腾讯云开发者社区

如果时间跨度重叠且少于30分钟，则分组日志记录条目？

、、、

我有一个用户的日志条目，其格式如下： [unique id], [start time],[ end time] 因此，在下面的示例条目中： 1,1100,1200 2,1030,1130 3,1420,1500 4,1519,1700 查找会话，即将日志条目分组为“会话”。确定会话的条件是：如果两个条目的时间跨度重叠，那么它们属于同一个会话。或者，如果不是重叠，而是在< 30之间的差距，那么它们属于同一会话。示例:输出应该类似于： Session 1: 1, 2 Session 2: 3, 4 我所想的逻辑是：解析字符串并在"LogEntries“类

浏览 0提问于2019-02-12得票数 0

回答已采纳

1回答

一组重叠矩形的多边形顶点求法

、、

解释得很好加雷斯。我想弄清楚的是如何实现解的反方向，即如何从矩形集合开始，直到多边形。我的解决方案在所有情况下都有效，除非两个或多个矩形的部分或整个边相互重叠。怎样才能去掉构成重叠边缘的点呢？

浏览 9提问于2014-09-10得票数 0

回答已采纳

1回答

在Pandas dataframe中，如何过滤基于起始行和结束行的一组行，两者都满足不同的条件？

、

在Pandas dataframe中，如何过滤基于起始行和结束行的一组行，两者都满足不同的条件？如果我的字符串列中包含特定的子字符串，则该行是开始行。然后，如果我的string列包含另一个子字符串的另一行，则该行是一个结束行。我需要一种方法来过滤这两行之间的所有行。我试着用start_row， start_row = df_page['StringCol'].str.contains('SubStrForStartRow') 这为我的起始行提供了一个布尔序列，其中包含“True”。但是，不知道如何进一步实现我上面所描述的。例如，如下所示： data = [

浏览 2提问于2020-12-26得票数 0

回答已采纳

2回答

我想检查数据表上是否有时间重叠

我正在做一项excel任务，我必须找出是否有重叠的日期。在我的excel工作表中有会话日期(B列)、会话开始时间(C列)、会话结束时间(D列)、startDate(D列)等列，由此我必须确定在同一日期是否有重叠的会话时间。我有疲惫的索引和匹配函数，但不知道如何在comumn B中处理同一日期的多个实例 Date of Treatment Pre-Treatment Time Post-Treatment Time 28/03/2018 09:15 09:29 28/03/2018 10:42 11:07 28/03/2018 15:10 15:19 16/01/20

浏览 0提问于2019-01-31得票数 0

1回答

具有列名的pandas.series.split(‘'，expand =真)

、、

我有一个包含两个字符串列的Pandas数据框，我希望将其按空间拆分，如下所示： df = A B 0.1 0.5 0.01 ... 0.3 0.1 0.4 ... 我想拆分这两列，并为拆分产生的所有值形成新的列。所以，结果是： df = A1 A2. A3 ... B1 B2 B3 0.1 0.5 0.01 ...

浏览 30提问于2020-07-21得票数 2

回答已采纳

1回答

熊猫数据帧-删除重叠间隔

、、、、

假设您有一个可以使用以下代码创建的Pandas数据框架： test_df = pd.DataFrame( {'start_date': ['2021-07-01', '2021-07-02', '2021-07-03', '2021-07-04', '2021-07-05', '2021-07-06'], 'end_date': ['2021-07-03', '2021-07-04

浏览 5提问于2022-05-14得票数 1

回答已采纳

1回答

作为Pandas中的索引的每日计划

、、、、

我想表示一个日程表，最初作为CSV文件提供，作为Pandas DataFrame。明细表中每行的关键字是一天中的每小时范围。范围不重叠。例如： 00:00, 01:00, some data 01:00, 03:00, some more data 03:00, 04:30, some other data 如何创建一个具有表示开始到结束小时范围的一级索引的数据框？

浏览 1提问于2015-02-08得票数 0

1回答

Flex 3:碰撞检测与碰撞后运动物体

、

我正在创建一个调度应用程序，它在两个星期的日历时间线上显示项目(包装在画布中)。如果用户决定在一天内将项目移动，我需要检查并查看移动项目是否会与任何其他现有项目重叠。如果是这样的话，两个项目中的一个就需要沿着y轴向下移动，直到这两个项目不再重叠为止。我创建了一个函数，它循环通过一个中继器项目，用于创建项目.此函数的最终结果是包含以下内容的arrayCollection： 0. the id number within the repeater 1. the project title 2. x coordinate 3. y coordinate 4. the width of the pr

浏览 3提问于2011-05-10得票数 0

2回答

如何在SQL中计算逗号分隔列表中的字符串项

、

在我的表中，我有一个标记列，它是一个字符串列表。 ["conda"] ["intel"] ["pandas", "conda"] ["api", "partner"] ["dask", "distributed computing", "conda"] 我希望能够得到每个不同字符串的计数。即 ------------------- tag | count ------------------- conda | 3 pandas | 1 ...

浏览 18提问于2021-10-08得票数 0

2回答

在Athena / Presto中检查两个间隔是否重叠的方法

、、

我想知道我们是否有办法在athena (编写雅典娜查询时)检查两个日期是否重叠。我可以使用int_overlaps和interval函数在R/ Python中这样做。例如，在int_overlaps以下(区间(LeadStart，LeadEnd)，区间(MinStartDate，MaxEndDate)) Min，Max，Lead只是应用于dataframee.g中列的标准R函数，例如Minstartdate <- Min(开始日期) 我想在athena中重复相同的过程，其中我有两个日期间隔，并检查它们是否重叠，如果重叠，我希望在一个新列中得到一个1或0的布尔结果(就像R中的mutate函

浏览 0提问于2018-11-01得票数 1

回答已采纳

1回答

如何从字符串的DataFrame列中获得唯一的单词？

、、、、

我正在寻找一种方法来获取DataFrame中字符串列中的唯一单词列表。 import pandas as pd import numpy as np df = pd.read_csv('FinalStemmedSentimentAnalysisDataset.csv', sep=';',dtype= {'tweetId':int,'tweetText':str,'tweetDate':str,'sentimentLabel':int}) tweets = {} tweets[0]

浏览 3提问于2019-11-23得票数 3

回答已采纳

1回答

如何在不更改现有数据位置的情况下添加新的Server分区范围以容纳未来的数据？

、、

几年前，我划分了一个非常大的列商店索引表的集合。为了简单起见，假设我有四个分区文件，其中根据客户ID的范围存储数据。 CREATE PARTITION FUNCTION [CustomerPF](int) AS RANGE LEFT FOR VALUES ( N'25' ,N'50' ,N'75') CREATE PARTITION SCHEME [CustomerPS] AS PARTITION [CustomerPF] TO ( customer0to25fg ,customer26to50fg

浏览 9提问于2021-12-15得票数 0

回答已采纳

1回答

如果重叠，则弹出阻止对象: UE4

、、

我的2d平台有一个“时间旅行”的机械师。你把一个全息图放在一个位置(演员没有碰撞和一些漂亮的效果)。当你按住“回放”按钮时，你的角色的碰撞和重力会被关闭，并且他会慢慢地向全息图移动。当您释放回放按钮时，它会重新打开碰撞。我的地图设置为“阻挡”棋子(这样他就可以在上面行走了，等等)。如果你在他与地形重叠的时候松开按钮，他的碰撞就会重新开始，他就会卡住。我不知道该怎么办。Unity会自动“弹出”一个对象，该对象与不应该重叠的对象重叠。由于地形被设置为阻挡兵，所以我不能发射重叠事件。“在组件命中时”将从他站着或摩擦地形时发射，所以这两种方式都不起作用。我应该如何检测玩家是否在地形中弹

浏览 29提问于2021-01-06得票数 0

回答已采纳

2回答

如何在pandas中创建混合类型数据

、、

这是一个相当不标准的问题。出于教育目的，我尝试在csv文件中创建一个混合类型的列，以便在pandas DataFrame中导入数据集时收到一条警告消息，并在以后处理该列以显示它是如何完成的。问题是，我在Excel的字符串列中键入0，保存它并关闭文件，但聪明的熊猫仍然将该列作为字符串列导入，因此它不会检测到其中是否确实存在浮点数。我还尝试使用astype('float')、导出和重新导入来更改pandas中仅这些0的格式。还是不管用。有没有人知道如何创建一个pandas将读取混合类型的列？提前感谢！

浏览 8提问于2020-02-09得票数 0

1回答

在构造tensorflow数据集时，tf.int32被解释为tf.string

、、、、

我有一个Pandas，我打算将其数据导出到Tensorflow数据集。这个dataframe有4列，其中2列是字符串列表，其余2列是整数列表。目前，最重要的列是input_ids和attention_mask，它们构成了模型的输入数据。 train_input_ids = train_df["input_ids"].values.tolist() train_attention_mask = train_df["attention_mask"].values.tolist() 如head()方法所示，这些列存储ints的列表。print(train_df[

浏览 10提问于2021-11-02得票数 0

回答已采纳

5回答

Python 3:删除表中的重叠

、、、

我有一个表(程序的简化输出)，需要过滤： id hit from to value A hit1 56 102 0.00085 B hit2 89 275 0.00034 B hit3 240 349 0.00034 C hit4 332 480 3.40E-15 D hit5 291 512 3.80E-24 D hit6 287 313 0.00098 D hit7 381 426 0.00098 D hit8 287 316 0.0029 D hit9 373 422 0.0029 D

浏览 1提问于2019-03-03得票数 2

回答已采纳

1回答

查找表示一组字符串的最小数量的子字符串

、、

我希望找到一组不重叠的子字符串，它们可以连接起来表示给定的一组字符串集。假设给定的字符串集是 abc0def zabc1def abc2defg 则可连接成上述完整字符串集的非重叠子字符串的最小集合为 abc def 0 1 2 g z 澄清一下:我所说的不重叠是指集合中没有任何成员以相同的字符序列开始或结束。

浏览 1提问于2012-02-08得票数 2

2回答

检查C#中的重叠序列

我正在创建一个应用程序，用户添加开始和结束来定义一个范围。条件是范围不应重叠：如何检查一个数字范围是否不重叠。范围1开始5端15范围2开始1端4范围3开始16 范围4开始2端4<代码>G29</code> 因此范围4使设置无效，如何在C#中检查此值。此外，用户可以按任何顺序添加范围，如上面的示例所示，整个系列应该是不重叠的。谢谢你的帮助建议。你好，酒石答案：我制定了解决方案:如果开始和结束是需要验证的范围，那么它正确吗？ end>startRange start >startRange和start小于endRange endRange，end

浏览 1提问于2011-09-20得票数 0

2回答

在熊猫df中选择字符串列(等效于df.select_dtypes)

、、

给定具有不同数据类型的Pandas df，df.select_dtypes对于只保留所需列或处理特定应用程序中不需要的列非常有用。但是，使用此方法似乎无法寻址string类型。来自 (重点雷)： ValueError 如果包含和排除两者都为空，则为如果包含和排除有重叠的元素如果传入任何类型的字符串dtype，则为. 和若要选择字符串，必须使用对象dtype，但请注意，这将返回所有对象dtype列。实际上，使用df.select_dtypes(exclude=['str'])会引发一个错误(虽然它是一个TypeError，而不是docs声明的Value

浏览 2提问于2017-08-23得票数 7

回答已采纳

2回答

删除BigQuery字符串字段中的重叠子字符串

、、、

我试图找到最有效的方法，从BigQuery上的字符串字段值中删除重叠子字符串。我的用例与相同，但在BigQuery中。如果我总结一下上面的文章：具有以下子字符串列表：["quick brown fox", "fox jumps"] 我要： A quick brown fox jumps over the lazy dog将被A over the lazy dog取代。我的想法是想出一个JS来完成与上面的文章中提到的类似的工作，即创建一个整个字符串的掩码，并在子字符串上循环以确定要删除哪些字符.但你有更好的主意吗？谢谢你的帮忙

浏览 1提问于2020-04-22得票数 2

回答已采纳

1回答

角8@输入子分量奇怪问题

、、、

对我的问题介绍: I有父、子组件。，单击父表单元格(td)，我将一个值(positionLeft)传递给子组件。如果父组件中的不满足，则子组件(弹出)应该在左侧打开。。正在起作用的东西: 能够使用ngOnChanges生命周期查看子组件中的值。也能够在ChildTemplate.html模板中看到输出。 * 什么不起作用:，我在UL上尝试了三次不同的尝试，但仍然没有成功.:( <ul [className]="positionLeft ? 'PositionToLeft' : '' "> <li>India

浏览 3提问于2019-09-18得票数 1

1回答

包含列表的Pandas列的get_dummies

、、

假设我有一个包含字符串列表的列的DataFrame，如下所示： Name Fruit 0 Curly [Apple] 1 Moe [Orange] 2 Larry [Apple, Banana] 我怎么才能把它变成这样呢？ Name Fruit_Apple Fruit_Orange Fruit_Banana 0 Curly 1 0 0 1 Moe 0 1 0 2

浏览 2提问于2016-05-23得票数 3

回答已采纳

1回答

SQL查询-确保表中的数据覆盖一年，没有日期重叠。

、、、

我有一个名为tblRentalRates的表，其列如下： rate_id (int) rate_startdate (datetime) rate_enddate (datetime) weekday_rate (money) weekend_rate (money) 我想实现以下目标：编写了一个查询，该查询将检查表的内容，并确保当前年度的数据覆盖全年，没有重叠。它可以是一行，包括开始日期和结束日期，也可以是366行(闰年的每一天一行)或两者之间的任何组合。我有一个管理工具，允许网站管理员控制定价，但我想显示某种错误信息在顶部，如果他们从一年中的一天，或是重叠的日期，等等。

浏览 1提问于2009-11-01得票数 0

回答已采纳

1回答

如何有效地利用蟒蛇熊猫根据日期重叠范围对行进行子集？

、、

我的数据框架有两个日期类型列: start和end (Yyyy)。这是我的数据框架： import pandas as pd import datetime data=[["2016-10-17","2017-03-08"],["2014-08-17","2016-09-08"],["2014-01-01","2015-01-01"],["2017-12-20","2019-01-01"]] df=pd.DataFrame(data,columns=['

浏览 1提问于2021-01-09得票数 3

2回答

计算SQL中组的重叠时间(秒)

、、、、

我有一堆按ID分组的时间戳，并在下面所示的示例数据中键入。我想找到start_time和end_time列之间的重叠时间，每组ID的秒数，以及每个领头和跟随者组合之间的重叠时间。我只想显示每一组的第一次记录的重叠时间，这将始终是“领先”类型。例如，对于ID 1，第3行中跟随者的开始和结束时间与第1行中的引线重叠193秒(从09:00:00到09:03:13)。第3行的跟随者的时间也与第2行的领队重叠133秒(09:01:00到2020-05-07 : 09:03:13)。总共326秒(193+133) 我使用分区子句按ID对行进行排序，并按start_time进行排序。如何获得重叠列？

浏览 1提问于2020-05-08得票数 0

回答已采纳

1回答

分段重叠拆分视频

、

我需要将视频分割成如下的片段序列：(数字为mm:ss) 00:00到03:05，03:00到06:05，06:00到09:05等。换句话说，每个片段与下一个片段将有5秒的重叠。这样做的目的是为了一个转录程序。每个3分钟的片段将被单独转录。5秒的重叠将有助于将转录的文本片段重新拼接在一起。我需要分别提取3分钟和5秒的片段吗？例如，通过执行以下操作： ffmpeg -ss 00:03:00 -i in.mp4 -t 00:06:05 -vcodec copy -acodec copy -y out.mp4 或者，是否有一种方法可以在一次遍历中完成所有段？ [项目是： ]

浏览 2提问于2017-05-06得票数 1

1回答

与双范围样本相比，双范围之间的重叠

、

我已经找到了其他关于在R iRanges中寻找重叠范围的帖子，但你能帮我解决这个额外的小问题吗?我有两个联系在一起的范围(一个可能的基因组重排，一个起始范围和一个结束范围)，我想过滤掉母亲基因组中相同的范围我已经找到了如下的停止和开始范围(chr编号，间隔开始，间隔结束)，其中左侧的3列表示重排的开始，右侧的3列表示重排的结束(它们是名为SVDetect的程序的输出，该程序使用NGS数据来寻找与参考基因组具有异常比对的配对)。我有两个基因组，母克隆和女儿，并希望找到对女儿唯一的重排=我想过滤掉两个范围与另一个范围中两个范围的同一行重叠的行。范围可能略有不同，但如果两个范围重叠，这将强烈表明重

浏览 3提问于2014-07-21得票数 2

2回答

根据拆分后的字符串拆分中的元素过滤行(Pandas)

、

我有一个Pandas DataFrame，包含一个带有分号分隔的位置名的列： index locations 39951 Credit; Mount Pleasant GO 40976 Ajax GO; Whitby GO; Credit; Oshawa GO; Bayly 14961 Credit; Mount Pleasant GO; Port Credit GO ... 我想要做的是根据指定的位置是否出现在分号分隔的列表中进行筛选，首先拆分字符串(在;上)，然后检查列表中是否有一个位置。使用str.contains()在这里不起作用，因为这里有重叠的位置名称(例如，Cr

浏览 0提问于2021-07-16得票数 0

回答已采纳

1回答

在组件'\n‘上将NSString拆分为NSArray

、、、、

我正在尝试将一个NSString分解成一个NSArray，尽管这通常是一个简单的任务，但事实证明这很困难。我正在从我的Python服务器接收数据，并在iPhone客户机上形成一个iPhone。我有时注意到，当我从Python接收多条消息时，我会NSLog一个字符串，如： Project: textOne textTwo 在将字符串添加到NSArray并对该数组调用NSLog之后，字符串将显示： Project: ( "textOne\ntextTwo\n" ) 玩完代码后： [str componentsSeparatedByCharactersInSet:[NSCha

浏览 9提问于2013-01-22得票数 0

2回答

对于给定的键，如何在Pandas中测试重叠的日期范围？

、、

我正在使用一个数据框架，其中的人可以以多个角色出现，我需要设计一个测试来查看给定的人，他们是否有重叠的日期： import pandas as pd records = pd.DataFrame({'name': ['Tom','Harry','Jack','Matt','Harry','Matt'], 'job code': [101,101,301,101,401,102], 'start date': ['1/1/20',&#

浏览 44提问于2021-01-21得票数 0

1回答

熊猫ISO格式的时间戳在导入时会导致Exasol错误

、

当将 import_from_pandas(df)用于DataFrame时，具有datetime列的df会抛出一个错误，因为它无法解析dataframe列的ISO格式字符串表示形式。具体来说，"+00:00“最终字符是Exasol无法解析的。我目前的解决办法是将所有的熊猫日期时间列转换为字符串列，但这可能会花费大量的时间。将datetime列从Pandas导入到具有TIMESTAMP列类型的现有Exasol表的正确方法是什么？

浏览 2提问于2019-09-24得票数 2

回答已采纳

2回答

多个日期范围C#的连续重叠

、

我正在研究一种算法来计算多个日期范围的连续重叠。它还需要有一定的重叠次数。对于下面的示例图像，我需要3个日期来连续重叠。有效的重叠日期是8月20日-8月23日，因为8月24日只有2个重叠。我尝试过许多方法，包括循环遍历所有的日期，并在本地和下一个日期之间进行比较。代码看起来是这样的。下面是一个用于更好的可视化的.net小提琴：。 private bool Compare(CompareDate a, CompareDate b) { DateTime? tStartA = a.ActiveDate; DateTime? tEndA = a.E

浏览 2提问于2017-09-05得票数 1

回答已采纳

1回答

如何使用索引处理postgres的功能重叠

、

我使用postgresSql和使用重叠函数查找表上的范围时间。我的桌子看起来像 id room_id start_date start_time end_date end_time delete_at 1 123 2021-01-09 10:00:00 2021-01-10 10:30:00 null 2 456 2021-08-10 15:00:00 2021-01-10 15:30:00 null ///some record 3600 789 2021-09-10 00:00:00 2021-09-10 15:00:00 null 我的桌子很大，

浏览 2提问于2021-09-12得票数 0

回答已采纳

1回答

是否规定属性是JSON架构中的ISO时间间隔？

、、

JSON似乎支持ISO时间、日期、日期，甚至是持续时间(请参阅)，但我仍然找不到支持的方法。我可以使用regex ( JSON模式支持的)，但这样我就无法检查间隔的起始点和结束点是否实际上是有效的日期/时间(例如，2022-13-04没有13个月)。我该怎么做？我是否只需要接受任何字符串并在JSON消费应用程序中进行验证？

浏览 3提问于2022-05-30得票数 0

回答已采纳

1回答

根据一列中定义的字符串列表过滤pandas数据帧

、

我需要根据可能出现在其中一列(在其他字符串中)的字符串列表来过滤cars pandas数据帧。所以我有这样的国家/地区列表： filterLocation = ['Germany','Austria','Slovenia'] 我想过滤掉pandas dataframe的Location列中包含这些单词的所有行。我有这个： carsresult = cars.loc[~cars['adCarLocation'].isin(filterLocation)] 但由于某种原因，这不起作用..

浏览 3提问于2020-02-25得票数 0

1回答

Pandas正在将带有方括号的列作为字符串而不是列表导入

、、、

我正在使用pd.read_csv导入数据帧。其中一列包含字符串列表。例如： >>> df['topic'].head(5) 0 ['ECONOMIC PERFORMANCE', 'ECONOMICS', 'EQUITY ... 1 ['CAPACITY/FACILITIES', 'CORPORATE/INDUSTRIAL'] 2 ['PERFORMANCE', 'ACCOUNTS/EARNINGS', 'CORPORAT... 3

浏览 28提问于2021-04-28得票数 3

回答已采纳

1回答

将字典从spark数据帧中的StringType列中分离出来

、、

我有一个spark表，我想在python中读取(我在databricks中使用的是python3)，实际上结构如下。日志数据存储在单个字符串列中，但它是一个字典。我如何拆分字典中的条目来阅读它们。 dfstates = spark.createDataFrame([[{"EVENT_ID":"123829:0","EVENT_TS":"2020-06-22T10:16:01.000+0000","RECORD_INDEX":0}, {"

浏览 39提问于2020-07-01得票数 1

回答已采纳

1回答

在python中读取.csv文件中的字符串

、、

我正在使用pandas读取一个.csv文件，这是我的代码： import pandas as pd df=pd.read_csv('MyFile.csv','r') numeric_col=df.ix[:,0] #numeric values, works fine string_col=df.ix[:,1] #string values, equals to nan 有人知道为什么我不能读取字符串列吗？ (或者更准确地说:我可以读取某些字符串列，但不能读取其他列。例如，这是csv的第一行： 20150329,3002,1,20000,32459,5100,10

浏览 1提问于2015-12-21得票数 0

3回答

将int赋值给pandas中列表列中的字符串

、

我有一个Pandas dataframe，其中包含一个带有字符串列表的列。 <code>A0</code> 如何开始为列表中的每个值分配一个唯一的id，使其在整个列中都是相同的？ <code>A1</code>

浏览 35提问于2020-11-16得票数 3

回答已采纳

2回答

Pandas:解释列表数据类型列表？

、、

从文件中读取分隔数据时，pandas库能够解释数据列的类型。当向pandas数据帧传递通过pandas之外的某个过程组装的字符串列表时，pandas会将内部列表类型保留为字符串： data = [ ['1','2'],['3','4'] ] cols = ['foo', 'biz'] df = DataFrame(columns=cols, data=data) print(numpy.sum(df.values)) $: <literal sum of the strings>

浏览 12提问于2020-07-22得票数 2

回答已采纳

1回答

Pandas:如何在索引之间获取行？

、、、

大家好。我的问题是:我不能在几行之间获取行(数据)。我有一本有21页的excel书。每个工作表上的每个表都有一些不同的更改。桌子没有头(创造它的人都是笨蛋)。但是在表的第一列和第二列中有相同的值。所以，我得到了它们的索引，但是如何获得它们之间的行呢？ ? import pandas as pd file_path = r"./files/menu.xlsx" df = pd.read_excel(file_path) xl = pd.ExcelFile(file_path).sheet_names breakfast = df.loc[df['Unnamed:

浏览 15提问于2020-11-23得票数 1

回答已采纳

2回答

在大型数据集中是否有两个日期之间的假期？

、、、

我正在处理一个数据集，该数据集有大约2600万行和13个列，其中包括两个datetime列arr_date和dep_date。我正在尝试创建一个新的布尔列，以检查在这些日期之间是否有任何美国假日。我正在对整个dataframe使用apply函数，但是执行时间太慢。代码已经在Goolge平台上运行了超过48个小时(24 on内存，4核)。有更快的方法吗？数据集如下所示：我使用的代码是- import pandas as pd import numpy as np from pandas.tseries.holiday import USFederalHolidayCalendar as ca

浏览 0提问于2019-07-07得票数 1

回答已采纳

1回答

带有字符串列的HDFStore给出了问题

、、

我有一个熊猫DataFrame myDF，它有几个字符串列( dtype是object)和许多数字列。我尝试了以下几点： d=pandas.HDFStore("C:\\PF\\Temp.h5") d['test']=myDF 我得到了这个结果： C:\PF\WinPython-64bit-3.3.3.3\python-3.3.3.amd64\lib\site-packages\pandas\io\pytables.py:2446: PerformanceWarning: your performance may suffer as PyTables will

浏览 7提问于2014-04-10得票数 12

回答已采纳

4回答

检查时间重叠(ruby/mysql)

、、

我有两列: start_time和end_time，看起来像这样："00:00:05"，"00:00:10“(mysql时间)。我的问题如下。如何验证一条记录不会与表中已有的任何其他记录重叠，从而使其具有唯一性，例如： "00:00:10"，"00:00:20“与"00:00:05"，"00:00:15”重叠谢谢

浏览 0提问于2011-03-22得票数 0

回答已采纳

3回答

将列添加到数据框中，以执行逐个元素的操作

、

基本上，pandas可以通过以下方式复制列 df['B'] = df['A'] + 1 现在，我有一列字符串列，我想添加一个值为每个字符串的长度的列。例如， A. B "hello" 5 "hi" 2 有没有可能在不循环的情况下添加B？

浏览 16提问于2020-10-27得票数 1

1回答

将"ccd“、"bbq”、"phd“等缩写与一组字符串中最相似的字符串进行匹配

、、、、

我有一个缩写列表，比如"ccd“，"bbq"，"phd”等等。例如，以"bbq“为例，我们尝试将此缩写映射到一个字符串列表，烧烤之国--实际答案应该是这样的烧烤烟和烧烤啤酒和烘焙之门我们如何确定缩写属于哪个字符串。我尝试过通过KMP和最长公共子序列算法进行字符串匹配，并对之前匹配的字符串增加了更多的值。有没有什么数据结构可以提供帮助，或者有什么算法可以处理这样的情况？谢谢!

浏览 3提问于2016-11-04得票数 0

1回答

用python中的excel对数据进行分组并进行比较

、、

我正在进行一个使用python从excel文件中选择某些值的项目。我使用的是xlrd库和openpyxl库。 python程序的工作方式是：对某个卡酶中的所有数据点条目进行分组。例如，第26行和第28行之间的所有条目都在Card Task A中，因此它们应该分组在一起。E栏中没有“卡片任务”值的所有条目不应被视为任何内容。下一次… 查看来自一行的N列(lastExecTime)的值，并将该时间与M列中的以下值进行比较如果发现时间重叠(M列小于前一个N值)，它将增加一个名为“count”的变量。Count存储过程重叠的次数。最后是… 至于输出，目标是创建一

浏览 3提问于2018-05-31得票数 0

回答已采纳

1回答

对dataframe中的每个列应用一个条件，但一些字符串列的列表除外。

、、

我正在尝试将以下计算应用于dataframe的所有列，但包含3个字符串列的列表除外。问题是，尽管下面的代码基于示例数据很好地工作，但在现实中，月份列高于100+，并且每个月都在增加，而3个字符串列是固定的。月份列表应该包含每个月将为+1的100+列，因此我只想将/100应用于除Series、和Country列之外的视图描述==‘%更改’的所有列。如何修改列表，使其只包含3个字符串列，并将.loc应用于其他所有内容。 import pandas as pd df = pd.DataFrame({ 'Series ID': ['Food', 'Dr

浏览 6提问于2022-07-18得票数 0

回答已采纳

1回答

SQL重叠日期

、、、

在这里，我们白天有很多会议。通常从上午9:00到11:30，下午1:00-下午3:30，下午4:00-6:30。我很难安排这些会议。我不知道如何检查他们是否重叠的同一个人谁是会议的领导。例:如果Person1的会议安排在上午10:00-11:00，另一次会议是上午10:45-11:30，则应该引起错误。我已经找到了这个解决方案，但它只是部分起作用： if exists ( select 1 from Meeting M where M.IdPerson = @IdPerson --Stored procedure parameter

浏览 2提问于2014-09-05得票数 2

回答已采纳