我有一个特定id的开始日期和结束日期(df_with_start_end),我尝试从另一个数据帧(df_dates)中找出具有相同id的其他日期在它们之间。应在新列中输入结果。
我的想法是使用唯一的ID迭代数据帧df_with_start_end,对于每个ID,我尝试分析在df_with_start_end的开始日期和结束日期内是否有来自df_dates的任何其他日期。
我的实现是这样的,但它不是这样工作的。
for k in df_with_start_end['ID']:
df_with_start_end[k]['FREE_PERIOD'] = d
我们不得不合并许多CSV文件,但没有找到任何工作方法(通过MS Excel,通过Python和Pandas,...)。所有的文件都有相同的结构,你可以在附加的照片中看到。在内容方面不需要做任何更改,只需在一个大型CSV中添加所有文件的所有列即可。期待您的想法!Structure of .csv files
大家好,我正在学习数据科学,正在尝试从不同行业的公司列表中创建一个大数据公司列表。
我有一个大数据公司的行号列表,名为comp_rows。现在,我正在尝试创建一个新的数据框架,其中包含基于行号过滤的公司。在这里,我需要向现有的数据帧中添加行,但我得到了一个错误。有人能帮帮忙吗?
我的数据名看起来像这样。
company_url company tag_line product data
0 https://angel.co/billguard BillGuard The fastest smartest way to track your spendin... Bi