我的Dataframe包含500列，但我只想在新的Dataframe中挑选出27列。我该怎么做？

要在新的Dataframe中挑选出27列，可以使用以下方法：

使用列索引：如果你知道要挑选的列的索引位置，可以使用Dataframe的iloc方法来选择列。例如，如果要选择第1列到第27列，可以使用以下代码：

new_df = df.iloc[:, 0:27]

这将创建一个新的Dataframe，其中包含原始Dataframe的前27列。

使用列名称：如果你知道要挑选的列的名称，可以使用Dataframe的loc方法来选择列。例如，如果要选择名为"column1"到"column27"的列，可以使用以下代码：

new_df = df.loc[:, "column1":"column27"]

这将创建一个新的Dataframe，其中包含原始Dataframe中名为"column1"到"column27"的列。

使用列的布尔条件：如果你有一些条件来选择列，可以使用Dataframe的布尔索引来进行筛选。例如，如果你有一个布尔Series，其中为True的位置表示要选择的列，可以使用以下代码：

bool_series = [True, False, False, ..., True]  # 长度为500的布尔Series
new_df = df.loc[:, bool_series]

这将创建一个新的Dataframe，其中包含原始Dataframe中对应布尔Series为True的列。

以上是三种常见的方法来在新的Dataframe中挑选出指定的列。根据你的具体需求，选择适合的方法即可。

相关·内容

用Python帮老哥选出好基金，稳赚一笔，老哥专门提着茅台登门拜访

看着他的一个本子密密麻麻地写了一大堆东西，全是基金的分析，一大把年纪了挺不容易的，于是就决定帮他一把，在跟他详谈了买基金的一些情况之后（因为我是不懂这个的），按照他的要求，我用Python直接给他选出来他想买的好基金...这几天他特意到我家来感谢，还特意提了2瓶酒，因为在我给他筛选的基金名单中，他选中后买的基金已经赚了，抽出了本金还剩一些还放在里面养着。...四四三三法则即挑选出3年/2年/1年的排名在前四分之一，6个月/3个月的排名在前三分之一的基金。...爬虫抓取的URL(只抓取混合基金） URL参数释义： sd 和 ed 是起始和结束日期，分别对应要考察的期间 pi 对应的是页数，pn 对应的是每页的记录数返回值如下： Tips：以上内容实际只需要...dataframe 内的数据是这样的。 2. 获取网上的基金的基本信息和夏普比率，筛选出夏普比率高的基金。通过四四三三法则挑选出排名靠前的基金共有171个。需要继续进行筛选。

5113 0

8 个例子帮你快速掌握 Pandas 索引操作

类似地，如果你想重置索引，不要忘记将inplace参数设置为True，否则将创建一个新的DataFrame。...有两种方法可以完成所需的操作，如下所示。就我个人而言，我更喜欢第二种方法，它只涉及两个步骤。...重要的是，因为我们将ignore_index设置为True，所以新的DataFrame以基于0的方式使用一组新的索引。...在许多情况下，DataFrame具有基于0的索引。但是，我们不想在导出的CSV文件中包含它。在本例中，我们可以在to_csv方法中设置索引参数。...>>> df0.to_csv("exported_file.csv", index=False) 导出的CSV文件如下所示。文件中没有包含索引列。

9533 0

盘一盘 Python 系列特别篇 PyEcharts TreeMap

在做之前我什么都不会，但我知道我需要三个东西数据 (从 Quantopian 取) PyEcharts 例子 (从 Google 搜) 直觉 (这个靠平时积累和一些领域知识) 接着就是模仿着例子，套用着数据...现在的 DataFrame 含「多索引」的行标签，这种类型的数据不方便存入 csv 中，因此我们用 reset_index() 将行标签全部转成列标签。...细看上面数据第一层的 name 是五大洲，value 是该洲的总 GDP 比例，而 children 也有 name 和 value (第二层)，分别是该洲包含的国家以及它们的 GDP 比例。...接下来就是核心操作，如何把「csv 读取出来的 DataFrame 格式」转换成「PyEcharts 中 TreeMap 函数要求的数据格式」。...要用到它时再学吧，我现在也不太懂图神经网络、元学习呢，但我知道我可以征服它们。

5.2K6 0

Python工具分析风险数据

Python中著名的数据分析库Panda Pandas库是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建，也是围绕着 Series 和 DataFrame 两个核心数据结构展开的，其中Series...由head()方法我们可以发现数据中包含了数值变量、非数值变量，我们首先可以利用dtypes方法查看DataFrame中各列的数据类型，用select_dtypes方法将数据按数据类型进行分类。...从分析目的出发，我将从原始数据中挑选出局部变量进行分析。这里就要给大家介绍pandas的数据切片方法loc。...对数据列的丢弃，除无效值和需求规定之外，一些表自身的冗余列也需要在这个环节清理，比如说DataFrame中的index号、类型描述等，通过对这些数据的丢弃，从而生成新的数据，能使数据容量得到有效的缩减，...代码如下—— 这里不给大家细说代码了，只给出如下伪代码。 ? ? 好了，到此我也就初略的知道那些人做什么，谁用代理时长最长等等问题额。

1.7K9 0

Pandas的10个常用函数总结

注意：我没有解释基本的算术和统计运算，比如 sqrt 和 corr，因为我想在这篇文章中关注更多 Pandas 特定的函数。 read_csv 让我们从读取数据开始。...DataFrame 中唯一值和总数。...copy 我知道为了在代码中复制一些对象，我们通常写 A= B，但在 Pandas 中，这实际上创建了 B 作为对 A 的引用。所以如果我们改变 B，A 的值也将被改变。因此，我们需要如下复制函数。...它将系列中的每个值替换为另一个值，该值可能来自函数、字典或另一个Series。下面是一些简单的例子，但 map 在复杂情况下实际上有很大帮助，因为我们可以在单个 map 调用中映射多个事物。...但我的目的是让你们习惯这个库，从现在开始用Pandas做所有与数据相关的工作。

9133 0

短短几行代码将数据保存CSV和MySQL

分享写入csv文件和写入mysql的方法，编码工作我一向追求代码的简单性。.../pandas-docs/stable/generated/pandas.DataFrame.to_sql.html ?...2、数据库配置用你自己的数据库配置，db_flag为数据库类型，根据不同情况更改，在保存数据之前，要先创建数据库字段，下图是我这边简单创建的字段 ?...，这样刚好df的3个列和数据库的3个字段一一对应，正常保存，如果不设置为false的话，数据相当于4列，跟MySQL 3列对不上号，会报错这里提个小问题，比如我们想在遍历的时候来一条数据，保存一条，而不是整体生成...Dataframe后才保存，该怎么做？

2.1K2 0

超详细整理！Pandas实用手册（PART I）

建立DataFrame pandas里有非常多种可以初始化一个DataFrame的技巧，以下列出一些我觉得实用的初始化方式。...，代表该列里头所有的数值。...很多时候你也会需要改变DataFrame 里的列名称： ? 这里也很直观，就是给一个将旧列名对应到新列名的Python dict。...从最后一列可以看出Titanic这个小DataFrame只占了322 KB。...另外如果你想在有限的内存处理巨大CSV文档，也可以透通过chunksize参数来限制一次读入的行数（rows）： ?

1.8K3 1

亲，你看到这张封面图，竟是用 PyEcharts 画的！信不信？

在做之前我什么都不会，但我知道我需要三个东西数据 (从 Quantopian 取) PyEcharts 例子 (从 Google 搜) 直觉 (这个靠平时积累和一些领域知识) 接着就是模仿着例子，套用着数据...现在的 DataFrame 含「多索引」的行标签，这种类型的数据不方便存入 csv 中，因此我们用 reset_index() 将行标签全部转成列标签。 ?...细看上面数据第一层的 name 是五大洲，value 是该洲的总 GDP 比例，而 children 也有 name 和 value (第二层)，分别是该洲包含的国家以及它们的 GDP 比例。...接下来就是核心操作，如何把「csv 读取出来的 DataFrame 格式」转换成「PyEcharts 中 TreeMap 函数要求的数据格式」。 ?...新知识太多，你根本学不完，有效的学习方法远比学到的东西重要。有了它，面对新知识，你知道只要你想学就一定学的会，这就够了。要用到它时再学吧，我现在也不太懂图神经网络、元学习呢，但我知道我可以征服它们。

1.8K6 0

PandaSQL：一个让你能够通过SQL语句进行pandas的操作的python包

假设你对SQL非常的熟悉，或者你想有更可读的代码。或者您只是想在dataframe上运行一个特殊的SQL查询。或者，也许你来自R，想要一个sqldf的替代品。...不等连接(Non-equi join) 假设你必须连接两个dataframe。其中一个显示了我们对某些商品进行促销的时间段。第二个是事务Dataframe。...我想知道促销活动推动的销售情况，也就是促销期间的销售情况。我们可以通过联接项目列以及联接条件(TransactionDt≥StartDt和TransactionDt≤EndDt)来实现这一点。...因为现在我们的连接条件也有大于号和小于号，这样的连接称为不等连接。在继续之前，一定要考虑如何在pandas中做这样的事情。 ? pandas的解决方案那么在pandas身上该怎么做呢?...https://github.com/MLWhiz/data_science_blogs/tree/master/pandasql 译者注：我一直在寻找能够使用sql处理pandas的dataframe

6.1K2 0

8 个常用pandas的 index设置，你知道吗？

Hello,大家好，我是陈晨~ 今天我来分享关于8 个常用pandas的 index设置 1. 将索引从 groupby 操作转换为列 groupby分组方法是经常用的。...set_index方法默认将创建一个新的 DataFrame。如果要就地更改df的索引，需要设置inplace=True。...同样，如果要就地重置索引，可设置inplace参数为True，否则将创建一个新的 DataFrame。...如果我们不想在导出的 CSV 文件中包含它，可以在to_csv方法中设置index参数。...>>> df0.to_csv("exported_file.csv", index=False) 如下所示，导出的 CSV 文件中，索引列未包含在文件中。

2.7K3 0

手把手教你做一个“渣”数据师，用Python代替老情人Excel

我希望用Python取代几乎所有的excel功能，无论是简单的筛选还是相对复杂的创建并分析数据和数组。我将展示从简单到复杂的计算任务。强烈建议你跟着我一起做这些步骤，以便更好地理解它们。...拟写此文的灵感来自于人人可访问的免费教程网站，我曾认真阅读并一直严格遵守这篇Python文档，链接如下，相信你也会从该网站中找到很多干货。...我将演示支持xls和xlsx文件扩展名的Pandas的read_excel方法。read_csv与read_excel相同，就不做深入讨论了，但我会分享一个例子。...尽管read_excel方法包含数百万个参数，但我们只讨论那些在日常操作中最常见的那些。我们使用Iris样本数据集，出于教育目的，该数据集可在线免费使用。...11、在Excel中复制自定义的筛选器 ? 12、合并两个过滤器的计算结果 ? 13、包含Excel中的功能 ? 14、从DataFrame获取特定的值 ?

8.4K3 0

数据分析必备！Pandas实用手册（PART III）

不过你时常会想要把样本（row）里头的多个栏位一次取出做运算并产生一个新的值，这时你可以自定义一个Python function并将apply函数套用到整个DataFrame之上：此例中apply函数将...df_city包含了几个美国城市以及其对应的州名（state）；DataFrame df_info则包含城市名称以及一些数据。...DataFrame中apply函数的进度。...pip install swifter 接着让我建立一个有100万样本的dataframe，测试swift与原版apply函数的效果差异：在这个简单的平方运算中，swifter版的appy函数在colab...本系列的pandas 旅程到此告一段落啦！我想在其他地方你应该是找不到跟本文一样啰哩八唆的pandas 教学文章了。

1.8K2 0

使用 HuggingFace Transformers创建自己的搜索引擎

它反映了单个矢量维度的相对比较，而不是绝对比较。在这篇文章中，我不会深入研究余弦相似度背后的数学，但是要理解它是一个内积空间中两个非零向量之间的相似性度量。 ?...在本教程中，我将解释如何使用HuggingFace Transformers库、Non-Metric Space库和Dash库来构建一个新的和改进的自动侍酒师。...在我把数据放入一个dataframe后，我删除了包含重复描述的行和有空价格的行。我还将数据限制在获得超过200条评论的葡萄酒品种上。通过剔除评论数少于200的品种，我得到了54个葡萄酒品种。...注意:将所有文本转换为矢量可能需要一些时间，所以如果你只是想尝试一下，我建议只使用20,000条记录来快速训练。 HuggingFace?...安装Dash、Dash Bootstrap组件和jupyter- Dash，如果你想在jupyter笔记本中构建一个Dash应用程序。

3.7K4 0

30 个小例子帮你快速掌握Pandas

2.读取时选择特定的列我们只打算读取csv文件中的某些列。读取时，列列表将传递给usecols参数。如果您事先知道列名，则比以后删除更好。...考虑从DataFrame中抽取样本的情况。该示例将保留原始DataFrame的索引，因此我们要重置它。...第一个参数是位置的索引，第二个参数是列的名称，第三个参数是值。 19.where函数它用于根据条件替换行或列中的值。默认替换值是NaN，但我们也可以指定要替换的值。...Geography列的内存消耗减少了近8倍。 24.替换值替换函数可用于替换DataFrame中的值。 ? 第一个参数是要替换的值，第二个参数是新值。我们可以使用字典进行多次替换。 ?...我已经将虚构名称添加到df_new DataFrame中。 ? 让我们选择客户名称以Mi开头的行。我们将使用str访问器的startswith方法。

10.8K1 0

【学术】算法交易的神经网络:强化经典策略

今天我想做一个带有实际预测的金融时间序列结论:我们将用神经网络强化经典移动平均策略,证明它真的改善了最终结果，并且审查新的预测目标。...在我们把这些预测看作是一种抽象的东西之前，只是看这些“up-down”的预测就尝试交易，即使这些预测并不是很好。但我们也知道，有很多其他的交易策略都是基于技术分析和财务指标。...让我们来看看下面的策略假设:在移动平均线交叉的时刻，我们将预测一些特征的变化，如果我们真的期望跳跃，我们将相信这个交易信号。否则，我们就会跳过它，因为我们不想在平坦区域上赔钱。...从2012年到2016年，我们以AAPL的价格训练我们的网络，并在2016 – 2017年进行测试，就像我们在之前的一个教程中做的那样。...在这篇文章中，我想用神经网络来完成(至少在一段时间内)金融时间序列预测主题。我们不能直接用它们来预测价格是否会上涨或下跌，来赚很多钱。我们考虑了不同的数据源和目标，仔细地处理过拟合和优化过的超参数。

8102 1

犹他州空气质量分析-从EPA的空气质量服务站API中抓取数据

对于我们的分析，我们使用以下参数： AQI污染物：该数据集包含用于测量空气质量指数的所有污染物，您可能更熟悉将其作为污染物指标，例如今天我们的空气污染是红色，请拼车出行。...将用于构造 API 调用的基本配置信息包含在名为 config.py 的文件中，此文件作为基本配置文件运行，您要从主项目代码中抽象出来的任何细节都可以放到里面。 ?...然后将响应存储在 Pandas 的 DataFrame aqs_df 中。 ? 最后，我们将响应 DataFrame 合并到我们的主 DataFrame 中。...请记住，我们循环遍历给定州的每个县，因此我们需要处理结果，然后构建一个 DataFrame，其中包含州内每个县的所有数据。 ?...虽然我们将在 Python 中进行额外的清理和工作，但我们希望将输出数据快速导入 MapD，以确保在我们完成 Python 中的任何其他工作之前格式是理想的（这些额外的计算和清理步骤将在未来的文章中呈现

1.2K2 0

Spark系列 - (3) Spark SQL

Shark的缺陷：执行计划优化完全依赖于Hive，不方便添加新的优化策略因为Spark是线程级并行，而MapReduce是进程级并行，因此，Spark在兼容 Hive的实现上存在线程安全问题...而右侧的DataFrame却提供了详细的结构信息，使得Spark SQL 可以清楚地知道该数据集中包含哪些列，每列的名称和类型各是什么。 DataFrame是为数据提供了Schema的视图。...Row 是一个类型，跟Car、Person 这些的类型一样，所有的表结构信息我都用 Row 来表示。DataSet 是强类型的。比如可以有 Dataset[Car]，Dataset[Person]。...如果使用DataFrame，你在也就是说，当你在 DataFrame 中调用了 API 之外的函数时，编译器就可以发现这个错。...，如 filter、map、aggregation、 average、sum、SQL 查询、列式访问或使用 lambda 函数，那就使用 DataFrame 或 Dataset；如果你想在编译时就有高度的类型安全

4311 0

手把手 | 如何用Python做自动化特征工程

特征工程也称为特征创建，是从现有数据构建新特征以训练机器学习模型的过程。这个步骤可能比实际应用的模型更重要，因为机器学习算法只从我们提供的数据中学习，然而创建与任务相关的特征绝对是至关重要的。...每个实体都必须有一个索引，该索引是一个包含所有唯一元素的列。也就是说，索引中的每个值只能出现在表中一次。 clients数据框中的索引是client_id，因为每个客户在此数据框中只有一行。...例如，我们有每个客户加入的月份，这是由转换特征基元生成的：我们还有许多聚合基元，例如每个客户的平均付款金额：尽管我们只指定了一些特征基元，但featuretools通过组合和堆叠这些基元创建了许多新特征...我们可以将功能堆叠到我们想要的任何深度，但在实践中，我从未用过超过2的深度。在此之后，生成的特征就很难解释，但我鼓励任何有兴趣的人尝试“更深入” 。...在以后的文章中，我将展示如何使用这种技术解决现实中的问题，也就是目前正在Kaggle上主持的Home Credit Default Risk竞赛。请继续关注该帖子，同时阅读此介绍以开始参加比赛！

4.3K1 0

腾讯云 AI 代码助手：提升编码效率与优化开发体验的必备工具

通过集成先进的AI技术，该助手能够自动生成代码、优化逻辑，并提供实时建议，为开发者创造更流畅的编程体验。今天要给大家介绍的是腾讯云 Cloud Studio 中强大的功能：AI代码助手。...[1, 2, 3], 'B': [4, 5, 6]} df_original = pd.DataFrame(data) # 创建空的 DataFrame，只包含原始 DataFrame 的列名...) # 打印原始 DataFrame 和空的新 DataFrame print("原始 DataFrame:") print(df_original) print("\n空的新...: [1, 2, 3], 'B': [4, 5, 6]} df_original = pd.DataFrame(data) # 创建一个空的 DataFrame，只包含原始 DataFrame...的列名 df_empty = pd.DataFrame(columns=df_original.columns) # 打印原始 DataFrame 和空的新 DataFrame print

2911 0

【重磅来袭】在Power BI 中使用Python（4）——PQ数据导出&写回SQL

这就是我们今天要学习的内容： ? 我们在第二讲中说过： Python的处理结果以Dataframe形式输出，M将Dataframe自动转换为Table格式。...M将其Table类型的数据传递给Python，Python会自动将Table转换为Dataframe。那么Python中Dataframe如何输出呢？...这个问题先一放，我们来看另一个问题：每个国家的每日数据我们只保留一次，即便powerquery每次刷新只向MySQL数据库写入一次，但我们也不能保证编写模型的时候只刷新一次吧，因为一旦人工刷新多次，造成的结果和上面被动造成的结果一致...所以只要每次写回MySQL之前，先判断一下数据库中是否已经存在当日的数据，如果有，就先删除，再将新的数据写入，这样就达到我们的目的了。...MySQL数据库的表中初始有378条数据（因为包含了3月27日和3月28日两天的数据，共189个国家和地区的数据），运行代码后，仍然是378条，之前已有的3月28日的数据被删除，然后添加了刚刚查询到的最新数据

4.3K4 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云