有没有办法用python创建下面的dataframe？_有没有办法用PrestoDB优化下面的插入？_有没有办法用python创建好看的嵌套表？ - 腾讯云开发者社区

、

是否可以基于连接字符串在python中创建新的数据帧。我有一个循环，需要设置几个输出数据。所以简单地说，有没有办法让下面的东西发挥作用呢？ a='Blue' b='Green' Desired output: BlueGreen=pd.DataFrame() or a+b=pd.DataFrame()

浏览 2提问于2019-10-31得票数 1

回答已采纳

4回答

Python设置为数组和数据

友好编辑对的解释：我有一组数据。 import numpy as n , pandas as p s={12,34,78,100} print(n.array(s)) print(p.DataFrame(s)) 上面的代码将没有问题的集合转换为numpy数组。但是，当我尝试从它创建一个DataFrame时，我会得到以下错误： ValueError: DataFrame构造函数没有正确调用！那么，有没有办法将python /nested转换为numpy数组/字典，这样我就可以从它创建DataFrame了？原始问题：我有一套数据。代码 import numpy as n , p

浏览 0提问于2018-08-29得票数 5

1回答

使用ID连接特定列上的2个数据帧

、

我有两个数据帧(pandas/python) --见图。我正在尝试组合dataframe1和dataframe2来生成dataframe3，连接在'record_id‘列上。有没有办法用熊猫来做这件事？提前感谢您的帮助！

浏览 0提问于2013-06-21得票数 1

回答已采纳

1回答

熊猫。选择特定列

、

假设我们有一个具有多列Name,Sex, Age, Education, Race的Dataframe。我只想用下面的列Age,Sex,Educaion创建一个DF。我知道我可以用下面的方法做这件事。 df2 = pd.DataFrame(df[['Age','Sex','Education']] 有没有办法做这样的事。即选择除x，y，z以外的所有列。 df2 = pd.DataFrame(df(select all columns except the following columns = 'Race', 'Name

浏览 0提问于2020-04-19得票数 0

回答已采纳

1回答

删除字符串索引中指定字符后的字符

、、、

有没有办法删除Pandas DataFrame索引中指定字符后面的字符？我一直在使用人口普查数据包进行一些数据分析，它将数据输出到DataFrame，并将索引作为人口普查信息(例如，加利福尼亚州阿纳海姆市:摘要级别: 160，州:06地点:02000)我想将索引更改为仅为‘阿纳海姆市，加利福尼亚州’。做这件事最好的方法是什么？在python中是可能的吗？用html可以更容易地做到这点吗？我已经使用DataFrame.to_html()作为我的输出。谢谢

浏览 17提问于2019-09-12得票数 0

回答已采纳

3回答

读取多个csv文件时保留文件名

我正在读取多个csvs，每个csvs都有关于单个股票的数据。我使用下面的代码来分别读取它们，以便进行比较。这些数据可以很好地处理，但我在读取csv文件时丢失了它的名称。所以我不知道哪个dataframe是python中的哪个股票。有没有办法用csv文件的名称记录或标记每个数据帧？ path =r'/Users/Name/Desktop/STAT 3250 Data Analysis With Python/Stocks' filenames = glob.glob(path + "/*.csv") allsep = [] for filename in fi

浏览 44提问于2019-04-11得票数 0

1回答

加入Pandas on Between

、、

我希望使用pandas dataframes在python中重新创建一个我通常在SQL中运行的连接(但不能，因为我们的presto版本不会运行jsonb列，我需要用jsonb列来过滤其中一个表)： SELECT t1.a, t1.b FROM t1 JOIN df2 ON t1.a = t2.a AND t1.b BETWEEN t2.c AND t2.d 有没有办法用python中的dataframe而不是SQL中的表来设置它？

浏览 12提问于2021-05-08得票数 0

回答已采纳

2回答

打印DataFrame名称

、

我是Python的新手。目前运行3.5.2。我希望一个函数能够捕获熊猫DataFrame的名称，它已经被传递。有没有办法获得DataFrame名称(即"df")，而不是像下面的示例那样，在我运行函数时打印DataFrame内容？感谢您的建议 #### Test Code #### # Import pandas module import pandas as pd # Create DataFrame df = pd.DataFrame({"A":[1,2,3], "B":[10,20,30]}) # Define Function d

浏览 8提问于2017-01-17得票数 3

2回答

从Python的行/列数据生成对( DataFrame )

、、

我想从下面制作成对，像python的dataframe，我想做的是用行和列对：(1，a)，(4，c)，(6，c)，(3，d)，(2，f)，(4，f)，(6，f)，(6，g) 有没有办法这么做。提前谢谢。

浏览 2提问于2019-12-11得票数 3

回答已采纳

2回答

如何将多个变量传递给pandas dataframe，以便将它们与.map一起使用来创建新列

、

要将多个变量传递给一个普通的python函数，您只需编写如下代码： def a_function(date,string,float): do something.... convert string to int, date = date + (float * int) days return date 在使用Pandas DataFrames时，我知道您可以基于一个列的内容创建一个新列，如下所示： df['new_col']) = df['column_A'].map(a_function) # This m

浏览 2提问于2015-05-22得票数 6

1回答

在Python3中创建pandas数据框时出现问题

、

我是Python的新手。我在创建熊猫数据框时遇到了麻烦。 dataDict = {} dataDict['grant_id'] = grant_ids dataDict['patent_title'] = patent_title dataDict['kind'] = kinds df=pd.DataFrame(dataDict) 上面的代码可以在python2中运行，但是当我切换到python3时，我得到了错误消息： TypeError Traceback (most recent call last) <ipython-input-6

浏览 0提问于2019-08-13得票数 0

3回答

是否可以从PDF中提取具有格式的特定表？

、、、、

我试图从pdf中提取一个特定的表格，pdf看起来像下面的图片。我试过在python上使用不同的库，与tabula-py from tabula import read_pdf from tabulate import tabulate df = read_pdf("./tmp/pdf/Food Calories List.pdf") df 与PyPDF2 pdf_file = open("./tmp/pdf/Food Calories List.pdf", 'rb') read_pdf = PyPDF2.PdfFileReader

浏览 6提问于2020-07-22得票数 1

2回答

Python - return dataframe和list from function

我想用Python创建一个同时返回列表和数据框的函数。我知道如何使用两个独立的函数来做到这一点，但是有没有办法从一个函数同时返回这两个函数呢？ import pandas as pd # sample data data_dict = {'unit':['a','b','c','d'],'salary':[100,200,250,300]} # create data frame df = pd.DataFrame(data_dict) # Function that returns a data

浏览 20提问于2020-04-28得票数 0

回答已采纳

1回答

如何下载数据帧中的链接中的图像？

、

我有一个带有图像链接的数据帧： deputados_sites.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 512 entries, 0 to 511 Data columns (total 4 columns): Nome 512 non-null object Num_referencia 512 non-null object Link 512 non-null object Link_foto 512 non-nul

浏览 1提问于2017-12-08得票数 0

回答已采纳

1回答

DataFrame浮动到Ints？

、、

我对编程很陌生，我编写了一个使用Python读取和修改一个大型excel文件的程序。在代码中，我有以下一行： df1 = df1.apply(lambda x : pd.to_numeric(x,errors='ignore')) 这做了我需要它做的，但它也将我的标题之下的数据变成浮动。有没有办法让他们转而使用int类型呢？ df1是一个dataframe，我正在尝试创建一个嵌套字典及其内容。

浏览 0提问于2018-02-22得票数 1

回答已采纳

6回答

没有熊猫的Python字典中的PySpark Dataframe

、

我正在尝试将下面的Python dict转换为PySpark DataFrame，但没有得到预期的输出。 dict_lst = {'letters': ['a', 'b', 'c'], 'numbers': [10, 20, 30]} df_dict = sc.parallelize([dict_lst]).toDF() # Result not as expected df_dict.show() 有没有办法不使用Pandas就能做到这一点？

浏览 2提问于2018-07-27得票数 4

回答已采纳

3回答

python pandas有C/C++ API吗？

、、、

我正在使用C/C++从遗留的后端系统中提取大量数据，并使用distutils将其转移到Python。在Python中获取数据后，我将其放入pandas DataFrame对象中进行数据分析。现在我想走得更快，并想避免第二步。 pandas有没有一个C/C++ API，可以在C/C++中创建一个DataFrame，添加我的C/C++数据并将其传递给Python？我在想一些类似于numpy C API的东西。我已经考虑过在C中创建numpy数组对象作为解决办法，但我大量使用timeseries数据，也希望有TimeSeries和date_range对象。

浏览 0提问于2012-07-23得票数 19

回答已采纳

2回答

如何在Python中创建一个常量？

有没有办法在Python中声明一个常量？在Java中，我们可以用这种方式创建常量值： public static final String CONST_NAME = ""Name""; Python中的上述Java常量声明等价于什么？

浏览 491提问于2017-12-18

2回答

python模块的命令行界面

、、

我不知道该搜索什么。我正在编写一段使用python fire创建命令行界面的代码。 python test.py function argument 有没有办法让shell像上面的命令一样解释下面的内容： test function argument 类似于我可以直接调用jupyter lab，它将打开一个笔记本等。我有一种感觉，这更多地是为了设置我的bashrc或类似的东西，而不是我可以用Python做的事情。

浏览 0提问于2021-04-26得票数 1

4回答

Pyspark数据帧到python列表

、

我有下面的pyspark数据帧。 Job_name start_time status A 09:00:00 Not started B 09:30:00 Completed C 09:30:00 Running 我正在尝试创建一个列表-从上面的数据框中创建一个列表，如下所示。预期输出： lst = ["job A Not started at 09:00:00", "job B Completed at 9:30", "job C Running at 9.30"] 有没有办法将pysp

浏览 34提问于2021-09-21得票数 1

回答已采纳

2回答

从熊猫DataFrame中选择包含以整数开头的字符串的行

、、、、

我创建了一个包含一个字符串列的熊猫DataFrame。我想将它的一些行复制到第二个DataFrame中:只是第一个空格之前的字符是大于或等于300个整数的行，第一个空格后面的字符是“百老汇”。在下面的示例中，只应复制第一行。我更愿意解决这个问题，而不是简单地用直接的Python编写布尔表达式。让我们假设我想让某人相信使用熊猫而不是没有熊猫的Python的好处。非常感谢。 d = { "address": [ "300 Broadway", #Ok. "300 Wall Street", #S

浏览 2提问于2019-10-13得票数 0

4回答

VBA可以像Python一样接受多行字符串吗？

、

在Python中，我可以使用“”创建多行字符串。例如： x = """ Hello World """" 有没有办法用VBA做到这一点？

浏览 0提问于2014-11-26得票数 1

1回答

在图中显示活动图表

、、、

我们能在图中以图表的形式显示实时数据吗？我有一个python代码来提取股票市场的实时数据。起初，我想使用Tkinter创建一个GUI，但是由于它的丑陋界面，我决定改用Figma。有没有办法将Figma连接到我的python代码，以便在Figma上生成一个活图？我的python程序以Pandas Dataframe的形式提供数据。

浏览 3提问于2021-10-08得票数 1

回答已采纳

1回答

Visual Studio不显示来自awswrangler的DataFrame弹出帮助

、、、、

我正在使用带有Microsoft Python扩展的VS代码。如果我创建一个Pandas dataframe并写出变量的名称VS Code，弹出各种帮助文本。但是，如果我有一个使用wr.athena.read_sql_query创建的变量，即使该变量是一个Pandas数据帧，我也得不到任何帮助文本。有没有办法让VS代码意识到示例中的df2是一个熊猫DataFrame并获得帮助文本？ import boto3 import awswrangler as wr import pandas as pd df1 = pd.DataFrame({"a":[1]}) df2 = wr

浏览 30提问于2021-08-25得票数 0

5回答

使用单个变量对嵌套字典进行索引

、

假设您有一个python字典：myDic = {'a':1, 'b':{'c':2, 'd':3}}。当然，您可以将变量设置为键值并在以后使用它，例如： myKey = 'b' myDic[myKey] >>> {'c':2, 'd':3} 然而，有没有办法以某种方式将一个变量设置为一个值，当作为键使用时，也可以在子字典中挖掘？有没有办法用python实现下面的伪代码？ myKey = "['b']['c']" myD

浏览 0提问于2012-12-13得票数 4

回答已采纳

1回答

Pandas中的群和转置或平移

、、、

我有下面的、Python、、、熊猫、、dataframe:有比这一天显示的更多的EventName。每一个都会有Race_Number = 'Race 1'，'Race 2‘等等。过一段时间，日期会增加。。我试图创建一个如下所示的dataframe：每一场比赛都有不同数量的赛跑者。在有办法做到这一点吗？谢谢

浏览 3提问于2019-10-19得票数 0

2回答

如何使用git下载和python自动启动自动创建docker容器？

、、

嘿我试着用下面的代码自动创建一个docker容器 clone = 'git clone ' + link print(clone) run = 'python3 ' + dateiname print(run) dockers = docker.from_env() userdocker = dockers.containers.run( image='python:3-alpine', stdout=True, name=author_name, command=[clone, run

浏览 42提问于2021-03-01得票数 -2

回答已采纳

1回答

在Pyspark中从dataframe插入或更新增量表

、、

我目前有一个pyspark dataframe，我最初使用下面的代码创建了一个增量表- df.write.format("delta").saveAsTable("events") 现在，由于上面的dataframe在我的需求中每天填充数据，因此为了将新记录添加到增量表中，我使用了以下语法- df.write.format("delta").mode("append").saveAsTable("events") 现在，我在databricks和我的集群中做了所有的事情。我想知道我如何用python编写通用的pys

浏览 1提问于2021-02-24得票数 4

1回答

Python快速Fast服务器

、

用python创建一个简单的Have服务器： try: server = HTTPServer(('', 80), MyHandler) print 'started httpserver...' server.serve_forever() except KeyboardInterrupt: print '^C received, shutting down server' server.socket.close() 有没有办法让它更快些？我相信上面的阻塞是如此关注缓慢的响应… 谢谢!

浏览 5提问于2011-08-31得票数 0

3回答

在美丽的汤中有一种方法可以计算html页面中的标签数量吗？

、

我正在考虑用python创建一个字典，其中键是html标记名，值是标记出现的次数。有没有办法用美味的汤或其他东西来做到这一点？

浏览 1提问于2012-12-13得票数 8

回答已采纳

1回答

熊猫的轻量级替代品

、、、

我正在尝试创建一个用Python编写的AWS函数。 Lambda函数创建失败，有以下错误：解压缩的文件大小必须小于262144000字节。以下是我的requirements.txt numpy pandas pprint pint flask scipy gunicorn pydblite jsonschema matplotlib sklearn 在删除所有test、*.pyc和*-info*文件之后，下面的包是卷的最大贡献者。 scipy 126M pandas 64M numpy 64M matplotlib 29M 我把熊猫的read_excel换成了xlsx。如果有

浏览 2提问于2017-09-26得票数 7

1回答

相同的数据产生不同的熊猫图

、、

我用DOGE加密数据创建了一个图： import pandas as pd import csv df2 = pd.read_csv("https://raw.githubusercontent.com/peoplecure/pandoras-box/master/doge.csv") plt.plot(df2['begins_at'], df2['open_price']) plt.show() 上面的图表看起来很好。但是，当我尝试使用另一种方法使用完全相同的数据创建图形时，图形看起来完全不对劲 from pandas import

浏览 0提问于2020-05-24得票数 0

1回答

Pandas Where方法:如何查询值是否在作为值的列表中

、

我有下面的DataFrame： a 0 [1, 2, 3] 1 [5, 6, 7] 我正在尝试查找列b (a列表)的值包含1的行。因此，对于上面的表，查询将返回： a 0 [1, 2, 3] 我试过了： > df.where(1 in df.a) ValueError: where requires an ndarray like object for its condition 和： > df.query('1 in a') KeyError: True 有没有人能告诉我有没有办法用where或query方法来做这

浏览 8提问于2017-08-23得票数 1

1回答

生成XML Word表格(Python)

、、

目前有没有办法生成包含与Microsoft Word兼容的表格的XML文件？最好是用python。或者一种在Linux上用python生成MS word文档的方法？

浏览 1提问于2012-06-28得票数 0

回答已采纳

2回答

不再能够在python中创建简单的数据帧绘图

、、、

所以我遇到了一个奇怪的python问题，突然之间，我不再能够创建简单的绘图。我只是试着运行这个简单的例子：https://www.geeksforgeeks.org/python-pandas-dataframe-plot-bar/ 我在哪里运行： # importing matplotlib import matplotlib.pyplot # importing pandas as pd import pandas as pd # importing numpy as np import numpy as np # creating a dataframe df =

浏览 107提问于2021-10-01得票数 0

1回答

如何在MATLAB中将pandas数据帧转换为表格？

、、、、

我让MATLAB R2019a使用py包装器运行python脚本，该包装器返回一个熊猫dataframe。此dataframe是一个字符串表。有没有办法把熊猫的dataframe转换成MATLAB表格？目前，我正在将dataframe编写为.csv，并将其导入MATLAB作为变通方法。

浏览 15提问于2019-07-18得票数 1

回答已采纳

1回答

如何使用Folium创建动画？

、、

我正在使用Folium在Python中创建地图。我有一个Pandas DataFrame，其中的条目(纬度和经度)是按时间索引的。我想一次一个小时绘制这些条目(从00:00到01:00 ......从23:00到00:00)，以便查看地图上位置的演变。有没有办法在Folium中为此目的创建动画或视频？

浏览 3提问于2017-11-23得票数 9

1回答

替换pandas DataFrame上的循环

、、

我正在迭代一个pandas dataframe (df)，并将分数添加到包含python列表(分数)的字典中： for index, row in df.iterrows(): scores[row["key"]][row["pos"]] = scores[row["key"]][row["pos"]] + row["score"] 分数字典最初不为空。数据帧非常大，这个循环需要很长时间。有没有办法在没有循环的情况下做到这一点，或者用其他方式加快速度呢？

浏览 14提问于2021-05-31得票数 3

回答已采纳

1回答

聚合空DataFrame时保留列

、、

我在python 2.7.9的pandas 0.18.0中工作。获取一个示例DataFrame并按几列分组，然后对不同的列求和以得到结果，如下所示： >>> df = pandas.DataFrame([[1,2,3],[4,5,6],[1,2,9]], columns=['a','b','c']) >>> print df a b c 0 1 2 3 1 4 5 6 2 1 2 9 >>> df.groupby(['a','b']

浏览 10提问于2016-07-29得票数 4

1回答

如何使用Python使用一个数据集来模拟另一个数据集？

、、、

我有以下示例df： import pandas as pd cars = {'Brand': ['Honda Civic','Toyota Corolla','Ford Focus','Audi A4'], 'Price': [22000,25000,27000,35000] } df = pd.DataFrame(cars, columns = ['Brand','Price'], index=['Car_1',

浏览 22提问于2020-07-12得票数 0

1回答

将pyspark dataframe写入Postgres，而不将列标记为非空

、、、

我正在使用python中的以下代码将Dataframe写入Postgres： df.write.format('jdbc') \ .mode('append') \ .option('url', url) \ .option('dbtable', tn) \ .option('user', un) \ .option('password',

浏览 14提问于2020-11-17得票数 0

回答已采纳

1回答

python pandas:重命名数据帧中的序列？

、、、

我正在使用python pandas进行数据分析，并且我想更改dataframe中序列的名称。这是可行的，但似乎效率很低： AA = pandas.DataFrame( A ) for series in A: AA[A_prefix+series] = A[series] del A[series] 有没有办法就地更改系列名称？

浏览 2提问于2012-08-31得票数 1

回答已采纳

1回答

根据范围用同一列中的非空值填充Pandas列中的空值

、、

我有一个日期字段几乎为空的dataframe。但是，在这些空值之间，我用正确的值填充了一些单元格(参见下面的单元格755和758 )。我如何用现有值填充单元格之间的缺失值，第一个现有值在其下方？换句话说，在下面的代码片段中，单元格753和754应该与755相同。单元格756和757应与758相同。我有很多行，并且我并不总是只有2个空值。有没有办法在pandas或python中高效地做到这一点呢？ data.iloc[753:760] 753 NaT 754 NaT 755 2008-05-05 756 NaT 757

浏览 12提问于2019-01-07得票数 1

3回答

如何在Python中创建XLSM文件

、、、

有没有办法在python中创建一个新的.XLSM文件？(或者)有没有办法在python中从.XLS或.XLSX文件创建.XLSM文件？ from openpyxl import Workbook wb = Workbook() wb.save('myExcelFile.xlsm') 我尝试了上面的方法，但它创建了一个不起作用的/损坏的文件。提前感谢:)

浏览 7提问于2020-01-04得票数 0

3回答

将单元格中的多行值转换为单行separated_python

、、、、

我有一个df，其中来自列'col2‘的第一个单元格的值不是在单行中，而是在多行中，如下面的示例所示： col1 col2 ID1 value1 value2 value3 ID2 value4, value5, value6 我想把它们放在一行中，就像在ID2的例子中一样，一行之间有任何分隔符。有没有办法用python做到这一点呢？我的df： ? df = pd.DataFrame({'col1': [1, 2], 'col2': ['value1\nvalue2\nvalue3',

浏览 14提问于2021-07-21得票数 1

回答已采纳

1回答

由于列不匹配而将火花数据文件插入菲尼克斯表时面临的问题

、、、

我正在创建一个结构如下的菲尼克斯表 CREATE TABLE IF NOT EXISTS "TEST1"( "slhdr" VARCHAR(100), "totmins" INTEGER, "totslrcds" INTEGER, "tottime" INTEGER, CONSTRAINT pk PRIMARY KEY ("sleepelement") ); 现在，通过从另一个dataframe中选择特定列，我已经从JSON数据中创建了一个dataframe。下面是此数据thi

浏览 0提问于2019-01-08得票数 0

回答已采纳

2回答

pyspark withColumn，如何改变列名

、、

有没有办法用pyspark 2.1.0创建/填充列，其中列的名称是另一个列的值？我尝试了以下几种方法 def createNewColumnsFromValues(dataFrame, colName, targetColName): """ Set value of column colName to targetColName's value """ cols = dataFrame.columns #df = dataFrame.withColumn(f.col(colName), f.col(targetCol

浏览 0提问于2018-09-13得票数 1

1回答

如何对numpy数组中的每个分类列进行赋值

、、

对于panda数据帧，有很好的解决方案。但由于我主要使用numpy数组，我必须创建新的熊猫DataFrame对象，计算并转换回numpy数组，如下所示： nomDF=pd.DataFrame(x_nominal) #Convert np.array to pd.DataFrame nomDF=nomDF.apply(lambda x:x.fillna(x.value_counts().index[0])) #replace NaN with most frequent in each column x_nominal=nomDF.values #convert back pd.DataFram

浏览 9提问于2016-09-13得票数 0

回答已采纳

2回答

如何绘制包含在DataFrame中的特定日期的时间序列数据，这可能会导致单个记录

、、、

有没有办法为只包含一条记录的DataFrame创建折线图？我在DataFrame中的示例数据: Head = 'Date'，'Count1'，'Count2'，'Count3‘ 01-10-2010, 100, 0 , 100 X轴:我正在尝试以每个星期天为基准显示日期 Y轴:所有其他3个计数我已经提到了https://python-graph-gallery.com/122-multiple-lines-chart/，但我正在尝试找到一种方法来创建一个只有一条记录的图表。如果有人有任何示例代码，请帮助我。

浏览 11提问于2019-10-11得票数 1

1回答

创建基于条件的累积列pandas python

、、

我有多列的dataframe。其中之一就是CumulativeProduction。需要创建另一个名为“已更正的累积列”的列。请查看下面的内容。 df： ? 我的方法是：我尝试使用向前填充来填充0，但是如果列有多组值(比如下面的100,200,300 )，它就会失败。有没有办法解决这个问题？ import pandas as pd data = {'CummulativeProdution':[100,200,300,0,0,0,100,200,300,0,0,0] } df = pd.DataFrame(data)

浏览 15提问于2021-06-18得票数 0

回答已采纳