腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
从
旧
df
创建
的
数据
帧
出现问题
dataframe
、
nan
、
int64
我尝试用现有
数据
框中
的
列
创建
一个新
的
数据
框,但它不能像预期
的
那样工作。第一个
df
是通过读取csv
创建
的
例如 a b c0 1 11 0 0 a在第一个
数据
帧
中,'a‘
的
数据</em
浏览 24
提问于2021-01-22
得票数 0
2
回答
循环遍历
数据
帧
并追加到新
的
空
数据
帧
r
、
for-loop
、
dataframe
我有包含如下
数据
的
csv文件 1 2 'some string1' 287 'some string3' 我需要遍历每个
数据
,并将
数据
复制到另一个
数据
帧
。所以我需要这样
的
东西
df
<-
浏览 1
提问于2017-08-30
得票数 0
2
回答
R:随机化data.frame
的
一列
的
顺序
r
、
random
、
dataframe
我有一个这样
的
数据
帧
:我想生成两个基于
df<
浏览 2
提问于2011-05-31
得票数 7
1
回答
如何在pandas dataframe中做零值日志
python
、
pandas
、
numpy
如何将numpy log函数应用于其中包含0值
的
panda
数据
帧
?这是我想要转换
的
数据
帧
内
的
序列
的
一个示例3 2583 2358.0我试着用
浏览 2
提问于2018-07-21
得票数 1
1
回答
为什么我
的
列在不为空时显示为NaN?
python
、
pandas
我正在尝试使用pandas
从
我下载
的
.csv文件
创建
数据
框。每次我尝试
创建
一个predictors
数据
框时,它都会清空我正在寻找
的
一列。我以前使用不同
的
数据
集通过以下方式做到了这一点,它工作得无懈可击。这一次我
的
数据
被删除了,我不知道为什么。(file) predictors=p
浏览 25
提问于2019-04-30
得票数 1
回答已采纳
1
回答
pandas
数据
帧
到scipy稀疏矩阵
的
高效转换
python
、
pandas
、
dataframe
、
scipy
、
sparse-matrix
我正在尝试将pandas Dataframe转换为scipy稀疏矩阵,以此作为有效使用许多功能
的
一种方式。然而,我没有找到一种有效
的
方法来访问dataframe中
的
值,所以在执行转换时,我总是会耗尽内存。我尝试了下面的两个解决方案,但它们都不起作用。我研究了很多,但没有找到更好
的
。sparse_array = sparse.csc_matrix(
df
.values) sparse_array = sparse.csc_matrix(
df
.to_numpy())
浏览 12
提问于2020-10-19
得票数 1
回答已采纳
1
回答
R:带有空字符字符串
的
数据
帧
列在读取时会转到NA。
r
、
dataframe
其思想是通过rbind-ing
数据
帧
创建
和更新目录。这包括按顺序读取和写入文件。对于某些
数据
帧
,某些字符串列不包含任何值(空白chr字符串"")时会
出现问题
。绑定这些
数据
帧
会产生NAs,而不是期望
的
"“。
df
<- data.frame(a = 1:5, b = "", stringsAsFactors = F) write.csv(
df
, &
浏览 9
提问于2015-09-04
得票数 1
回答已采纳
1
回答
更新整个用户群
的
均值和标准差
python
、
pandas
目前,我有10,000个用户
的
数据
,以及他们不同列
的
输出。我推导出它们
的
均值和标准差。对于这个示例,我显示了12个类别,但在实际实现中,我们有接近150到200个类别
df
: Name mean_sd Valuecat1个新用户,我会将它们附加到
旧
数据
中,然后再用整个
数据
库进行编译,这样我就可以得出新
的
平均值和标准差。现在我
的
问题是,有没有更好
的
浏览 19
提问于2020-11-20
得票数 0
回答已采纳
1
回答
在linux机器上使用s3a对于>100列拼接失败
linux
、
scala
、
parquet
、
spark-shell
、
amazon-s3-access-points
我使用s3a
从
数据
库读取
数据
帧
并写入.parquet(s3a://bucketname//folder)。它适用于<100列
的
数据
帧
,但crashes.exits spark-shell适用于>100列
的
数据
帧
。如果是列限制/版本问题/内存问题,是否找不到任何材料?希望能从经验丰富
的
社区中找到一些方向。下面的代码可以在我
浏览 15
提问于2021-05-20
得票数 1
回答已采纳
1
回答
将Scala Spark中DataFrame列中
的
指定值替换为新值
apache-spark
、
apache-spark-sql
有没有办法用新值替换'Col1‘中
的
指定值?假设我有一个要替换
的
值列表to: ['one','two','three'] 我知道我可以使用.withColumn并说when 1 then "one" otherwise等,但是当我
的
值列表很长时,这就不太方便了。
浏览 2
提问于2018-08-14
得票数 0
回答已采纳
1
回答
如何在索引
数据
框中追加一行
python
、
pandas
当我在带索引
的
dataframe中追加一行时,我得到了一个NaN值。有人能帮我解决这个问题吗?下面是我
的
代码:
df
= pd.DataFrame(columns=mycolumns)for rowin rows:print(
df
)
df
=
df
.set_i
浏览 0
提问于2018-07-01
得票数 0
3
回答
join后如何重命名重复
的
列?
apache-spark
、
pyspark
、
apache-spark-sql
我想对3个
数据
帧
使用join,但是有一些列我们不需要,或者与其他
数据
帧
有一些重复
的
名称,所以我想删除一些列,如下所示: .join(cc_
df
, 'id', 'left') .withColumnRenamed(bb_
df
.status, &
浏览 0
提问于2018-05-11
得票数 9
回答已采纳
1
回答
Pandas: Concat意外添加一行
python
、
pandas
、
dataframe
我正在使用带有一个名为
df
的
DataFrame
的
Pandas。我正在用它提取新
的
特征,并用pd.concat组合产生
的
两个新
的
数据
帧
。下面是我
的
函数: print("
df
at start",
df
.shape)
df
浏览 24
提问于2018-02-24
得票数 3
1
回答
Panda追加并合并重新排序
数据
帧
吗?
python
、
pandas
、
sorting
、
dataframe
我使用python pandas包
创建
了一个空
数据
帧
(
df
1),其中只包含以下列: var1、var2、var3当我向
df
1追加
df
2时,
数据
帧
中列
的
顺序发生了变化。我尝试使用sort_values和sort重新排序
数据
帧
和
旧
<e
浏览 5
提问于2018-01-18
得票数 0
回答已采纳
1
回答
在函数内部修改
的
DataFrame
python
、
pandas
我面对
的
是一个我以前从未观察过
的
函数中
数据
帧
的
修改。有没有一种方法可以处理这个问题,而不修改初始
数据
帧
?In[30]: def test(
df
): return
df
Empty DataFrameI
浏览 0
提问于2015-07-24
得票数 20
回答已采纳
1
回答
使用pyspark向dataframe添加新列
的
问题
pyspark
、
apache-spark-sql
、
pyspark-dataframes
假设我运行以下代码
DF
1.withColumn("Is_elite", .show() 我得到了我想要
的
结果,这是一个名为Is_elite
的
新列,其中包含正确
的
值,然后在我运行
的
下一个命令中
DF
1.show 它只是向我展示了如果我没有运行第一个命令,
DF
1会是什么样子,我
的</em
浏览 20
提问于2020-04-20
得票数 0
回答已采纳
1
回答
在Windows 10下将json文件加载到RStudio时字符串编码
的
问题
r
、
json
、
character-encoding
、
windows-10
、
tweets
我试图
从
json文件中提取Tweets,并在Windows10下将其保存为RData,并使用RStudio版本1.2.5033和streamR。我使用
的
代码如下:
df
$
的
输出是:'1 "RT @bkabka:Eik t\m\n\n\x{e76f}‘’。因为所有这些都是因为函数错误地假定文本是用Windows1252编码
的
,所以one解决方案将遍历整个语料库,并将
浏览 1
提问于2020-03-10
得票数 1
1
回答
Pyspark通过更新旧
数据
框架中
的
少数列来
创建
新
的
数据
框架
pyspark
我想要
创建
新
的
数据
框架与更新
数据
从
旧
的
数据
帧
中
的
几个列在火花公子。
df
1 =
df
.select(&qu
浏览 0
提问于2018-12-11
得票数 1
回答已采纳
1
回答
合并回原始pandas
数据
帧
中
的
新计算
python
、
pandas
假设我有一个名为'
df
‘
的
Pandas
数据
帧
,如下所示:0 -3 6 -72 9 -10 -94 -2 1 -8我想在
df
中
的
一些行之外
创建
一个新
的
框架: new_
df
=
df
.loc[(
df
['X'] == -3) & (
df
['X'
浏览 0
提问于2016-12-10
得票数 1
1
回答
在循环中高效地聚合(fitler/select)大型
数据
帧
并
创建
新
的
数据
帧
list
、
dataframe
、
loops
、
apache-spark-sql
、
databricks
我有一个通过导入csv文件(sparkscv)
创建
的
大型
数据
帧
。这个dataframe有很多行
的
日常
数据
。
数据
由日期、区域、service_offered和计数标识。如果我一遍又一遍地把它附加到
df
上,大0开始发生,它变得非常慢。有360个办公室,每个办公室大约有5-10个服务。如何先将select/filter保存到列表中,然后在生成最终
数据
帧
之前追加这些选择/过滤器?,但对于当前
的</
浏览 15
提问于2020-10-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10招!看骨灰级Pythoner如何玩转Python
如何只用一行代码让Pandas加速四倍?
Python用KShape对时间序列进行聚类和肘方法确定最优聚类数k可视化
使用Cleanlab、PCA和Procrustes可视化ViT微调
pandas如何将多个DF写入同一个excel工作簿中
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券