腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
r
中
的
df
(
大小
29175
)
中
删除
/
替换
/
gsub
df
(
大小
6001
)
中
的
所有
字
匹配
列表
,
不同
大小
的
数据
帧
r
我一直在尝试
删除
dfmedia (
大小
29175
)
中
与dfvocab (
大小
6001
)
中
包含
的
任何单词相
匹配
的
任何单词。;我很愛菠菜啊;哪個
中
國人敢不喜歡饅頭?;哎呀饅頭蘋果菠菜都是食物管人家喜歡否? desired result: 我喜歡吃; 我愛吃; 我不喜歡; 我最討厭!;我很愛啊;哪個
中
國人敢不喜歡?;哎呀都是食物管人家喜歡否? 我不
浏览 14
提问于2020-10-25
得票数 0
1
回答
有没有一种简单
的
方法来比较合并
的
数据
帧
和
不同
大小
的
源
数据
帧
r
、
dataset
、
data-cleaning
我正在进行合并
数据
帧
(A + B)到源
数据
帧
(A和B)
的
数据
验证。我合并了A和B dfs,并希望确保它们正确合并。合并后
的
df
包含与源dfs相同
的
所有
变量名。问题是合并
的
df
与源dfs
的
大小
不同
。有没有简单
的
代码可以做到这一点? 在excel
中
,它会这样做:= if (Merged_dataf
浏览 4
提问于2019-10-31
得票数 1
2
回答
熊猫:当
大小
不等时,如何将Python
列表
中
的
值赋值给dataframe
中
的
列
python
、
pandas
、
dataframe
我有一个
大小
为x
的
列表
abc[],还有一个形状为2x
的
数据
帧
。现在,我希望将
列表
abc[]
中
的
值赋值给
数据
帧
中
的
一个新列。当
DF
的
大小
等于或小于
列表
时,我只想说:当<em
浏览 3
提问于2017-09-14
得票数 1
回答已采纳
2
回答
熊猫
的
记忆有效过滤
python
、
pandas
我使用以下代码
从
相当大
的
数据
帧
中
删除
行。try: return
df
但是,任务管理器没有在每次迭代时减少内存
中
数据
帧
的
大小
(每次
删除
大量<e
浏览 0
提问于2019-08-21
得票数 0
回答已采纳
2
回答
查找两个dataframe列之间
的
共享字符串
r
、
list
、
dataframe
、
dplyr
、
intersection
我有一个有两列分隔字符串
的
数据
框架:它导致了一个错误: eval
中
的
错误(
替换
(E
浏览 4
提问于2017-02-17
得票数 0
回答已采纳
2
回答
将NaN值
替换
为
数据
帧
中
的
数组
python
、
dataframe
、
replace
、
nan
我尝试将
数据
帧
中
的
所有
NaN值
替换
为数组NaN,NaN,NaN。但是,由于to_replace和value
的
大小
不同
,常规
的
替换
方法(
df
.replace)不起作用。 提前感谢:)
浏览 9
提问于2021-06-08
得票数 0
1
回答
列
R
中值
的
条件更改
r
、
dataframe
我正在尝试更改我
的
纬度和经度列
中
的
值。而不是南方(在纬度),我想
删除
S,并使数字为负数。如果是北方的话,我只想放弃N。我想用经度做同样
的
事情,然后扔掉字母。我希望韦斯特是消极
的
,东方是积极
的
。
浏览 3
提问于2015-10-19
得票数 0
回答已采纳
2
回答
使用行
中
的
值
匹配
另一个
数据
框
中
的
列和行
r
、
dataframe
、
match
我有一个包含如下产品
列表
的
data frame
df
1:|-----|---------|-------|--------|| Model | Small | Medium | Large || A |我想要
的
是将
df
1
浏览 23
提问于2018-09-05
得票数 0
回答已采纳
4
回答
计算火花
数据
的
大小
- SizeEstimator给出了意想不到
的
结果
apache-spark
、
spark-dataframe
原因是我希望有一种方法来计算“最优”分区数(“最优”在这里可能意味着
不同
的
事情:当写入Parquet表时可能意味着,或者 --但两者都可以被假定为
数据
大小
的
线性函数)。因此,其他主题建议使用SizeEstimator.estimate
从
org.apache.spark.util获取
数据
的
大小
(以字节为单位),但结果是不一致
的
。首先,我将我
的
数据
存储在内存
中
: <e
浏览 5
提问于2018-03-26
得票数 43
回答已采纳
1
回答
通过从旧
数据
帧
追加行来创建新
数据
帧
python
、
pandas
、
loops
、
dataframe
我试图通过从
不同
的
数据
帧
中选择仅满足特定条件
的
行来创建
数据
帧
。 技术人员只能使用下拉菜单为第一列选择几个字段
中
的
一个,因此我希望指定特定
的
字段。但是,第2列是一个自由文本条目,因此我正在寻找两个具有任意拼写/
大小
写类型
的
特定关键
字
。 我想要新
数据
帧
中行
中
的
所有
列。
浏览 11
提问于2020-06-23
得票数 2
2
回答
如何将多个python
数据
帧
合并为一个
数据
帧
?
python
、
python-3.x
、
pandas
、
dataframe
我需要将1500多个python
数据
帧
合并到一个大型
数据
帧
中
。我遇到
的
问题是,
数据
帧
具有唯一
的
列标题和
不同
的
大小
。John Doe johndoe I need a new car. 111111 expired
数据
帧
yoga tra
浏览 3
提问于2018-08-09
得票数 0
1
回答
这个正则表达式与字符串(而不是它
的
否定版本)
匹配
,有什么问题?
r
、
regex
我想
替换
包含一个单词
的
短语,而不是它
的
否定版本,例如,将包含gain
的
所有
短语映射到gain,将
所有
包含no gain
的
短语映射到no gain。
gsub
("^((?!*","No Gain","No Gain in this transaction",然后返回错误: 错误:在“
gsub
浏览 1
提问于2016-10-30
得票数 1
2
回答
删除
不是二元或三元
的
关键
字
(Yake)
python
、
dataframe
、
keyword
、
n-gram
我正在使用Yake (还有另一个关键
字
提取器)
从
数据
帧
中提取关键
字
。我只想提取二元和三元语法,但Yake只允许设置最大
的
ngram
大小
,而不是最小
的
大小
。您将如何
删除
它们?示例
df
.head(0): 文字:“是的,是的,”我含糊地说,“语言
的
转变现在还没有着落。”'oui',0.04491197687864554),('linguistic‘,0.09
浏览 39
提问于2021-06-30
得票数 3
回答已采纳
2
回答
我想
删除
特定值没有增加
的
行。有没有更快/更优雅
的
方法?
python-3.x
、
pandas
我有一个与30 columns,1.000.000 rows和大约150 MB
大小
的
数据
帧
。一列包含7个
不同
的
元素,另一列(Depth)包含
的
数字大多是递增
的
。每个元素
的
图表大致如下所示。我
的
最后一次尝试(代码在这篇文章
中
)是创建一个布尔
列表
,如果它通过了那里
的
条件,就可以保存这个事实。仍然很慢(大约5个小时)。[
df
['Element
浏览 1
提问于2019-08-07
得票数 2
1
回答
通过字符串
从
dataframe
中
的
所有
值使用
gsub
r
、
replace
、
gsub
如果我有一个dataframe was值,例如:
df
<-data.frame(
df
) "One""Four"我还有另一个
数据
帧
,比如:
df
2<-c("
浏览 11
提问于2017-08-18
得票数 0
回答已采纳
1
回答
熊猫基于另一个
数据
帧
值从一个
数据
框架
中
获取列。
python-3.x
所以我有两个Pandas
的
数据
帧
,它们有
不同
的
大小
。下面是一个例子,两个
数据
帧
。我们希望
df
1
从
df
2获得“颜色”和“类型”
数据
,用于“name”下
的
相应值。
浏览 3
提问于2017-12-14
得票数 1
回答已采纳
1
回答
Pandas row忽略某些行值
python
、
pandas
我尝试基于命名行对
数据
进行分组,其中每个行都是唯一
的
值。,我按唯一名称分组,并将其值分配到一个名为"type“
的
新列
中
,方法是使用regex模式
从
关键
字
列表
中提取关键
字
。具有
所有
唯一名称
的
数据
帧
是933 x 1 ('Name‘x 'Type'),但是返回
的
数据
帧
是775 x 1(并且它<e
浏览 13
提问于2019-06-03
得票数 1
3
回答
在
R
中
从
整个
数据
中
删除
特殊字符
r
、
data-science
、
data-cleaning
问题:进度:我
的
dataframe由整数、字符串等组成
的
100+列组成。当我尝试在dataframe上运行
gsub
时,它不会返回我想要
的
输出。相反,我得到了如图3所示
的
内容。<- <
浏览 0
提问于2018-04-17
得票数 5
回答已采纳
1
回答
替换
h5py文件
中
的
组会不断增加
大小
python-3.x
、
pandas
、
dataframe
、
h5py
我有一些
数据
帧
需要存储在HDF5文件
中
,既可以单独存储,也可以连接。我正在尝试使用组来保留单个
数据
帧
。然后将连接后
的
数据
帧
保存为:
df
_concatenated = pd.concat([
df
1,
df
2])
df
_concatenated.to_hdf(filename, key="key", mode但是,文件
中
的
密钥在
浏览 32
提问于2021-09-17
得票数 1
1
回答
熊猫:使用包含行权
的
另一个
数据
框架
的
值
的
数据
框架
的
元素和积。
python-3.x
、
pandas
、
dataframe
、
sumproduct
、
elementwise-operations
我有两个
数据
帧
:第一个
数据
帧
的
大小
为n,每个单元格包含一个
大小
为k
的
数值
列表
,第二个
数据
帧
的
大小
为n,每个单元格包含一个数值(实质上是一个权重)。我需要做
的
是找到一种有效
的
方法来完成以下工作:对于第一个
数据
帧
中
的
每个单元格,将该单元格
中
<e
浏览 3
提问于2021-12-12
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R包系列——stringr包
Shell笔记(2)-Shell命令进阶
如何只用一行代码让Pandas加速四倍?
用Python做网页爬虫
Python-拉丁方设计资料方差分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券