从r中的df (大小29175)中删除/替换/gsub df (大小6001)中的所有字匹配列表，不同大小的数据帧

我一直在尝试删除dfmedia (大小29175)中与dfvocab (大小6001)中包含的任何单词相匹配的任何单词。；我很愛菠菜啊；哪個中國人敢不喜歡饅頭？；哎呀饅頭蘋果菠菜都是食物管人家喜歡否？ desired result: 我喜歡吃; 我愛吃; 我不喜歡; 我最討厭！；我很愛啊；哪個中國人敢不喜歡？；哎呀都是食物管人家喜歡否？我不

浏览 14提问于2020-10-25得票数 0

1回答

有没有一种简单的方法来比较合并的数据帧和不同大小的源数据帧

r、dataset、data-cleaning

我正在进行合并数据帧(A + B)到源数据帧(A和B)的数据验证。我合并了A和B dfs，并希望确保它们正确合并。合并后的df包含与源dfs相同的所有变量名。问题是合并的df与源dfs的大小不同。有没有简单的代码可以做到这一点？在excel中，它会这样做：= if (Merged_dataf

浏览 4提问于2019-10-31得票数 1

2回答

熊猫:当大小不等时，如何将Python列表中的值赋值给dataframe中的列

python、pandas、dataframe

我有一个大小为x的列表abc[]，还有一个形状为2x的数据帧。现在，我希望将列表abc[]中的值赋值给数据帧中的一个新列。当DF的大小等于或小于列表时，我只想说：当<em

浏览 3提问于2017-09-14得票数 1

回答已采纳

2回答

熊猫的记忆有效过滤

python、pandas

我使用以下代码从相当大的数据帧中删除行。try: return df 但是，任务管理器没有在每次迭代时减少内存中数据帧的大小(每次删除大量<e

浏览 0提问于2019-08-21得票数 0

回答已采纳

2回答

查找两个dataframe列之间的共享字符串

r、list、dataframe、dplyr、intersection

我有一个有两列分隔字符串的数据框架：它导致了一个错误： eval中的错误(替换(E

浏览 4提问于2017-02-17得票数 0

回答已采纳

2回答

将NaN值替换为数据帧中的数组

python、dataframe、replace、nan

我尝试将数据帧中的所有NaN值替换为数组NaN，NaN，NaN。但是，由于to_replace和value的大小不同，常规的替换方法(df.replace)不起作用。提前感谢:)

浏览 9提问于2021-06-08得票数 0

1回答

列R中值的条件更改

r、dataframe

我正在尝试更改我的纬度和经度列中的值。而不是南方(在纬度)，我想删除S，并使数字为负数。如果是北方的话，我只想放弃N。我想用经度做同样的事情，然后扔掉字母。我希望韦斯特是消极的，东方是积极的。

浏览 3提问于2015-10-19得票数 0

回答已采纳

2回答

使用行中的值匹配另一个数据框中的列和行

r、dataframe、match

我有一个包含如下产品列表的data frame df1：|-----|---------|-------|--------|| Model | Small | Medium | Large || A |我想要的是将df1

浏览 23提问于2018-09-05得票数 0

回答已采纳

4回答

计算火花数据的大小- SizeEstimator给出了意想不到的结果

apache-spark、spark-dataframe

原因是我希望有一种方法来计算“最优”分区数(“最优”在这里可能意味着不同的事情:当写入Parquet表时可能意味着，或者 --但两者都可以被假定为数据大小的线性函数)。因此，其他主题建议使用SizeEstimator.estimate从org.apache.spark.util获取数据的大小(以字节为单位)，但结果是不一致的。首先，我将我的数据存储在内存中： <e

浏览 5提问于2018-03-26得票数 43

回答已采纳

1回答

通过从旧数据帧追加行来创建新数据帧

python、pandas、loops、dataframe

我试图通过从不同的数据帧中选择仅满足特定条件的行来创建数据帧。技术人员只能使用下拉菜单为第一列选择几个字段中的一个，因此我希望指定特定的字段。但是，第2列是一个自由文本条目，因此我正在寻找两个具有任意拼写/大小写类型的特定关键字。我想要新数据帧中行中的所有列。

浏览 11提问于2020-06-23得票数 2

2回答

如何将多个python数据帧合并为一个数据帧？

python、python-3.x、pandas、dataframe

我需要将1500多个python数据帧合并到一个大型数据帧中。我遇到的问题是，数据帧具有唯一的列标题和不同的大小。John Doe johndoe I need a new car. 111111 expired 数据帧yoga tra

浏览 3提问于2018-08-09得票数 0

1回答

这个正则表达式与字符串(而不是它的否定版本)匹配，有什么问题？

r、regex

我想替换包含一个单词的短语，而不是它的否定版本，例如，将包含gain的所有短语映射到gain，将所有包含no gain的短语映射到no gain。gsub("^((?!*","No Gain","No Gain in this transaction",然后返回错误：错误:在“gsub

浏览 1提问于2016-10-30得票数 1

2回答

删除不是二元或三元的关键字(Yake)

python、dataframe、keyword、n-gram

我正在使用Yake (还有另一个关键字提取器)从数据帧中提取关键字。我只想提取二元和三元语法，但Yake只允许设置最大的ngram大小，而不是最小的大小。您将如何删除它们？示例df.head(0)：文字：“是的，是的，”我含糊地说，“语言的转变现在还没有着落。”'oui'，0.04491197687864554)，('linguistic‘，0.09

浏览 39提问于2021-06-30得票数 3

回答已采纳

2回答

我想删除特定值没有增加的行。有没有更快/更优雅的方法？

python-3.x、pandas

我有一个与30 columns，1.000.000 rows和大约150 MB大小的数据帧。一列包含7个不同的元素，另一列(Depth)包含的数字大多是递增的。每个元素的图表大致如下所示。我的最后一次尝试(代码在这篇文章中)是创建一个布尔列表，如果它通过了那里的条件，就可以保存这个事实。仍然很慢(大约5个小时)。[df['Element

浏览 1提问于2019-08-07得票数 2

1回答

通过字符串从dataframe中的所有值使用gsub

r、replace、gsub

如果我有一个dataframe was值，例如：df<-data.frame(df) "One""Four"我还有另一个数据帧，比如： df2<-c("

浏览 11提问于2017-08-18得票数 0

回答已采纳

1回答

熊猫基于另一个数据帧值从一个数据框架中获取列。

python-3.x

所以我有两个Pandas的数据帧，它们有不同的大小。下面是一个例子，两个数据帧。我们希望df1从df2获得“颜色”和“类型”数据，用于“name”下的相应值。

浏览 3提问于2017-12-14得票数 1

回答已采纳

1回答

Pandas row忽略某些行值

python、pandas

我尝试基于命名行对数据进行分组，其中每个行都是唯一的值。，我按唯一名称分组，并将其值分配到一个名为"type“的新列中，方法是使用regex模式从关键字列表中提取关键字。具有所有唯一名称的数据帧是933 x 1 ('Name‘x 'Type')，但是返回的数据帧是775 x 1(并且它<e

浏览 13提问于2019-06-03得票数 1

3回答

在R中从整个数据中删除特殊字符

r、data-science、data-cleaning

问题：进度：我的dataframe由整数、字符串等组成的100+列组成。当我尝试在dataframe上运行gsub时，它不会返回我想要的输出。相反，我得到了如图3所示的内容。<- <

浏览 0提问于2018-04-17得票数 5

回答已采纳

1回答

替换h5py文件中的组会不断增加大小

python-3.x、pandas、dataframe、h5py

我有一些数据帧需要存储在HDF5文件中，既可以单独存储，也可以连接。我正在尝试使用组来保留单个数据帧。然后将连接后的数据帧保存为： df_concatenated = pd.concat([df1, df2]) df_concatenated.to_hdf(filename, key="key", mode但是，文件中的密钥在

浏览 32提问于2021-09-17得票数 1

1回答

熊猫:使用包含行权的另一个数据框架的值的数据框架的元素和积。

python-3.x、pandas、dataframe、sumproduct、elementwise-operations

我有两个数据帧:第一个数据帧的大小为n，每个单元格包含一个大小为k的数值列表，第二个数据帧的大小为n，每个单元格包含一个数值(实质上是一个权重)。我需要做的是找到一种有效的方法来完成以下工作:对于第一个数据帧中的每个单元格，将该单元格中<e

浏览 3提问于2021-12-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有没有一种简单的方法来比较合并的数据帧和不同大小的源数据帧

熊猫:当大小不等时，如何将Python列表中的值赋值给dataframe中的列

熊猫的记忆有效过滤

查找两个dataframe列之间的共享字符串

将NaN值替换为数据帧中的数组

列R中值的条件更改

使用行中的值匹配另一个数据框中的列和行

计算火花数据的大小- SizeEstimator给出了意想不到的结果

通过从旧数据帧追加行来创建新数据帧

如何将多个python数据帧合并为一个数据帧？

这个正则表达式与字符串(而不是它的否定版本)匹配，有什么问题？

删除不是二元或三元的关键字(Yake)

我想删除特定值没有增加的行。有没有更快/更优雅的方法？

通过字符串从dataframe中的所有值使用gsub

熊猫基于另一个数据帧值从一个数据框架中获取列。

Pandas row忽略某些行值

在R中从整个数据中删除特殊字符

替换h5py文件中的组会不断增加大小

熊猫:使用包含行权的另一个数据框架的值的数据框架的元素和积。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐