腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
删除
R
中
具有
相似
(
不相同
)
字符串
的
行
r
、
filter
、
dplyr
、
duplicates
、
similarity
我有大量
的
word文件作为文本导入到
r
中
(每个报告都在一个单元格
中
),每个主题都有一个ID。 然后,我使用dplyr
中
的
distinct函数
删除
重复
的
文件。然而,一些报告是完全相同
的
,但有一个微小
的
差异(例如额外/较少
的
几个字,额外
的
空间,等等),所以dplyr没有将它们算作重复。有没有一种有效
的
方法来
删除
r
中
浏览 25
提问于2020-11-01
得票数 1
2
回答
基于
相似
性度量Pandas
删除
Dataframe
行
python
、
pandas
、
dataframe
、
rows
我希望消除数据帧
中
的
重复
行
。 Title | Area | PriceApt atBoston 105
浏览 3
提问于2019-08-01
得票数 2
2
回答
SQL同步大表数据
sql-server-2008
您好,我使用
的
是SQL2008
R
2。插入10mil数据
的
更快方法是什么?从一个表A到另一个空表B
的
记录。表A和B不
具有
相同
的
模式
相似
但
不相同
。
浏览 5
提问于2011-05-23
得票数 1
回答已采纳
1
回答
针对公司名称
相似
度训练doc2vec
word2vec
、
doc2vec
、
sentence-similarity
我正在尝试使用名称
相似
性对一个庞大
的
公司列表(40M+)进行重复数据
删除
。我有一个500K
的
公司名称对,标记为相同/
不相同
(如I.B.M.通过logistic回归建立
的
名字对向量差异模型
的
f分数很高(0.98),但推理(寻找最
相似
的名字)太慢(几乎每个名字2秒)。是否可以使用名称
相似
性对(正和负)来训练doc2vec模型,从而导致
相似
的名称
具有
相似
的向量,以便我可以使用像
浏览 4
提问于2017-08-13
得票数 1
1
回答
删除
具有
顺序
相似
数据
的
行
-
R
Zoo
r
、
xts
、
zoo
我有一个动物园数据集,它是按时间索引
的
。有些
行
有相同
的
数据,所以我基本上只想
删除
这些重复
的
行
。-012012-07-05 10:19:49 -9.531491e-05 -9.999995e-01
删除
后有没有更好
的
方法来做这样
的
练习?
浏览 1
提问于2012-07-20
得票数 2
回答已采纳
3
回答
删除
已在另一个表
中
的
行
mysql
虽然字段名
相似
,但它们并
不相同
。有人能给我指明正确
的
方向吗? 提前谢谢。
浏览 4
提问于2014-08-22
得票数 0
回答已采纳
2
回答
删除
单个列表
中
的
相似
(但
不相同
)
字符串
python
、
recursion
、
fuzzywuzzy
我有一个
字符串
列表,如下所示: 'https://www.google.com', 'http://www.google.com'] 正如您所看到
的
,它们并
不相同
,但它们看起来都非常
相似
。for
浏览 14
提问于2020-03-04
得票数 0
回答已采纳
2
回答
如何筛选出
R
中
相似
(
不相同
)
行
名
的
值
r
、
function
、
filter
、
subset
、
logical-operators
我对
R
环境有些陌生。我有一组字符"test“。如果我想从一个样本数据(它是数字)
中
过滤出该列
的
所有相应值,我可以通过匹配列名来实现。-001 aa-099 cc zz 这给了我一个逻辑向量,我可以用它来获取所需
的
数据TRUE FALSE FLASE FLASE TRUE a
浏览 3
提问于2014-05-14
得票数 0
3
回答
在regex
字符串
中
搜索类似的值
python
、
regex
我试图在两个
字符串
相似
但
不相同
的
列表中使用regex进行搜索,如何修复下面的错误?juice','juice;44','apple;66'] for a in list1: f
浏览 4
提问于2020-09-11
得票数 1
回答已采纳
2
回答
Objective-C正则表达式
删除
部分
字符串
objective-c
、
regex
您好,我正在尝试从web响应
中
删除
某些HTML
字符串
。我想
删除
<pre><a style="" name="output-line-1">1</a>,因为数字“1”
的
who实例不同,但始终是一个数字。以下是我到目前为止得到
的
信息:{ while ((
浏览 3
提问于2013-05-31
得票数 0
回答已采纳
1
回答
如何
删除
相似
行
中
具有
特定条件
的
相似
行
?
oracle10g
在Oracle10g
中
,我有一个表,它没有完全相同
的
副本,但有许多
相似
的
行
。这没问题,但我想
删除
相似
行
集合
中
具有
一个特定条件
的
行
。条件是多个帐户与一个PRACTICE_NAME关联。当该PRACTICE_NAME有多个帐户时,我要
删除
Acct值为空
的
所有记录。但是,如果PRACTICE_NAME只有一个实例,并且ACCT为NULL,我希望保留记录。MI 22
浏览 0
提问于2013-05-08
得票数 0
回答已采纳
2
回答
如何在不同
的
数据帧中找到公共变量?
r
、
dataframe
我有几个
具有
相似
(但
不相同
)
的
变量序列(列)
的
数据框架。我想为
R
找到一种方法,告诉我什么是不同数据帧之间
的
公共变量。9)b <- c(1, 3, 5)df2 <- data.frame(b, c)` 对于df1和df2,我希望
R
能以某种方式告诉我,常见
的
变量是b和c。
浏览 1
提问于2018-10-17
得票数 5
回答已采纳
2
回答
避免python regex
中
的
重复
删除
python
、
regex
我正在使用Python使用regex从一堆txt文件
中
删除
行
;但是,如果该行包含一个与第一个
字符串
非常
相似
的
字符串
,它有时会重复
删除
。)
r
= re.compile(
r
"(?) 当只有第一个应该
删除
时,它会同时
删除
market.fruit.apple和market.fruit.apple.all。我正在考虑在
字符串</em
浏览 0
提问于2020-05-28
得票数 1
回答已采纳
1
回答
与其将拼写错误
的
单词与所有字典单词进行比较,莱文-距离还有别的方法吗?
algorithm
、
artificial-intelligence
、
levenshtein-distance
、
misspelling
我在寻找用于拼写纠正
的
AI算法,我发现Levenshtein距离算法比较了两个
字符串
之间
的
相似
性,所以我
的
问题是,我应该将错误单词与字典
中
的
所有单词实现这种
相似
性吗?因为如果是的话,时间就会很慢。我
的
第二个问题是,这个算法能在两个长度
不相同
的
字符串
上实现吗?
浏览 2
提问于2016-04-27
得票数 0
回答已采纳
3
回答
R
结合
具有
相似
值
的
行
。
r
、
dataframe
、
dplyr
、
diff
、
cluster-analysis
我有一个dataframe,
行
值首先是从最小到最大
的
排序。我计算相邻
行
之间
的
行
值差异,合并
具有
类似差异(例如小于1)
的
行
,并返回合并行
的
平均值。我可以使用for循环检查每一
行
的
差异,但这似乎是一种效率很低
的
方法。有更好
的
主意吗?谢谢。, 2.2, 3, 5, 6.2, 6.8, 7, 8.5, 10, 12.2, 13, 14)) DF <- DF %>
浏览 1
提问于2018-05-13
得票数 2
回答已采纳
3
回答
为
字符串
数组
的
每个元素(从另一个
字符串
数组)搜索和分配最佳
字符串
的
算法
algorithm
我有两个
字符串
数组(从两个不同
的
来源提取以进行测试)。其中一个数组
中
的
每个
字符串
都必须分配给另一个数组
中
的
一个
字符串
。这些
字符串
可能并不总是完全匹配,但可以使用类似的
字符串
(最佳匹配)。我需要
的
是一个算法来搜索最好
的
字符串
,并拒绝相同
的
,如果没有任何。
浏览 2
提问于2011-06-07
得票数 1
回答已采纳
2
回答
R
:搜索类似
字符串
并返回带有条件符号
的
字符串
r
、
similarity
我
的
df有以下条目:xxxxxx1yyyy我想根据A列
的
相似
性,根据以下条件将符号添加到df
的
B列
中
。例如,因为第1
行
和第2
行
是相同
的</
浏览 2
提问于2011-06-29
得票数 5
1
回答
在PCL
中
从一个点云中
删除
另一个点云中
的
点?
point-cloud-library
、
point-clouds
我想做以下操作: C=A-B,其中C是操作
的
输出云。我知道PCL有连接两个点云
的
'+‘操作,比如: pcl::PointCloud<pcl::PointXYZ> B; //assumeA and B have points in them然而,我不认为有一个'-‘运算符来从一个点云中
删除
另一个点。输出C只包
浏览 6
提问于2018-04-10
得票数 0
1
回答
对
r
中
具有
相似
名称
的
行
求和
r
、
sum
、
rows
我有一个表,其中包含
具有
相似
或相等名称
的
行
,我需要对这些
行
求和。做一个单独
的
记录,我怎么才能用
R
来做呢?我试着用一个循环for不起作用。
浏览 0
提问于2020-04-07
得票数 0
0
回答
Excel:
删除
多组看起来
相似
的
行
excel
使用Find和delete set of row,可以
删除
包含某些内容
的
行
。以这个excel文件为例。我想
删除
与1576到1578
相似
的所有
行
,因为有许多表
具有
这些值,并且我想要获取“不喜欢-B”
行
下面的“平均值”
行
浏览 1
提问于2017-06-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Java特性专题报道:文本块
在 Python 和 Java 中使用编译的正则表达式的好处
gvim,简陋而强大的编辑器
Linux基础之vim编辑器
Hacker基础之Linux篇:基础Linux命令四
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券