首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >识别表中的RA和Dec重复项

识别表中的RA和Dec重复项
EN

Stack Overflow用户
提问于 2019-07-25 18:38:25
回答 2查看 537关注 0票数 2

我正在尝试创建一个由特定区域中的对象组成的表。我正在收集irac,2 2mass和wise数据。我已经将所有数据合并到一个表中,现在正在尝试消除基于RA和Dec坐标的重复数据。我的最终目标是拥有一个没有任何副本的完整表。因此,如果对象在irac数据中,则没有与2mass或wise数据等效的对象。我刚开始使用蟒蛇。如果能得到复制件的行#那就太好了。

代码语言:javascript
运行
复制
import pandas as pd

df = pd.read_csv('filename.csv')

duplicate = []

for num in df['ra' and 'dec']:
     if any(df['ra' and 'dec'].duplicated()):
          dublicate.append(num)

这已经运行了一段时间了,我只是不确定它是正确的还是有效的。ra和dec值在两个单独的列中。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-07-25 23:16:49

您要做的任务是星空坐标的目录交叉匹配。熊猫方法(如drop_duplicates )是不合适的,因为它们使用精确的数值比较,但一般来说,目录中的RA和Dec值将因与目录准确性有关的值而不同。

有效的目录交叉匹配本身就是一个很大的主题,但是您可以从以下引用开始:

票数 4
EN

Stack Overflow用户

发布于 2019-07-25 18:49:11

我会这样做的。但不确定花了多少时间。你可以试一试让我们知道。

代码语言:javascript
运行
复制
import pandas as pd

df = pd.read_csv('filename.csv')
New_DF = df.drop_duplicates(subset=['ra','dec'])

文档在这里(duplicates.html)

票数 -2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57208301

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档