我正在尝试创建一个由特定区域中的对象组成的表。我正在收集irac,2 2mass和wise数据。我已经将所有数据合并到一个表中,现在正在尝试消除基于RA和Dec坐标的重复数据。我的最终目标是拥有一个没有任何副本的完整表。因此,如果对象在irac数据中,则没有与2mass或wise数据等效的对象。我刚开始使用蟒蛇。如果能得到复制件的行#那就太好了。
import pandas as pd
df = pd.read_csv('filename.csv')
duplicate = []
for num in df['ra' and 'dec']:
if any(df['ra' and 'dec'].duplicated()):
dublicate.append(num)
这已经运行了一段时间了,我只是不确定它是正确的还是有效的。ra和dec值在两个单独的列中。
发布于 2019-07-25 23:16:49
您要做的任务是星空坐标的目录交叉匹配。熊猫方法(如drop_duplicates
)是不合适的,因为它们使用精确的数值比较,但一般来说,目录中的RA和Dec值将因与目录准确性有关的值而不同。
有效的目录交叉匹配本身就是一个很大的主题,但是您可以从以下引用开始:
发布于 2019-07-25 18:49:11
我会这样做的。但不确定花了多少时间。你可以试一试让我们知道。
import pandas as pd
df = pd.read_csv('filename.csv')
New_DF = df.drop_duplicates(subset=['ra','dec'])
文档在这里(duplicates.html)
https://stackoverflow.com/questions/57208301
复制相似问题