ID, FirstName, LastName, City, Address, CardID我想对表示类似实体的文件当前的方法:我尝试了一个相似评分b/w两个表,这是基于重叠列b/w,两个表和相似b/w的表名。table name similarity is computed by computing the dice coeff. of the two tables names
一旦计算了所有表对的</e
我有由相互连接的节点数组组成的路由。节点由字符串键标识,但为了方便起见,我将使用数字:#obviously over-simplified; real things would be(比如一个或两个添加的节点),并使用那些几乎重复的最小路由。遍历其余的路由,并使用以下公式计算其与步骤1中的序列的相似性:
matching = len(valu