在pandas数据框中查找房屋之间的相似性以进行内容过滤

、、、

我想对房屋应用内容过滤。我想找到每个房子的相似性分数来推荐。我能推荐一号房的什么吗？所以我需要房屋的相似度矩阵。我怎么才能找到它？+1'] ,['house7',110,1475,'gas','3+1'] Create th

浏览 5提问于2019-07-25得票数 1

回答已采纳

2回答

协同过滤算法

、

如果我有以下用户，他们观看的电影的评级如下：User2 Movie2-5 Movie2-3 Movie3-4如何使用协作过滤向user1推荐user1，以及如何计算user1给movie3 4或更高的概率？

浏览 7提问于2016-11-02得票数 1

1回答

计算二进制pandas数据帧的相似性度量

、、、、

我需要在python中编码一个相似性分数，以便根据电影类型找到匹配的内容。该比较是为了让1个用户找到他们的二进制类型评分与40,000个电影标题的二进制类型评分数据帧之间的相似性。我需要遍历数据帧，并将每个项目与用户得分进行比较，以找到相似度。以用户1为例: 0,1,0,0,0,0,1,0,0,0,1,1,0,0,0,1 比较与电影数据

浏览 39提问于2020-10-23得票数 0

3回答

数据库/NoSQL-检索以下数据的最低延迟方式

、、、、

- city - zip- sqft- bathrooms- geo_longitudeSELECT * from houses AND longitude IS BETWEENwww AND zzz 问题：，对于我来说，存储这些信息的最快方法是什么，这

浏览 1提问于2010-05-09得票数 5

2回答

如何在Python/Pandas中仅表示日期的小时部分

、、

我有一个表示日程表的CSV文件，例如这意味着从a到b的航班1每天10:00出发，12:00到达。我需要将这些数据加载到Pandas数据框中，并方便地对其进行处理，例如查找给定时间之间的行程或按出发时间排序。在Pandas中只表示日期的小时和分钟部分的推荐方式是什么

浏览 1提问于2015-01-26得票数 1

1回答

如何按相关性对搜索结果进行排序？

、、

我正在做一个项目，它在数据库中搜索，然后根据用户输入的字符串，按相关性对搜索结果进行排序。我认为我目前的搜索是相当不错的，但我编写的用于根据相关性对结果进行排序的比较器给出了有趣的结果。我不知道什么是相关的。我知道这是信息检索的一个大分支，但我不知道从哪里开始寻找按相关性对对象进行排序的搜索示例，并感谢任何反馈。为了给出更多关于我的</e

浏览 1提问于2011-12-27得票数 1

1回答

如何使用python检查两个不同excel文件中的两个列表之间的相似性？

、、

我有两个包含客户姓名的列表。名称可以相似，也可以不同。如何使用python查找这两个列表之间的相似性？列表2：IBM Pvt Ltd Robert Bosch这只是一个样本数据实际数据包含近30万行。我尝试了Jaccard相似度

浏览 5提问于2018-10-29得票数 0

1回答

在Android中查找图像之间的相似性(位图)

、、、、

我几乎没有存储 100x100 位图的，我希望将我应用程序中的其他传入的100x100位图与现有的位图进行比较，以查找图像之间的相似性，并将结果返回给与输入位图匹配的用户。例如，考虑一下我已经拥有的令人兴奋的位图:图像的背景在现实中是透明的。然后，我收到来自用户的以下位图作为输入：

浏览 2提问于2020-06-08得票数 0

1回答

是否可以使用VBA根据匹配条件筛选访问表单？

、、、

我已经创建了一个类似于更高级的“查找”对话框的窗体。用户单击表单中的按钮，这将打开我的搜索表单。此搜索表单过滤原始表单，以仅显示在特定容差内与原始记录中的某些字段匹配的记录。有没有办法对过滤后的表单进行排序，以便首先显示最接近的匹配项？我曾考虑在表单中使用几个辅助字段。这些辅

浏览 12提问于2020-05-20得票数 0

2回答

在选择第一个下拉列表时填充第二个下拉列表

、、、

我尝试从数据库中填充运行时的下拉列表，每当用户从下拉列表中选择城市时，在下一个下拉列表中，它将从数据库中填充相应的值。我如何在JSP中实现这个功能呢？以下是我到目前为止所做的工作： <div class="control"> <select name="city&

浏览 0提问于2012-02-12得票数 0

回答已采纳

1回答

使用Set::extract筛选数据集的一部分

、

我有一个从数据库中查找房屋的查询，以及相关表格中的一些额外数据，如下所示： 'conditions'=>array('Realtor.show_price','Realtor.show_address','HighlightImage.num

浏览 5提问于2011-03-08得票数 2

回答已采纳

1回答

Mahout推荐-添加基于内容的相似性与基于项目的推荐

、、

，这样我就可以非常强烈地推荐那些不仅在通常的协作过滤意义上相似的文章，而且在它们有许多共同术语的意义上也是相似的。文章内容的相似性(TF-以色列国防军向量的余弦相似性)使用Mahout批处理进行预计算，并从DB中读取。然而，会有许多对的文章没有相似的数据。这有两个原因：文章内容相似度数据的更新频率将低于用

浏览 3提问于2013-01-08得票数 4

回答已采纳

1回答

组合框和Lightswitch

、

我使用的是2012RC。谢谢

浏览 0提问于2012-07-20得票数 3

回答已采纳

2回答

如何从文本中创建向量，以便使用二进制分类进行地址匹配？

、、、

我想比较两个地址的相似性(纯粹是文本上的相似性，而不是语义上的相似性)。我有一个带有"Address1“、"Address2”和“takes”标签的数据集，其中“相似”的值为0(不类似)或1(类似)。现在，我将如何将"Address1“和"Address2”中的文本转换为数字向量，从而将其视为二进制分类问题？

浏览 0提问于2016-12-20得票数 4

2回答

Excel近似文本匹配

、、、、

我正在尝试检查A列中有多少个字符串与B列中的字符串大致匹配。

浏览 11提问于2013-02-12得票数 5

3回答

三值特征的距离度量

、

我有一个由100个特性组成的数据集，每个特性都是三元的:如果它存在于一个类别中，则为-1；如果它不存在，则为0；如果它存在于第二个类别中，则为1。例如0 0 0 ... 1 -1 0 ... 0 -1数据非常稀疏，100个特性中的20个对于每一行数据的值为我想通过热图可视化和树状图找

浏览 0提问于2017-02-17得票数 3

1回答

在数组中找到最相似的范围

、、、、

在这里，calcSimilarity是返回两个数组相似性的函数。相似度计算为不像蛮力搜索那样，我想知道什么样的数据结构和算法在范围搜索中是有效的。

浏览 4提问于2017-10-04得票数 1

回答已采纳

2回答

Pandas:通过创建索引来加速过滤？

、

我想把像SQL这样的pandas应用程序用于web应用程序(而不是将数据保存在pSQL中，而只是将其保存在pandas DataFrame中，因为数据不到1 1GB，并且不会经常变化)。如果我基于列上的多个过滤器进行查找(例如，age > x，age < y，income > p，income < q)有什么方法可以加快过滤速度吗？或者它已经在下面完成了。<

浏览 0提问于2013-02-06得票数 3

回答已采纳

2回答

基于项属性查找相似项

、、

mahout中的大多数推荐算法都需要用户项的偏好.但是我想为一个给定的项目找到类似的项目。我的系统没有用户输入。也就是说，对于任何电影，这些都可以是属性，可以用来找出相似系数。体裁将来可以对属性列表进行修改，以建立更高效的系统。但是，要在mahout数据模型中找到项目的相似性，需要每个项目的用户偏好。因为这些电影可以聚集在一起，并在给定项上获得集群中最接近的项。之后，在

浏览 6提问于2015-11-17得票数 3

1回答

非常大的制表符分隔的文本文件的列选择

、、

我正在处理一个非常大的以制表符分隔(大约20000行* 30000列)的.txt形式的表，这使得文件大于20 tab。我检查了桌面的内存，似乎无法直接使用R中的read.delim或python中的pandas来读取该文件。我目前正在考虑基于列的过滤器制作表的一个小子集，新的文本文件将是20000行* 1200列。我已经将目标文件的列名保存在另一

浏览 34提问于2020-10-19得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

协同过滤算法

计算二进制pandas数据帧的相似性度量

数据库/NoSQL-检索以下数据的最低延迟方式

如何在Python/Pandas中仅表示日期的小时部分

如何按相关性对搜索结果进行排序？

如何使用python检查两个不同excel文件中的两个列表之间的相似性？

在Android中查找图像之间的相似性(位图)

是否可以使用VBA根据匹配条件筛选访问表单？

在选择第一个下拉列表时填充第二个下拉列表

使用Set::extract筛选数据集的一部分

Mahout推荐-添加基于内容的相似性与基于项目的推荐

组合框和Lightswitch

如何从文本中创建向量，以便使用二进制分类进行地址匹配？

Excel近似文本匹配

三值特征的距离度量

在数组中找到最相似的范围

Pandas:通过创建索引来加速过滤？

基于项属性查找相似项

非常大的制表符分隔的文本文件的列选择

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐