腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
pandas
数据
框
中
查找
房屋
之间
的
相似性
以
进行
内容
过滤
、
、
、
我想对
房屋
应用
内容
过滤
。我想找到每个房子
的
相似性
分数来推荐。我能推荐一号房
的
什么吗?所以我需要
房屋
的
相似度矩阵。我怎么才能找到它?+1'] ,['house7',110,1475,'gas','3+1'] Create th
浏览 5
提问于2019-07-25
得票数 1
回答已采纳
2
回答
协同
过滤
算法
、
如果我有以下用户,他们观看
的
电影
的
评级如下:User2 Movie2-5 Movie2-3 Movie3-4如何使用协作
过滤
向user1推荐user1,以及如何计算user1给movie3 4或更高
的
概率?
浏览 7
提问于2016-11-02
得票数 1
1
回答
计算二进制
pandas
数据
帧
的
相似性
度量
、
、
、
、
我需要在python
中
编码一个
相似性
分数,以便根据电影类型找到匹配
的
内容
。 该比较是为了让1个用户找到他们
的
二进制类型评分与40,000个电影标题
的
二进制类型评分
数据
帧
之间
的
相似性
。我需要遍历
数据
帧,并将每个项目与用户得分
进行
比较,
以
找到相似度。
以
用户1为例: 0,1,0,0,0,0,1,0,0,0,1,1,0,0,0,1 比较与电影
数据
浏览 39
提问于2020-10-23
得票数 0
3
回答
数据
库/NoSQL-检索以下
数据
的
最低延迟方式
、
、
、
、
- city - zip- sqft- bathrooms- geo_longitudeSELECT * from houses AND longitude IS BETWEENwww AND zzz 问题:,对于我来说,存储这些信息
的
最快方法是什么,这
浏览 1
提问于2010-05-09
得票数 5
2
回答
如何在Python/
Pandas
中
仅表示日期
的
小时部分
、
、
我有一个表示日程表
的
CSV文件,例如这意味着从a到b
的
航班1每天10:00出发,12:00到达。我需要将这些
数据
加载到
Pandas
数据
框
中
,并方便地对其
进行
处理,例如
查找
给定时间
之间
的
行程或按出发时间排序。
在
Pandas
中
只表示日期
的
小时和分钟部分
的
推荐方式是什么
浏览 1
提问于2015-01-26
得票数 1
1
回答
如何按相关性对搜索结果
进行
排序?
、
、
我正在做一个项目,它在
数据
库
中
搜索,然后根据用户输入
的
字符串,按相关性对搜索结果
进行
排序。我认为我目前
的
搜索是相当不错
的
,但我编写
的
用于根据相关性对结果
进行
排序
的
比较器给出了有趣
的
结果。我不知道什么是相关
的
。我知道这是信息检索
的
一个大分支,但我不知道从哪里开始寻找按相关性对对象
进行
排序
的
搜索示例,并感谢任何反馈。为了给出更多关于我
的</e
浏览 1
提问于2011-12-27
得票数 1
1
回答
如何使用python检查两个不同excel文件
中
的
两个列表
之间
的
相似性
?
、
、
我有两个包含客户姓名
的
列表。名称可以相似,也可以不同。如何使用python
查找
这两个列表
之间
的
相似性
?列表2:IBM Pvt Ltd Robert Bosch这只是一个样本
数据
实际
数据
包含近30万行。 我尝试了Jaccard相似度
浏览 5
提问于2018-10-29
得票数 0
1
回答
在
Android
中
查找
图像
之间
的
相似性
(位图)
、
、
、
、
我几乎没有存储 100x100 位图
的
,我希望将我应用程序
中
的
其他传入
的
100x100位图与现有的位图
进行
比较,
以
查找
图像
之间
的
相似性
,并将结果返回给与输入位图匹配
的
用户。例如,考虑一下我已经拥有的令人兴奋
的
位图:图像
的
背景
在
现实
中
是透明
的
。 然后,我收到来自用户
的
以下位图作为输入:
浏览 2
提问于2020-06-08
得票数 0
1
回答
是否可以使用VBA根据匹配条件筛选访问表单?
、
、
、
我已经创建了一个类似于更高级
的
“
查找
”对话
框
的
窗体。用户单击表单
中
的
按钮,这将打开我
的
搜索表单。此搜索表单
过滤
原始表单,
以
仅显示
在
特定容差内与原始记录
中
的
某些字段匹配
的
记录。有没有办法对
过滤
后
的
表单
进行
排序,以便首先显示最接近
的
匹配项?我曾考虑
在
表单中使用几个辅助字段。这些辅
浏览 12
提问于2020-05-20
得票数 0
2
回答
在
选择第一个下拉列表时填充第二个下拉列表
、
、
、
我尝试从
数据
库
中
填充运行时
的
下拉列表,每当用户从下拉列表中选择城市时,在下一个下拉列表
中
,它将从
数据
库
中
填充相应
的
值。我如何在JSP
中
实现这个功能呢?以下是我到目前为止所做
的
工作: <div class="control"> <select name="city&
浏览 0
提问于2012-02-12
得票数 0
回答已采纳
1
回答
使用Set::extract筛选
数据
集
的
一部分
、
我有一个从
数据
库
中
查找
房屋
的
查询,以及相关表格
中
的
一些额外
数据
,如下所示: 'conditions'=>array('Realtor.show_price','Realtor.show_address','HighlightImage.num
浏览 5
提问于2011-03-08
得票数 2
回答已采纳
1
回答
Mahout推荐-添加基于
内容
的
相似性
与基于项目的推荐
、
、
,这样我就可以非常强烈地推荐那些不仅在通常
的
协作
过滤
意义上相似的文章,而且
在
它们有许多共同术语
的
意义上也是相似的。文章
内容
的
相似性
(TF-以色列国防军向量
的
余弦
相似性
)使用Mahout批处理
进行
预计算,并从DB
中
读取。然而,会有许多对
的
文章没有相似的
数据
。这有两个原因: 文章
内容
相似度
数据
的
更新频率将低于用
浏览 3
提问于2013-01-08
得票数 4
回答已采纳
1
回答
组合
框
和Lightswitch
、
我使用
的
是2012RC。谢谢
浏览 0
提问于2012-07-20
得票数 3
回答已采纳
2
回答
如何从文本
中
创建向量,以便使用二进制分类
进行
地址匹配?
、
、
、
我想比较两个地址
的
相似性
(纯粹是文本上
的
相似性
,而不是语义上
的
相似性
)。我有一个带有"Address1“、"Address2”和“takes”标签
的
数据
集,其中“相似”
的
值为0(不类似)或1(类似)。现在,我将如何将"Address1“和"Address2”
中
的
文本转换为数字向量,从而将其视为二进制分类问题?
浏览 0
提问于2016-12-20
得票数 4
2
回答
Excel近似文本匹配
、
、
、
、
我正在尝试检查A列中有多少个字符串与B列
中
的
字符串大致匹配。
浏览 11
提问于2013-02-12
得票数 5
3
回答
三值特征
的
距离度量
、
我有一个由100个特性组成
的
数据
集,每个特性都是三元
的
:如果它存在于一个类别
中
,则为-1;如果它不存在,则为0;如果它存在于第二个类别
中
,则为1。例如0 0 0 ... 1 -1 0 ... 0 -1
数据
非常稀疏,100个特性
中
的
20个对于每一行
数据
的
值为我想通过热图可视化和树状图找
浏览 0
提问于2017-02-17
得票数 3
1
回答
在数组中找到最相似的范围
、
、
、
、
在这里,calcSimilarity是返回两个数组
相似性
的
函数。相似度计算为 不像蛮力搜索那样,我想知道什么样
的
数据
结构和算法
在
范围搜索
中
是有效
的
。
浏览 4
提问于2017-10-04
得票数 1
回答已采纳
2
回答
Pandas
:通过创建索引来加速
过滤
?
、
我想把像SQL这样
的
pandas
应用程序用于web应用程序(而不是将
数据
保存在pSQL
中
,而只是将其保存在
pandas
DataFrame
中
,因为
数据
不到1 1GB,并且不会经常变化)。如果我基于列上
的
多个
过滤
器
进行
查找
(例如,age > x,age < y,income > p,income < q)有什么方法可以加快
过滤
速度吗?或者它已经在下面完成了。<
浏览 0
提问于2013-02-06
得票数 3
回答已采纳
2
回答
基于项属性
查找
相似项
、
、
mahout
中
的
大多数推荐算法都需要用户项
的
偏好.但是我想为一个给定
的
项目找到类似的项目。我
的
系统没有用户输入。也就是说,对于任何电影,这些都可以是属性,可以用来找出相似系数。体裁 将来可以对属性列表
进行
修改,
以
建立更高效
的
系统。但是,要在mahout
数据
模型中找到项目的
相似性
,需要每个项目的用户偏好。因为这些电影可以聚集在一起,并在给定项上获得集群中最接近
的
项。之后,
在
浏览 6
提问于2015-11-17
得票数 3
1
回答
非常大
的
制表符分隔
的
文本文件
的
列选择
、
、
我正在处理一个非常大
的
以
制表符分隔(大约20000行* 30000列)
的
.txt形式
的
表,这使得文件大于20 tab。我检查了桌面的内存,似乎无法直接使用R
中
的
read.delim或python
中
的
pandas
来读取该文件。我目前正在考虑基于列
的
过滤
器制作表
的
一个小子集,新
的
文本文件将是20000行* 1200列。我已经将目标文件
的
列名保存在另一
浏览 34
提问于2020-10-19
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
肝了3天,整理了90个Pandas案例
Pandas请你吃英超联赛积分榜上没有的瓜!
手把手教学,利用Python构建一个简单的推荐系统
疾病表型与遗传变异关联分析软件结果解析——Exomiser 结果解析
Scikit-Learn大变化:合并Pandas
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券