腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(72)
视频
沙龙
2
回答
在
Python
中将
小于
某个
阈值
的
相对
频率
标
记为
异
常值
python
、
pandas
、
loops
、
numpy
我有一个包含字符变量
的
数据框。我
的
任务是计算每个变量
的
相对
频率
并标记每个值(
在
相应
的
新标记变量中是二进制
的
),其中
相对
频率
小于
某个
阈值
。到目前为止,我尝试了这个方法(它只适用于一个变量,我不确定如何在循环中做到这一点,或者是否有更好、更有效
的
解决方案来解决我
的
问题import numpy
浏览 13
提问于2019-07-19
得票数 1
回答已采纳
1
回答
如何在
python
3.7中准确测量返回值
的
函数
的
cpu时间?
python
、
timer
、
cpu
、
benchmarking
、
timeit
我正在尝试测量一个小函数
的
cpu时间,它通常需要大约1500微秒。我有时会得到不准确或很宽
的
置信区间。我想找到
在
Python
3.7中对函数进行基准测试
的
最准确
的
方法。我想测量函数时间+获取其他计算
的
返回值。 times+=[execution_time]
浏览 0
提问于2019-05-11
得票数 0
4
回答
在
python
中查找第二个数字组或开始字符串搜索
的
Regex语法
python
、
regex-group
我试图
在
Python
中使用Regex查找第二组字符串中
的
数字,格式如下:该格式还可以带有较长
的
数字组或值
小于
1.0
的
组:我希望得到
的
结果是:和当我使用在线测试器查找'(\d+
浏览 0
提问于2017-12-11
得票数 1
回答已采纳
1
回答
当使用bigram_measures (如PMI )时,何时删除停止词?
python
、
nlp
、
nltk
我需要验证一种处理从bigram_measures返回
的
bigram停止词
的
总体方法,比如PMI。为什么要处理这些停止语?嗯,他们是噪音,不增加任何额外
的
价值超过
某个
点。我记得你
的
语料库
的
大小也会影响bigram_measures结果
的
质量。 根据本文()中公认
的
答案,
在
语料库上使用PMI或其他bigram_measures后,似乎可以删除停止词。“想象一下,如果过滤搭配只是简单地删除了它们,那么就有许多概率度量,比如概率比或PMI本
浏览 7
提问于2017-12-07
得票数 4
回答已采纳
1
回答
函数来检测Arduino中浮点值数组中
的
峰值?当图形显示时,显示ECG读数?
arrays
、
arduino
采样
频率
是256 Hz,所以我在这里绘制了10秒
的
图表。这是由ECGSYN off Physionet生成
的
,这是一种单导联ECG波形绘图仪。心电数据
的
Matlab输出:我将其导出为csv,并在Arduino
中将
这些值定义为一个包含2560个元素
的
浮点数组。我已经将我
的
问题改进到了for循环中
的
某个
地方,但还不能准确地确定峰值数字。我
的
目标是找到最大值,其中数组中
的
下一个值
小于<
浏览 1
提问于2020-04-18
得票数 0
4
回答
推荐用于简单
的
一维场景
的
异常检测技术?
machine-learning
、
classification
我希望能够检测出一个实例何时是一个极端异
常值
。由于我
的
数学工作知识有限,我希望找到一种简单
的
技术,如使用标准差。希望数据
的
单维特性将使这成为一个相当常见
的
问题,但如果需要更多
的
情况下,请留下评论,我会提供更多
的
信息。这种期望是基于领域
的
直觉,而不是通过分析,如果这不是一个坏
的
事情假设,请让我知道。
在
聚类方面,除非还有选择k值
的
标准算法,否则我会发现很难将这个值提供给k均值算法。对于异
常值</
浏览 6
提问于2010-02-20
得票数 35
回答已采纳
5
回答
在
一个很大
的
序列中找到相似的子序列。
c++
、
sql
、
database
、
algorithm
成像那个序列是PiPi存储
在
文本文件中。我需要一个有效
的
算法来搜索这些相似性。任何想法都很感激。我找到了一些算法,我需要检查它,我会让你知道结果。 顺便说一下,算法是
浏览 4
提问于2014-07-02
得票数 3
11
回答
无意义文本与有意义文本
的
分离算法
algorithm
、
filter
、
word
、
nlp
、
spam
我为我
的
一些程序提供了反馈功能。不幸
的
是,我忘了包含某种垃圾邮件保护--这样用户就可以将他们想要
的
任何东西发送到我
的
服务器--在这里,每个反馈都存储
在
一个巨大
的
数据库中。一开始,我定期检查这些反馈--我过滤掉了哪些是可用
的
,哪些是删除
的
垃圾。问题是:我每天得到900个反馈。只有4-5才是真正有用
的
,其他消息大多是2种类型
的
胡言乱语: 胡说八道: jfvgasdjkfahs kdlfjhasdf (人们用键盘砸他们
浏览 7
提问于2009-02-01
得票数 9
回答已采纳
2
回答
在
Python
中,如何在不重命名文件
的
情况下对文件进行原子重写?
python
、
file
、
atomic
在
Python
中,我如何安全地覆盖一个文件而不重新命名它呢?关于这一点,有一个问题: 是否有其他方法可以保证文件
的
原子更改(而不重命名)?
浏览 4
提问于2014-01-28
得票数 3
回答已采纳
3
回答
使用opencv删除圆圈
python
、
opencv
、
image-processing
、
omr
我正在研究opencv问题,找出哪些圆圈是填充
的
。然而,有时圆
的
边缘是导致假阳性
的
原因。这让我想知道,我是否可以通过将所有
在
RGB中具有高R值
的
像素转换成白色来移除这些圆圈。我
的
方法是创建一个像素掩码,这些像素是粉红色
的
,然后从原始图像中减去掩码以去除圆圈。从现在起,我得到了黑色
的
面具。我做错了什么。请指点。
浏览 7
提问于2014-04-08
得票数 5
5
回答
生成报表时诊断.NET OutOfMemoryException
.net
、
memory
我
的
任务是改进一段代码,以任何我认为合适
的
方式生成大量报告。生成了大约10个相同
的
报告(针对数据库
的
每个“部分”),它们
的
代码类似于以下内容: GeneratePurchaseReport(Country.France, ProductType.Chair);内存
的
大部分保存在一个庞大
的
List<T>中,它被填充
在
GeneratePurchaseReport中,一旦退出就不再使用了--这就是为什么一个完整
的
GC集合将回收内
浏览 8
提问于2011-05-19
得票数 7
6
回答
RMSE (均方根偏差)计算
r
、
statistics
、
equation
我对目标变量Wavelength进行了从V1到V12
的
数字特征观测。我想计算Vx列之间
的
均方根误差。数据格式如下。 这是我找到
的
一个链接,但我不确定如何才能获得y_pred: 对于下面提供
的
链接,我认为我没有预测值:
浏览 1
提问于2014-10-07
得票数 11
4
回答
识别(编程)语言
的
关键词
c++
、
perl
、
text-processing
、
language-recognition
问题是,我经常得到“未知”作为结果(许多语言积累了一个小分数,但没有比我
的
阈值
更大
的
)。经过一些调试、研究等,我发现这可能是由于这样
的
事实,所有的词都被认为是平等
的
。这意味着,例如,看到"#include“与看到"while”具有相同
的
效果--这两者都表明它可能是c/c++ (我现在忽略了"while“
在
许多其他语言中使用
的
事实),但当然,
在
较大
的
.cpp文件中,可能会有大量<
浏览 3
提问于2010-09-07
得票数 4
回答已采纳
3
回答
使用乙状结肠功能有什么好处?
python
、
math
、
machine-learning
、
sigmoid
我把脚趾伸进神经网络,从一些基本
的
感知器开始。
在
一段视频中,这个家伙正在解释如何制造一台机器来“学习”如何区分两个数组。他解释了训练过程,但只是把他所有的输入和重量都塞进乙状结肠功能。我对sigmoid函数做了一些研究,并想知道它为什么被用于机器学习,以及为什么程序员使用它来测试他们
的
输入。
浏览 1
提问于2019-05-27
得票数 4
回答已采纳
4
回答
Java (Collections.sort)使用哪种类型?
java
、
collections
、
sorting
、
time-complexity
、
mergesort
1,0000000099000427,00000000990003451,0000000099000346,0000000099000345 我按照序列号对4个节点
的
节点列表进行排序感谢大家
的
回答。谢谢你,汤姆,纠正了我
的
数学。
浏览 1
提问于2009-04-15
得票数 12
回答已采纳
2
回答
在
opencv
python
中加速每像素循环
python
、
arrays
、
opencv
因此,我试图找到非白色
的
像素,并通过检查颜色
在
图像周围创建一个边界框。我想要得到最上面,最下面,最左边和最右边
的
非白色像素,并用它们来创建一个边界框。我使用了四个循环遍历每个sides.also,我想要做
的
是删除背景颜色(背景颜色主要是灰色),并将其更改为纯白色。我已经实现了所有的功能,但是现在因为我使用了很多循环,代码运行太慢了。我需要优化循环,同时仍然具有找到最上面,最下面,最左边和最右边
的
非白色像素和删除颜色
的
功能。我该怎么做呢? 下面的代码显示了我正在做什么,以获得边界框以及背景
浏览 2
提问于2019-06-21
得票数 2
3
回答
如何检测图像是否为像素
java
、
algorithm
、
image-processing
、
opencv
前面有一个这样
的
问题:和不确定这种方法有多有效,但是如果我能得到图像中每个像素
的
RGB,然后将其与其邻居进行比较,看看它们是否相似,那么我就可以检测到图像是像素化
的
吗?我可以得到像素
的
RGB,但不知道如何将它们与邻居进行比较。 有算法来做这样
的
事情已经可用吗?我还能采取什么其他方法吗?我不受任何特定
浏览 3
提问于2013-01-19
得票数 9
5
回答
如何在不重启速度
的
情况下编辑velocimacro?
java
、
velocity
我
的
速度宏被缓存了,我不想让它们...至少
在
开发过程中不会。我已经
在
我
的
属性文件中设置了以下属性...file.resource.loader.cache=false编辑: 我不认为这条线..。velocity.engine.resource.manager.cache.enabled=false
浏览 0
提问于2011-04-06
得票数 6
回答已采纳
1
回答
如何通过reduce for循环使我
的
算法更快?
python
、
algorithm
、
performance
、
api
我目前正在从事一个从masslottery.com应用程序接口收集数据
的
项目。我正在以各种方式分析这些数据。我想要分析这些数据
的
一种方法是通过检查过去一年中最多
的
5个点基诺数字。我写
的
程序理论上可以做到这一点。然而,它有点太慢了。现在检查一个3点
的
数字大约需要1分20秒。正如你所知道
的
,我必须计算
的
可能性,随着数字
的
增加而不断增加。possibilities80 choose
浏览 2
提问于2021-07-14
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券