首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【竞赛】一种提升多分类准确性的Trick

随机森林是一种高效并且可扩展性较好的算法, K最近邻算法则是一种简单并且可解释较强的非参数化算法。在本篇文章中,我们针对多分类问题提出了一种将随机森林和KNN算法相结合框架,我们先用训练数据对随机森林模型进行训练然后用训练好的随机森林模型对我们的训练集和测试集进行预测分别得到训练集和测试集的概率矩阵,然后将测试集中的可疑样本取出并在概率空间中进行KNN训练测试,我们的框架很大地提升了测试集中可疑样本的预测准确率;此外我们从预测的概率空间对训练数据进行噪音的过滤与删除,从而进一步提升了我们模型的预测准确率。在大量实验数据的测试中,我们的方法都取得了非常显著的效果。

03

[自动调参]深度学习模型的超参数自动化调优详解

在实践中,经验丰富的机器学习工程师和研究人员会培养出直觉,能够判断上述选择哪些 可行、哪些不可行。也就是说,他们学会了调节超参数的技巧。但是调节超参数并没有正式成 文的规则。如果你想要在某项任务上达到最佳性能,那么就不能满足于一个容易犯错的人随意 做出的选择。即使你拥有很好的直觉,最初的选择也几乎不可能是最优的。你可以手动调节你 的选择、重新训练模型,如此不停重复来改进你的选择,这也是机器学习工程师和研究人员大 部分时间都在做的事情。但是,整天调节超参数不应该是人类的工作,最好留给机器去做。

01

网络入侵检测的机器学习算法评估与比较

本文介绍了网络入侵检测系统中的数据获取与处理模块、检测算法模块、检测结果处理模块、性能评价模块和系统应用模块。数据获取与处理模块主要对网络流量数据进行捕获、过滤、分析和存储,为后续检测算法模块提供有效的数据来源。检测算法模块主要采用基于行为的检测方法,包括基于签名、基于统计和基于行为模型的方法。检测结果处理模块主要对检测到的入侵行为进行相应的处理,包括报警、隔离、恢复等措施。性能评价模块主要对网络入侵检测系统的性能进行评价,包括检测率、误报率、响应时间等指标。系统应用模块主要介绍了网络入侵检测系统在金融、电信、政府等领域的实际应用情况。

08
领券