首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于一类支持向量机的雪崩预测研究

基于一类支持向量机的雪崩预测研究
EN

Data Science用户
提问于 2019-04-26 09:20:36
回答 3查看 505关注 0票数 3

我在用机器学习做雪崩预测的论文。

对于我的输入功能,我使用雪崩事故的特点,如斜坡,高度,面向斜坡的方向,结合根据天气数据从雪崩发生的当天。

我想预测雪崩,当某些变量组合在一起,造成致命的雪崩情况。因此,雪崩发生了。0:雪崩不会发生。

我数据库中唯一的数据是雪崩,我得到了大约200个样本。所以我没有任何关于非致命雪崩情况的数据,大多数情况就是这样。

我的问题是,一个类别的支持向量机( SVM )是否是一种很好的分类方法?

EN

回答 3

Data Science用户

发布于 2019-04-26 11:44:51

您的问题似乎属于OCC问题的一般领域的新颖性检测。

因此,简单的回答是:是的。您可以应用SVDD ()方法获取数据集中包含样本的最小超球面,然后评估新的观测值是否为孤立点。

当然,数据集的代表性越低,分类器的准确性就越低。

票数 4
EN

Data Science用户

发布于 2019-04-26 11:07:22

你能找出获得非雪崩数据的可能方法吗?

1)阿瓦兰奇发生在一条山链上。你能在你的数据中添加邻近峰值的数据吗?从同一天发生雪崩?

2)从数据挖掘中可以获得很好的洞察力。例如,什么是山的最小坡度才能产生雪崩?温度范围?

3)你能否寻找其他数据集(有非雪崩条目),你可以结合你的数据?

票数 2
EN

Data Science用户

发布于 2019-04-26 16:16:16

您可以使用数据挖掘的方法来预测雪崩,然而,有一些坑瀑布,我可以提供给您基于我的基本雪崩知识的登山。

  1. 你想预测什么?雪崩(主要是村庄和公路)或人为引发的雪崩(主要影响滑雪者)。这些因素是完全不同的。
  2. 已经提到了获取数据的问题。有一些与雪崩事件有关的数据集,例如在瑞士阿夫兰切研究所:然而,关于没有触发雪崩和触发雪崩但没有人受伤,因此没有报告的情况,https://www.slf.ch/de/lawinen/unfaelle-und-schadenlawinen/alle-gemeldeten-lawinenunfaelle-aktuell.html自然很少有数据。有人试图根据互联网上的旅游报道来估算旅游人数。
  3. 获得精确的数据更成问题。考虑一下这周报告中的图2:https://www.slf.ch/de/lawinenbulletin-und-schneesituation/wochen-und-winterberichte/201819/wob-18-25-april.html,它在45分钟的时间差下比较了相同的斜率,看起来完全不同。
  4. 特征选择是另一个大问题。您提到要使用事故当天的天气数据。我认为这是错误的结论,因为大多数滑雪雪崩发生在周末,可能是在稍微好一些的天气。而且,大多数人都是明智的,在危险的日子里不去滑雪旅行,进行高风险的旅游。这有很大的可能扭曲您的数据和模型。
票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/50968

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档