首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度学习股市的应用概述

BERT股市中的用途不仅限于预测价格或走势,还可以用于检测预定义的交易事件等。此外,还有一些研究使用了BERT来进行投资者评论的评估分类,以及股票预测。...准确率是最基本的评估指标,用于评估分类器的整体准确性。准确率指的是分类器正确分类的样本数与总样本数的比值。公式如下: TP(True Positive)表示实际类别和模型预测都是类的情况。...精确率是指分类器预测为样本的样本中真正为样本的比例,反映了分类器对于样本的识别能力。公式如下: 召回率(Recall)。...召回率是指真正为样本的样本中被分类器预测为样本的比例,反映了分类器对于所有实际样本的覆盖程度。公式如下: F1分数(F1 Score)。...机器学习模型的泛化能力是指在未见过的数据上进行准确分类或预测的能力。股市预测中,深度学习模型需要具备高度不变性和强大的泛化能力。传统方法难以泛化到真实交易场景或在某些未见过的数据子集上表现不佳。

69030

NeuXus开源工具:用于实时去除EEG-fMRI中的伪迹

2.2.2.1 R峰值检测当窗口完成,通过检测相应心电信号上的R峰来发现心电周期。检测算法基于Laitala,并适应实时执行LSTM网络由两个双向LSTM层和一个密集层组成。...最后,利用滤波后的R峰标签,将检测窗口的EEG信号分割为心动周期段,选择之前持有的窗口段进行相减(图1:蓝色括号,直到边缘)。...2.3.1 用于训练LSTM网络进行R峰值检测的数据NeuXus LSTM网络使用从6名女性志愿者收集的心电图数据进行训练,每个受试者执行一系列认知任务同时进行EEG-fMRI扫描,共32分钟。...表2用于评估GA和PA算法的数据集图3运动意象范式的示意图与相应的NeuRow显示2.4 评估2.4.1 R峰检测NeuXus的LTSM R峰值检测算法EO/ EC数据集上进行评估,使用F1分数与地面真实值进行比较...结果3.1 R峰检测R峰检测结果如图5所示。NeuXus的LSTM网络分类F1评分高于PanTompkins。3.2 伪迹去除RS数据集中GA约简的评估结果如图6所示。

25540
您找到你想要的搜索结果了吗?
是的
没有找到

深度 | CMU 邢波教授团队最新成果:利用 AI 自动生成医学影像报告

对于没有经验的医生来说,撰写报告很可能会出错,对于人口众多的国家的医生来说,这样的工作又耗时又枯燥。...这些关键词使用医学文本索引器(MTI)进行标识。 对于经验较少的放射科医师和病理科医师,特别是那些医疗保健条件落后的医生,写医学影像报告是一件困难的事情。...给定一个医学图像,首先运用局部图像分析法进行局部分析,然后提取每个局部图像的视觉特征,最后建立一个分类器,将视觉特征按照预定义的类别分类。...为了更好地理解模型检测疾病或潜在疾病的能力,我们表2中,给出了三大模型态性和异常性的概率。我们认为句子包含“否”、“正常”、“清除”、“稳定”作为句子描述正常。...很显然,Ours-CoAttention模型态性和异常性的概率上最接近真实情况。 ? 表3中的结果表明,Ours-CoAttention和VGG-19 网络对于标签预测的执行非常相似。

1.8K61

七夕礼物没送对?飞桨PaddlePaddle帮你读懂女朋友的小心思

基于已有的预训练模型和数据,可以运行下面的命令进行测试,查看预训练的模型测试集(test.tsv)上的评测结果。...LSTM模型,采用双向LSTM结构,更好地捕获句子中的语义特征; ERNIE:百度自研基于海量数据和先验知识训练的通用文本语义表示模型,并基于此在对话情绪分类数据集上进行fine-tune获得。...(3)数据格式说明 训练、预测、评估使用的数据示例如下,数据由两列组成,以制表符(’\t’)分隔,第一列是情绪分类的类别(0表示消极;1表示中性;2表示积极),第二列是以空格分词的中文文本,文件为utf8... 从来不 骂人 , 骂 的 都 不是 人 , 你 是 人 吗 ?...1 有事 等会儿 就 回来和 你 聊 2 见到 你 很高兴 谢谢你 帮 注:本项目额外提供了分词预处理脚本(preprocess目录下),可供用户使用,具体使用方法如下: python

40730

使用经典ML方法和LSTM方法检测灾难tweet

本文中,将对分类任务应用两种不同的方法。将首先应用一个经典的机器学习分类算法-梯度增强分类器。 代码的后面,将使用LSTM技术来训练RNN模型。...通常,对于有一些倾斜标签的数据,建议使用F1分数而不是准确率来进行模型评估,我们将在本文末尾讨论这个问题。 接下来,想知道我们的数据集中每一列缺失的数据点是怎样的。...混淆矩阵是一个表,它显示了分类模型相对于两个类的性能。从图中可以看出,我们的模型检测目标值“0”检测目标值“1”时有更好的性能。...然后使用卷积模型来减少特征的数量,然后是一个双向LSTM层。最后一层是Dense层。因为它是一个二分类,所以我们使用sigmoid作为激活函数。...该模型检测“0”方面比检测“1”做得更好。 ? ---- 结论 如你所见,两种方法的输出非常接近。梯度增强分类器的训练速度比LSTM模型快得多。

94840

七夕礼物没送对?飞桨PaddlePaddle帮你读懂女朋友的小心思

基于已有的预训练模型和数据,可以运行下面的命令进行测试,查看预训练的模型测试集(test.tsv)上的评测结果。...LSTM模型,采用双向LSTM结构,更好地捕获句子中的语义特征; ERNIE:百度自研基于海量数据和先验知识训练的通用文本语义表示模型,并基于此在对话情绪分类数据集上进行fine-tune获得。...(3)数据格式说明 训练、预测、评估使用的数据示例如下,数据由两列组成,以制表符(’\t’)分隔,第一列是情绪分类的类别(0表示消极;1表示中性;2表示积极),第二列是以空格分词的中文文本,文件为utf8... 从来不 骂人 , 骂 的 都 不是 人 , 你 是 人 吗 ?...1 有事 等会儿 就 回来和 你 聊 2 见到 你 很高兴 谢谢你 帮 注:本项目额外提供了分词预处理脚本(preprocess目录下),可供用户使用,具体使用方法如下: python

41630

精度是远远不够的:如何最好地评估一个分类器?

我们建立模型的目的是对全新的未见过的数据进行处理,因此,要建立一个鲁棒的模型,就需要对模型进行全面而又深入的评估。当涉及到分类模型评估过程变得有些棘手。...假设我们正在创建一个模型来对不平衡的数据集执行分类。93%的数据属于A类,而7%属于B类。 ? 我们有一个只把样本预测为A类的模型,其实我们很难称之为“模型”,因为它只能预测A类,没有任何计算推理。...相比分类精度,混淆矩阵的使用意味着我们评估模型的道路上迈出了更深的一步路。混淆矩阵显示了对每一类的预测分别是正确还是错误。对于二分类任务,混淆矩阵是2x2矩阵。...对于垃圾邮件的检测等任务,我们尝试最大限度地提高查准率,因为我们希望电子邮件被检测为垃圾邮件最好检测地很准确,因为我们不想让有用的电子邮件被错误地标记成垃圾邮件。...总结 “没有免费的午餐”定理分类模型评估上也是适用的,并非所有任务都有一个最佳且容易找到的选择。我们需要明确我们的需求,并根据这些需求选择合适的评价指标。

1.3K30

万字综述,94篇论文分析股市预测的深度学习技术

在对大规模数据进行预训练使用LSTM单元以获得优化参数,然后使用少量目标数据对基本模型进行微调以获得最终模型。他们解决了由于样本量不足而导致的过拟合问题,并考虑了股票之间的关系。...当根据模型输入要素进行分类,数据集大致由两组数据组成,即内部数据和外部数据。内在数据主要是从股票数据本身挖掘出来的信息,包括历史股价、财务指数和其他技术分析数据。...准确度可表示为下面公式: TP表示实际类别和模型预测都是的。TN表示实际类别和模型预测都是负的。FP表示模型预测为阳性类别,而实际类别为阴性。FN表示当模型预测为阴性类别为阳性类别。...MCC等于1表示完全正相关。相反,当分类器错误分类,获得值-1,表示完全负相关。MCC对类别不平衡的鲁棒性优于前面提到的基于准确性的度量。...为此,一种有前途且必要的异常检测将是设计基于时间序列异常检测任务的更好的机制,以便在真实世界中进行交易捕获预测任务的最佳交易点。

2.5K21

R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告

第二种情况下,保留所有1-12,其余13-24被测试是否保留。 神经网络在建模趋势方面并不出色。因此,在对趋势进行建模之前将其消除是很有用的。这由参数处理 difforder。...如果我们强制执行,它只会保留它。为此,将尝试tsutils 包。...深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据 用PyTorch机器学习神经网络分类预测银行客户流失模型 PYTHON用LSTM长短期记忆神经网络的参数优化方法预测时间序列洗发水销售数据...Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化 R语言深度学习卷积神经网络 (CNN)对 CIFAR 图像进行分类:训练与结果评估可视化 深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据...的LSTM递归神经网络进行时间序列预测 python用于NLP的seq2seq模型实例:用Keras实现神经网络机器翻译 用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类

34710

不平衡数据上使用AUPRC替代ROC-AUC

本文将详细比较这两种测量方法,并说明AUPRC数据不平衡的情况下衡量性能的优势。 预备知识——计算曲线 假设您熟悉准确率和召回率以及混淆矩阵的元素(TP、FN、FP、TN)这些基本知识。...假设我们有一个二元分类器来预测概率。给定一个新的例子,它输出类的概率。我们取一个包含 3 个例和 2 个负例的测试集,计算分类器的预测概率——在下图中按降序对它们进行排序。...每个阈值代表一个二元分类器,其预测对其上方的点为,对其下方的点为负——评估度量是针对该分类器计算的。 图 1:在给定概率和基本事实的情况下,计算 ROC 曲线和 PRC。...对于欺诈检测、疾病识别和YouTube视频推荐等任务。它们有着类似的数据不平衡的本质,因为样本很少。如果我们模型的用户能更快地找到他们需要结果就能节省很多时间。也就是说,样本的分数是关键。...AUPRC 处理数据不平衡可以为我们提供更多信息。 总体而言,ROC 评估通用分类很有用,而 AUPRC 在对罕见事件进行分类是更好的方法。

1K10

ACL2020 | 对抗式query-doc相关性模型,让线上搜索结果大幅提升!

其中是一个调整样本权重的超参数,本文中会更看重样本(不匹配的),因此有。...,哪怕是只有分类器,加上生成器进行协助训练后,效果得到了进一步的提升。...不仅离线评估效果喜人,QUARTS在线上也获得了很好的表现,经过两个国家的A/B测试后,相比当前的基线分别提升了12.2%和5.75%。...进行语义相似度,attention对query进行处理,可以加入title的所有信息辅助生成。 (核心)变分编码产生样本对原模型进行微调。...那么下面给一些可以尽可能提升的思路吧(快记着,下一篇顶会就是你的了) 另外,还想提的一个点是,bert被干趴下的同时,这个模型除了LSTM之外本身没有复杂度很高的操作,耗时预计就在10ms左右。

1.8K20

CVPR 2022丨无监督预训练下的视频场景分割

一般而言,大多数SSL方法图像分类、视频分类、目标检测等任务上进行性能评估,并且其预训练范式并不适合视频场景分割(Video Scene Segmentation,VSS)任务,本工作主要讨论和探究各...SSL对比学习范式和特征质量评估方案VSS任务下的效果。...(SCRL),使得相似场景的镜头表征特征空间中分布得更为紧凑,如图1(c)所示; 同时采用归纳偏置更低的时序建模方法对特征质量进行评估,并对视频场景分割任务进行建模。...样本选择范式 本文分析和讨论了四种自监督训练范式,如图5所示,包含了图片分类、视频分类和视频的时序分割的预训练范式。...而本框架提出使用基于Bi-LSTM序列建模方式,对每个镜头都进行场景边界进行分类,即经过Bi-LSTM模型序列建模后,序列输出为B * Shot-Len * 2,这样做的好处有: 可以有效降低模型复杂度和参数量

54720

VarifocalNet (VF-Net)一种新型的目标检测网络

几周前,当我在做一个物体检测Kaggle竞赛偶然发现了VarifocalNet。...非常惊讶地看到它与许多SOTA对象检测模型(如YoloV5和EfficientDet)相匹配,某些情况下甚至优于它们。自己查阅了这篇论文,非常喜欢。...本文重点研究了目标检测的核心问题——精确选取产生的边界框,优化其精度,并对其进行过滤。一个小区域内有多个物体的密集物体检测任务中,对象检测模型通常表现不佳。...典型的目标检测网络评估每幅图像的候选框位置数量非常高,但其中只有一小部分实际包含有效的目标,这模拟了类不平衡问题。...觉得这里没有必要复制和粘贴巨大的结果表,并且对网络的工作方式更加感兴趣。希望您现在对整个网络的工作原理有一个更一般的了解。综上所述,VFNet建立3个主要组件上。

83940

腾讯优图CVPR 2022丨无监督预训练下的视频场景分割

一般而言,大多数SSL方法图像分类、视频分类、目标检测等任务上进行性能评估,并且其预训练范式并不适合视频场景分割(Video Scene Segmentation,VSS)任务,本工作主要讨论和探究各...SSL对比学习范式和特征质量评估方案VSS任务下的效果。...(SCRL),使得相似场景的镜头表征特征空间中分布得更为紧凑,如图1(c)所示; 同时采用归纳偏置更低的时序建模方法对特征质量进行评估,并对视频场景分割任务进行建模。...样本选择范式 本文分析和讨论了四种自监督训练范式,如图5所示,包含了图片分类、视频分类和视频的时序分割的预训练范式。...而本框架提出使用基于Bi-LSTM序列建模方式,对每个镜头都进行场景边界进行分类,即经过Bi-LSTM模型序列建模后,序列输出为B * Shot-Len * 2,这样做的好处有: 01 可以有效降低模型复杂度和参数量

1.3K20

不平衡数据上使用AUPRC替代ROC-AUC

本文将详细比较这两种测量方法,并说明AUPRC数据不平衡的情况下衡量性能的优势 预备知识——计算曲线 假设您熟悉准确率和召回率以及混淆矩阵的元素(TP、FN、FP、TN)这些基本知识。...假设我们有一个二元分类器来预测概率。给定一个新的例子,它输出类的概率。我们取一个包含 3 个例和 2 个负例的测试集,计算分类器的预测概率——在下图中按降序对它们进行排序。...每个阈值代表一个二元分类器,其预测对其上方的点为,对其下方的点为负——评估度量是针对该分类器计算的。 图 1:在给定概率和基本事实的情况下,计算 ROC 曲线和 PRC。...对于欺诈检测、疾病识别和YouTube视频推荐等任务。它们有着类似的数据不平衡的本质,因为样本很少。如果我们模型的用户能更快地找到他们需要结果就能节省很多时间。也就是说,样本的分数是关键。...AUPRC 处理数据不平衡可以为我们提供更多信息。 总体而言,ROC 评估通用分类很有用,而 AUPRC 在对罕见事件进行分类是更好的方法。

92520

深度学习的五种分类

然而,想借此机会提出自己的分类,这会更加针对深度学习领域。希望分类更具体和有用。这个分类让我们知道我们目前在哪里,我们可能会在哪里。 目前我们没有好的AI概念框架,以准确评估当前的情况。...LSTM是代表,其中存储器单元被嵌入LSTM节点内。这些的其他变体是来自DeepMind的神经图灵机(NMT)和可微分神经计算机(DNC)。这些系统计算其行为时保持状态。 3....Classification with Imperfect Knowledge (CIK) 在这个层面上,我们有一个建立CK之上的系统,但是能够以不完全信息进行推理。...我们实际上在对抗网络中有了这个原始版本,学习执行泛化与竞争的鉴别器和生成网络将这个概念进一步扩展到游戏理论驱动的网络,能够执行战略和战术解决多个目标。...CIK级别系统能够进行战略游戏。

3.1K10

2022年深度学习时间序列预测和分类中的研究进展综述

主要根据均方误差 (MSE) 和平均绝对误差 (MAE) 指标进行评估: 这篇论文很好,但是它只对比了Transformer相关的论文,其实应该与更简单的方法进行比较,比如简单的线性回归、LSTM/GRU...之前已经许多任务中表现出了最先进的水平,认为没有必要与其他‘家族’方法进行比较。”...因为预测比分类甚至异常检测更具挑战性,因为你试图预测未来多个时间步骤的巨大可能值范围。这么多的研究都集中预测上,而忽略了分类或异常检测,对于Transformer我们是不是应该从简单的开始呢?...对使用表示进行预测和异常检测进行评估,该模型优于许多模型,例如 Informer 和 Log Transformer。...,以及异常检测分类方面的额外突破。

1.7K40

入门 | 机器学习模型的衡量不止准确率:还有精度和召回率

恐怖分子检测是一个不平衡的分类问题:我们需要鉴别的类别有两个——恐怖分子和非恐怖分子,其中一个类别代表了极大多数的数据点。另一个不平衡分类问题出现在当疾病公众中的发病率很低的疾病监测。...直观地说,我们知道恐怖分子检测的问题中宣布所有的数据点为负例(非恐怖分子)是毫无裨益的,相反,我们应该聚焦于例(恐怖分子)的识别。...恐怖分子检测的例子中,TP 是被正确识别的恐怖分子,FN 是模型误分类为非恐怖分子的恐怖分子的数据点。召回率可以被理解为模型找到数据集中所有感兴趣的数据点的能力。 ?...例如,之前的例子中,在对患者进行随访检查的初步疾病筛查中,我们可能希望得到接近于 1 的召回率—我们想找到所有实际患病的患者。如果随访检查的代价不是很高,我们可以接受较低的精度。...可视化精度和召回率 已经向你抛出了几个新术语,接下来将通过一个例子向你展示它们实际中是如何使用的。使用之前,我们要简单地谈一谈精度和召回率的概念。

1.1K50

Uber如何使用NLP和深度学习改进地图体验

例如“遇到了交通事故”,“查看我的票价或费用”或“丢了订单”。客户支持平台中详细列出地图数据类型又不太合适,因为这些分类过于细粒度了。...由于缺乏前期分类,我们需要处理自由格式的文本并检测与地图数据类别相关的信号。人们提交票据时会用多种不同的短语来表达同一件事。...二、NLP和ML算法 检测地图数据类型中的错误的要求可以被建模为机器学习中的分类问题。分类模型通过从训练数据的学习来预测票据与地图数据类型中的错误相关的概率。...其次,用无监督学习方法训练后,词向量便固定了,无法通过优化分类任务来调整。为了克服这些缺点,我们开始深度学习模型,例如WordCNN和LSTM。...图2:为克服版本1算法的缺点,我们考虑将WordCNN和LSTM应用于票据分类问题。 下表显示了一种地图数据类型中进行分类的模型性能。

36520

利用Libra进行机器学习和深度学习

在这个博客里,将给出如何使用Libra的完整指导。将采取不同的数据集为不同的问题,并将向你展示一步一步的方法。 利用Libra进行信用卡欺诈检测 使用了Kaggle数据集来预测信用卡欺诈。...解决这个问题,需要遵循一种系统的方法。一般来说,你将遵循第一段中提到的顺序。但有了Libra,你就不用担心了。...你可以对它调用不同的查询,所有的内容都将存储在对象的models字段下。 我们client对象中传递文件的位置,并将其命名为newClient。现在要访问各种查询,请参阅文档。 用的是决策树。...基于Libra的神经网络分类 本节中,将使用神经网络查询进行分类。为此,使用了一个私人数据集来预测大脑信号的行为。让我们检查一下它在那个数据集上的执行情况。...他们还为现有的数据科学家添加了一些功能,以修改现有的神经网络,并在指定的索引处添加类似LSTM的层。对这个框架带来的概念感到兴奋。

42020
领券