原文标题:A Scalable Framework for Multilevel Streaming Data Analytics using Deep Learning
摘要:在速度、数量、价值、多样性和准确性方面数据的快速增长为所有类型的企业带来了令人兴奋的新机遇和巨大挑战。最近,随着商业、医疗、制造和安全领域对决策支持的实时分析需求的增加,开发用于处理连续数据流的系统已经引起了相当大的兴趣。流数据的分析通常依赖于静态或存档数据的离线分析输出。然而,像我们的行业合作伙伴格诺伊特这样的企业和组织,努力向客户提供实时市场信息,并不断寻找一个统一的分析框架,该框架可以无缝地集成流和离线分析,从大量混合流数据中提取知识。本文通过比较先进的可扩展开源技术、分布式技术和内存技术,提出了一种多级流文本数据分析框架的设计方法。通过对语言理解和情感分析的深入学习,给出了多级文本分析用例框架的功能,包括数据索引和查询处理。我们的框架结合了用于实时文本处理的模型、用于更高层次情感分析的长期短期内存(Lstm)深度学习模型,以及用于基于SQL的分析处理的其他工具,为多级流文本分析提供了一种可扩展的解决方案。
地址: https://arxiv.org/abs/1907.06690
作者: Shihao Ge, Haruna Isah, Farhana Zulkernine, Shahzad Khan
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。