首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

面试题64(有1千万条有重复的短信,以文本文件的形式保存,一行一条,也有重复。请用5 分钟时间找出重复出现最多的前10 条短信)

1·有1千万条有重复的短信,以文本文件的形式保存,一行一条,也有重复。请用5 分钟时间找出重复出现最多的前10 条短信。? 正确解析如下... 解析: 对于本题来说,某些面试者想用数据库的办法实现,首先将文本导入数据库,再利用select 语句的方法得出前10 个短信。但实际上用数据库是绝对满足不了5分钟解决这个条件的。这是因为1千万条短信即使1秒钟导入1万条(这已经算是很快的数据导入了),5分钟才3 百万条,即便真的能在5分钟内录完1千万条,也必须先建索引,否则SQL语句在5 分钟内肯定得不出结果。但对1

09

借助亚马逊S3和RapidMiner将机器学习应用到文本挖掘

本挖掘典型地运用了机器学习技术,例如聚类,分类,关联规则,和预测建模。这些技术揭示潜在内容中的意义和关系。文本发掘应用于诸如竞争情报,生命科学,客户呼声,媒体和出版,法律和税收,法律实施,情感分析和趋势识别。 在本篇博客帖中,你将会学习到如何将机器学习技术应用到文本挖掘中。我将会向你展示如何使用RapidMiner(一款流行的预测分析开源工具)和亚马逊S3业务来创建一个文件挖掘应用。亚马逊S3业务是一项易用的存储服务,可使组织在网页上的任何地方存储和检索任意数量的数据。 掘模型产生的结果可以得到持续的推导并

03

业界 | 站在锤子手机背后,小源科技用 AI 打造短信场景服务

机器之心原创 作者:藤子 毫无疑问,个人短信已经过时,但是,随着移动互联网的发展,企业短信却有增无减。小源科技,就抓住这个商机,用人工智能打造短信上的场景服务。 2017 年的锤子手机春季发布会让小源科技成为了网红,锤子科技产品总监朱萧木介绍手机的新增功能时,小源科技提供的「短信退订」第一个出场。 朱萧木介绍,系统会基于语义分析,对短信内容进行文本识别,如果检测出「回复 TD 即可退订」的垃圾短信,就会拦截短信发送方,将其「关进小黑屋」,并不会真的发送退订短信,这样的处理,既可以使垃圾短信发送方不再继续骚

07
领券