首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏成员
1348
文章
2598680
阅读量
335
订阅数
2022-2023年最新最全计算机相关专业毕设选题推荐
1.前端: 如html/css/js等前端语言构建web页面,也可以通过如vue等相关技术进行前端工程化来编写页面
机器学习AI算法工程
2023-02-28
1.6K0
基于web的通用文本标注工具MarkTool in NLP
(1).最基础的实体标注功能需要实时可视化显示每次的标注结果,每次标注时需要支持可选择大量实体类型。
机器学习AI算法工程
2020-12-15
4.1K0
基于知识图谱的智能问答方案
2012年谷歌首次提出“知识图谱”这个词,由此知识图谱在工业界也出现得越来越多,对于知识图谱以及相关概念的理解确实也是比较绕。自己在研究大数据独角兽Palantir之后开始接触知识图谱,也算对其有了一定了解,这里从三个角度总结一下怎么去理解知识图谱。
机器学习AI算法工程
2020-07-14
4.3K0
中文文本纠错算法实现
文本纠错又称为拼写错误或者拼写检查,由于纯文本往往来源于手打或者OCR识别,很可能存在一些错误,因此此技术也是一大关键的文本预处理过程,一般存在两大纠错类型。
机器学习AI算法工程
2020-07-03
2.8K0
多算法综合的文本挖掘系统
系统说明 集成了文本过滤、去重及邮件实时通知的功能 集成了文本关键词提取的功能 集成了文本分类即打标签的功能 集成了文本推荐即热点评价的功能 支持中英文 本文完整源码 获取方式: 关注微信公众号 da
机器学习AI算法工程
2019-10-29
6650
机器学习常见算法优缺点汇总
机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。
机器学习AI算法工程
2019-10-28
1.2K0
Spark + Hadoop,基于WIFI探针的大数据分析系统
本系统以Spark + Hadoop为核心,搭建了基于WIFI探针的大数据分析系统。
机器学习AI算法工程
2019-10-28
1.7K0
知识图谱入门 ,语义搜索
什么是语义搜索,借用万维网之父Tim Berners-Lee的解释 “语义搜索的本质是通过数学来拜托当今搜索中使用的猜测和近似,并为词语的含义以及它们如何关联到我们在搜索引擎输入框中所找的东西引进一种清晰的理解方式,
机器学习AI算法工程
2019-10-28
1.8K0
特征工程(一):
在深入研究特征工程之前,让我们花点时间看看整个机器学习流水线。这将帮助我们更好地了解应用的大方向。为此,让我们从数据和模型等基本概念入手。
机器学习AI算法工程
2019-10-28
1.2K0
构建一个完整的中文智能问答系统
简略概述要求: 构建一个完整的QA系统 整个系统由三部分构成:前台,后台,知识库 前台:请设计一个程序,实现QA对话界面,该界面可以基于用户提问,自动连接后台、并从知识库寻找答案,并呈现给用户 后台:
机器学习AI算法工程
2019-10-28
3.1K0
医疗知识图谱NLP项目,实体规模4.4万,实体关系规模30万
1、配置要求:要求配置neo4j数据库及相应的python依赖包。neo4j数据库用户名密码记住,并修改相应文件。 2、知识图谱数据导入:python build_medicalgraph.py,导入的数据较多,估计需要几个小时。 3、启动问答:python chat_graph.py
机器学习AI算法工程
2019-10-28
2.4K0
美团APP爬虫,获取指定范围内所有美食店铺信息
1.默认设置有随机2~5秒爬取间隔,建议不要修改 2.若有需要文件存储名称、路径以及数据库设置项可在settings.py中修改 3.默认爬取城市为深圳,由于美团APP的api中城市信息根据id传输,若要修改城市,只需修改spider.py下base_url中city/后面的数字即可
机器学习AI算法工程
2019-10-28
3.4K0
农业知识图谱(KG):农业领域的信息检索,命名实体识别,关系抽取,分类树构建,数据挖掘
(以上部分除了neo4j在官网下,wiki.zh.bin在亚马逊s3下载,其它均可直接用pip3 install 安装)
机器学习AI算法工程
2019-10-28
2.4K0
Bilibili (B站)200万用户数据爬取与分析(附源码)
该爬虫仅供学习使用 B站用户爬虫 B站视频爬虫 B站弹幕下载器 文件介绍 bilibili_user.py:爬虫文件 bilibili_user_info.sql:数据库文件 get_face.
机器学习AI算法工程
2018-03-14
3.7K0
50多条实用mysql数据库优化建议
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 缺省情况下建立的索引是非群集索引,但有时它并不是最佳的。在非群集索引下,数据在物理上随机存放在数据页上。合理的索引设计要建立在对各种查询的分析和预测上。一般来说: a.有大量重复值、且经常有范围查询( > ,< ,> =,< =)和 order by、group by 发生的列,可考虑建立集群索引; b.经常同时存取多列,且每列都含有重复值可考虑建立组合索引, 选择度高的列建议作为索引的第一个字
机器学习AI算法工程
2018-03-14
3.9K1
写给数据分析的初学者
在QQ群里听到一些网友在讨论数据分析的话题。有人正为自己学会了spss而高兴,有人说自己还略懂sas,还有人提到了sql查询语言。大家都在积极地学习,希望能在数据分析领域有所建树。然而在这些网友中,统计科班出身的并不多。所以,他们一味地认为软件会的多,就表明数据分析能力强。其实,这是一个误区。纵然你练了十八般武器,但并见得你就能拼得过别人的三板斧。作者以为统计软件学起来并不难,难得是理解统计方法的内涵。出于对大家的引导,问了三个问题,一来帮大家义务扫盲,二来希望大家能重视基础。 第一个问题:样本均值大家都不
机器学习AI算法工程
2018-03-09
7010
【思考】实施数据挖掘项目考虑的问题
谈到数据挖掘应从以下三方面加以考虑:一是用数据挖掘解决什么样的商业问题,二是为进行数据挖掘所做的数据准备,三是数据挖掘的各种分析算法。 数据挖掘的分析算法主要来自于以下两个方面:统计分析和人工智能(机器学习、模式识别等)。数据挖掘研究人员和数据挖掘软件供应商,在这一方面所做的主要工作是优化现有的一些算法,以适应大数据量。另外需要强调的是,任何一种数据挖掘的算法,不管是统计分析方法、神经元网络、各种树分析方法,还是遗传算法,没有一种算法是万能的。不同的商业问题,需要用不同的方法去
机器学习AI算法工程
2018-03-09
6200
【观点】数据挖掘未来研究方向及热点
1、 数据挖掘未来研究方向 当前,DMKD研究方兴未艾,其研究与开发的总体水平相当于数据库技术在70年代所处的地位,迫切需要类似于关系模式、DBMS系统和SQL查询语言等理论和方法的指导,才能使DMKD的应用得以普遍推广。预计在本世纪,DMKD的研究还会形成更大的高潮,研究焦点可能会集中到以下几个方面: 发现语言的形式化描述,即研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化; 寻求数据挖掘过程中的可视化方法,使知识发现的过程能够被用户理解
机器学习AI算法工程
2018-03-09
3.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档