大数据技术与机器学习

LV0
发表了文章

PyTorch +ResNet34实现 图像分类

ResNet在2015年被提出,在ImageNet比赛classification任务上获得第一名,因为它“简单与实用”并存,之后很多方法都建立在ResNet5...

大数据技术与机器学习
发表了文章

基于RoBERTa模型进行互联网新闻文本情感分析实现top1

随着网络新闻服务的飞速发展,网络上产生了大量的新闻文本信息,探索新闻文本背后的情绪表达,可以为政府和企业提供潜在价值。本题给定互联网新闻文本标题及新闻文本内容,...

大数据技术与机器学习
发表了文章

K-means算法的改进:K-means++

由于 K-means 算法的分类结果会受到初始点的选取而有所区别,因此有提出这种算法的改进: K-means++ 。

大数据技术与机器学习
发表了文章

汽车行业用户观点主题及情感分类 一等奖方案

最终预测的主题结果, 存放在data/test_predict_aspect_ensemble.txt中。

大数据技术与机器学习
发表了文章

tensorflow 2.0+ 预训练BERT模型的文本分类

多分类也称为单标签问题,例如,我们为每个样本分配一个标签。名称中的"多"表示我们处理至少 3 个类,对于 2 个类,我们可以使用术语二进制分类(binary c...

大数据技术与机器学习
发表了文章

《深度学习》中文版-周志华团队

这本书对各类读者都一定用处的,但我们是基于两个主要目标受众而写的。其中 一个目标受众是学习机器学习的大学生(本科或研究生),包括那些开始了职业生 涯的深度学习和...

大数据技术与机器学习
发表了文章

Attention机制

既然采用固定的向量表示输入序列会限制模型性能,那能不能让解码器每次接收的输入都不一样呢,在每次输出时,让解码器有侧重的关注输入序列的不同部分(如:输出“mach...

大数据技术与机器学习
发表了文章

Keras 模型中使用预训练的 gensim 词向量和可视化

在这篇 [在Keras模型中使用预训练的词向量](https://keras-cn.readthedocs.io/en/latest/blog/ word_em...

大数据技术与机器学习
发表了文章

最全的机器学习中的优化算法介绍

在机器学习中,有很多的问题并没有解析形式的解,或者有解析形式的解但是计算量很大(譬如,超定问题的最小二乘解),对于此类问题,通常我们会选择采用一种迭代的优化方式...

大数据技术与机器学习
发表了文章

机器学习 - 模型离线评估

模型上线之前可以利用测试数据集进行离线评估,主要指标可以根据具体的问题类型可以有以下的方案。

大数据技术与机器学习
发表了文章

基于依存句法分析的关键短语抽取算法实战

由于最近在做一些无监督的关键词短语(实体)抽取工作,其实最大的背景还是没有标注好的实体识别训练数据;所以想到采用无监督的关键短语抽取算法折中去抽取一些实体,于是...

大数据技术与机器学习
发表了文章

基于IBM Model 1的词对齐与短语抽取Python实现

基于词的翻译模型起源于上世纪IBM关于统计机器翻译的原创性工作,教材主要介绍的是IBM Model 1模型。该模型能够从大量句对齐的语料中自动实现词对齐。

大数据技术与机器学习
发表了文章

直觉理解LSTM和GRU

网上有很多对于LSTM以及GRU的介绍,主要从构造方面进行了进行了介绍。但是由于构造相对较复杂,而且涉及到的变量较多,往往不那么容易记住。下面我们从直觉的角度...

大数据技术与机器学习
发表了文章

Python实现图片中英文信息识别

4)测试两张图片,denggao.jpg(中文信息)、test.jpg(英文信息)

大数据技术与机器学习
发表了文章

NLP之keras中文文本分类系列算法封装,简单易用(超详细教程)

中文长文本分类、短句子分类、多标签分类、两句子相似度(Chinese Text Classification of Keras NLP, multi-label...

大数据技术与机器学习
发表了文章

darknet图像定位+tornado实现票据识别API,识别率达到95%以上

此项目用于对中国购车发票进行内容识别,目前完成的是身份证,vin,发动机号,价格的识别提供了展示的demo页,以及提供了传入文件,路径,base64码的多种方式...

大数据技术与机器学习
Python费用中心HTTPJSON网站
发表了文章

BERT中文实战:文本相似度计算与文本分类

谷歌提供了以下几个版本的BERT模型,每个模型的参数都做了简单的说明,中文的预训练模型在11月3日的时候提供了,这里我们只需要用到中文的版本

大数据技术与机器学习
Python自然语言处理
发表了文章

Attention注意力机制

在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量来获取输⼊序列信息。当编码器为循环神经⽹络时,背景变量来⾃它最终时间步的隐藏状...

大数据技术与机器学习
机器翻译编程算法
发表了文章

seq2seq模型

在⾃然语⾔处理的很多应⽤中,输⼊和输出都可以是不定⻓序列。以机器翻译为例,输⼊可以是⼀段不定⻓的英语⽂本序列,输出可以是⼀段不定⻓的法语⽂本序列,例如:

大数据技术与机器学习
数字货币区块链机器翻译
发表了文章

textRNN/textCNN文本分类

textRNN指的是利用RNN循环神经网络解决文本分类问题,文本分类是自然语言处理的一个基本任务,试图推断出给定文本(句子、文档等)的标签或标签集合。

大数据技术与机器学习
机器学习神经网络深度学习AI 人工智能

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券