首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#gensim

在数据增强、蒸馏剪枝下ERNIE3.0分类模型性能提升

汀丶人工智能

阿里 · 算法工程师 (已认证)

在数据增强、蒸馏剪枝下ERNIE3.0模型性能提升 项目链接: https://aistudio.baidu.com/aistudio/projectdeta...

29720

2万字用Python探索金庸小说世界

可以叫我才哥

本文从传统匹配逻辑分析过渡到机器学习的词向量,全方位进行文本分析,值得学习,干货满满。

58110

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集|附代码数据

拓端

在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 ( 点击文末“阅读原文”获取完整代码数据******** )。

83510

Gensim

裴来凡

0.47 本公众号主要关注图像处理与模式识别的前沿进展 0.00 经典书籍与最新文献研究成果,同时也包含计算机相关实用操作技能

29410

​用 Python 和 Gensim 库进行文本主题识别

数据STUDIO

从大量文本中自动提取人们谈论的主题(主题识别)是自然语言处理的基本应用之一。大型文本示例包括社交媒体订阅、消费者对酒店、电影和其他业务的评价、用户评论、新闻和客...

1.7K20

关于Excel表操作-通过gensim实现模糊匹配

python与大数据分析

中国移动通信集团海南有限公司 · 技术专家 (已认证)

gensim是一个Python的自然语言处理库,能够将文档根据TF-IDF,LDA,LSI等模型转换成向量模式,此外,gensim还实现了word2vec,能够...

1K10

关于Excel表操作-合并文件操作

python与大数据分析

中国移动通信集团海南有限公司 · 技术专家 (已认证)

最近有点忙有点烦,天天忙于数据治理,说是数据治理,整天就是忙于整理和下发各种表格,从开始下发到各地区的表格合并进来,再到入库,再到比对,再到分离下发,再到按字段...

46710

关于自然语言处理系列-基于gensim的简易聊天机器人

python与大数据分析

中国移动通信集团海南有限公司 · 技术专家 (已认证)

下载了一个微信聊天的语料库,大概11万条记录,采用问答方式,中间以“|”分割,用gensim做了个简单的检索聊天机器人,目前基本可用。还有个地方需要进一步优化,...

27220

Gensim如何冻结某些词向量进行增量训练

Mezereon

比如像是Word2Vec,我们通过简单的几行代码就可以实现词向量的生成,如下所示:

72520

在python下实现word2vec词向量训练与加载实例

砸漏

项目中要对短文本进行相似度估计,word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。

4.2K20

解决Chunkize warning while installing gensim问题

hankleo

问题: UserWarning: detected Windows; aliasing chunkize to chunkize_serial warnin...

67410

回顾NLP必会Gensim

润森

Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和...

86400

比赛必备 ︱ 省力搞定三款词向量训练 + OOV词向量问题的可性方案

悟乙己

glove: NLP︱高级词向量表达(一)——GloVe(理论、相关测评结果、R&python实现、相关应用) 极简使用︱Glove-python词向量训练...

3.9K50

pyLDA系列︱考量时间因素的动态主题模型(Dynamic Topic Models)

悟乙己

笔者很早就对LDA模型着迷,最近在学习gensim库发现了LDA比较有意义且项目较为完整的Tutorials,于是乎就有本系列,本系列包含三款:Latent D...

5K20
领券