首页
学习
活动
专区
工具
TVP
发布

数说工作室

专栏成员
214
文章
384654
阅读量
71
订阅数
Adam作者大革新, 联合Hinton等人推出全新优化方法Lookahead
最优化方法一直主导着模型的学习过程,没有最优化器模型也就没了灵魂。好的最优化方法一直是 ML 社区在积极探索的,它几乎对任何机器学习任务都会有极大的帮助。
数说君
2019-08-06
6250
GitHub超9千星:一个API调用27个NLP预训练模型:BERT、GPT-2全囊括
只需一个API,就能调用BERT、XLM等多种语言模型,逆天的GPT-2也一样轻松到碗里来,这样的模型库你是否期待?
数说君
2019-07-30
8640
GitHub超9千星:一个API调用27个NLP预训练模型:BERT、GPT-2全囊括
只需一个API,就能调用BERT、XLM等多种语言模型,逆天的GPT-2也一样轻松到碗里来,这样的模型库你是否期待?
数说君
2019-07-30
8640
治啰嗦利器~TF-IDF!| 文本分析
这个系列打算以文本相似度为切入点,逐步介绍一些文本分析的干货,包括分词、词频、词频向量、TF-IDF、文本匹配等等。 第一篇中,介绍了文本相似度是干什么的; 第二篇,介绍了如何量化两个文本,如何计算余弦相似度,穿插介绍了分词、词频、向量夹角余弦的概念。 其中具体如何计算,在这里复习: 文本分析 | 余弦相似度思想 文本分析 | 词频与余弦相似度 ---- 上文中留下了一个问题: 当文本很长的时候,词频向量的维度会很大,下面《水浒传》里的一段: 这吴氏年纪二十五六,是八月十五生的,小名叫做月姐,后来嫁到西门庆
数说君
2018-04-08
1.2K0
文本分析 | 词频与余弦相似度
这个系列打算以文本相似度为切入点,逐步介绍一些文本分析的干货,包括分词、词频、词频向量、文本匹配等等。 上一期,我们介绍了文本相似度的概念,通过计算两段文本的相似度,我们可以: 对垃圾文本(比如小广告)进行批量屏蔽; 对大量重复信息(比如新闻)进行删减; 对感兴趣的相似文章进行推荐,等等。 那么如何计算两段文本之间的相似程度?上一篇我们简单介绍了夹角余弦这个算法,其思想是: 将两段文本变成两个可爱的小向量; 计算这两个向量的夹角余弦cos(θ): 夹角余弦为1,也即夹角为0°,两个小向量无缝合体,则相似度
数说君
2018-04-04
1.8K0
拒绝无聊,如何让AI学会“花式聊天”?对抗学习在聊天回复生成中的曲折探索
【数说君导读】 生成式对抗网络(GAN),不仅可以用于生成图像(除马赛克,你懂的),还可以用在自动聊天模型上。跟机器人聊天,你也许最怕听到类似 “我也这么觉得” 的回答,基本就把天聊死了,这叫做 safe response,生成式对抗网络可以很好的解决这个尴尬。 最近,世界顶级自然语言处理会议 EMNLP 高分录取了「三角兽」的创业团队一篇论文被:Neural Response Generation via GAN with an Approximate Embedding Layer。文中提出了一种新
数说君
2018-03-28
1.9K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档