数说工作室-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数说工作室

专栏成员

214

文章

385108

阅读量

71

订阅数

Adam作者大革新，联合Hinton等人推出全新优化方法Lookahead

编程算法 NLP 服务机器翻译

最优化方法一直主导着模型的学习过程，没有最优化器模型也就没了灵魂。好的最优化方法一直是 ML 社区在积极探索的，它几乎对任何机器学习任务都会有极大的帮助。

2019-08-06

6260

GitHub超9千星：一个API调用27个NLP预训练模型：BERT、GPT-2全囊括

pytorch https 网络安全 NLP 服务

只需一个API，就能调用BERT、XLM等多种语言模型，逆天的GPT-2也一样轻松到碗里来，这样的模型库你是否期待？

2019-07-30

8670

GitHub超9千星：一个API调用27个NLP预训练模型：BERT、GPT-2全囊括

pytorch https 网络安全 NLP 服务

只需一个API，就能调用BERT、XLM等多种语言模型，逆天的GPT-2也一样轻松到碗里来，这样的模型库你是否期待？

2019-07-30

8670

治啰嗦利器~TF-IDF！| 文本分析

数据挖掘 NLP 服务

这个系列打算以文本相似度为切入点，逐步介绍一些文本分析的干货，包括分词、词频、词频向量、TF-IDF、文本匹配等等。第一篇中，介绍了文本相似度是干什么的；第二篇，介绍了如何量化两个文本，如何计算余弦相似度，穿插介绍了分词、词频、向量夹角余弦的概念。其中具体如何计算，在这里复习：文本分析 | 余弦相似度思想文本分析 | 词频与余弦相似度 ---- 上文中留下了一个问题：当文本很长的时候，词频向量的维度会很大，下面《水浒传》里的一段：这吴氏年纪二十五六，是八月十五生的，小名叫做月姐，后来嫁到西门庆

2018-04-08

1.2K0

文本分析 | 词频与余弦相似度

这个系列打算以文本相似度为切入点，逐步介绍一些文本分析的干货，包括分词、词频、词频向量、文本匹配等等。上一期，我们介绍了文本相似度的概念，通过计算两段文本的相似度，我们可以：对垃圾文本（比如小广告）进行批量屏蔽；对大量重复信息（比如新闻）进行删减；对感兴趣的相似文章进行推荐，等等。那么如何计算两段文本之间的相似程度？上一篇我们简单介绍了夹角余弦这个算法，其思想是：将两段文本变成两个可爱的小向量；计算这两个向量的夹角余弦cos(θ)：夹角余弦为1，也即夹角为0°，两个小向量无缝合体，则相似度

2018-04-04

1.8K0

拒绝无聊，如何让AI学会“花式聊天”？对抗学习在聊天回复生成中的曲折探索

人工智能 NLP 服务

【数说君导读】生成式对抗网络（GAN），不仅可以用于生成图像（除马赛克，你懂的），还可以用在自动聊天模型上。跟机器人聊天，你也许最怕听到类似 “我也这么觉得” 的回答，基本就把天聊死了，这叫做 safe response，生成式对抗网络可以很好的解决这个尴尬。最近，世界顶级自然语言处理会议 EMNLP 高分录取了「三角兽」的创业团队一篇论文被：Neural Response Generation via GAN with an Approximate Embedding Layer。文中提出了一种新

2018-03-28

1.9K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态