腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
润风拂过存甘霖
专栏成员
举报
34
文章
98384
阅读量
13
订阅数
订阅专栏
申请加入专栏
全部文章(34)
python(13)
网络安全(9)
https(9)
编程算法(6)
深度学习(4)
NLP 服务(3)
机器学习(3)
github(3)
知识图谱(3)
tensorflow(2)
html(2)
人工智能(2)
开源(2)
正则表达式(2)
pytorch(2)
pandas(2)
javascript(1)
regex(1)
css(1)
api(1)
apache(1)
神经网络(1)
文字识别(1)
http(1)
机器人(1)
数据分析(1)
腾讯云开发者社区(1)
jupyter notebook(1)
unicode(1)
checksum(1)
components(1)
cut(1)
dataframe(1)
document(1)
driver(1)
email(1)
excel(1)
gpu(1)
jieba(1)
max(1)
min(1)
nlp(1)
nvidia(1)
python3(1)
scipy(1)
sort(1)
split(1)
text(1)
token(1)
uri(1)
url(1)
word2vec(1)
表格(1)
计算机(1)
漏洞(1)
搜索文章
搜索
搜索
关闭
交大ADAPT实验室 | 常识知识论文列表
编程算法
NLP 服务
apache
近年来,常识知识(commonsense knowledge)越发成为NLP领域,乃至多模态,跨学科的研究热点。尽管以BERT为代表的的预训练语言模型已经在实体识别、机器翻译、情感分析等任务上取得了亮眼的表现,它们在面对一些人类可以使用常识轻易解决的问题时仍然表现不佳,面对对抗样本时也极为脆弱。似乎这些模型知识只是学到了一些浅层线索和语义,而与人类的知识体系并不相同。因此,将常识知识融入机器学习中就成为了一个充满前景的解决方案。不过,如何抽取常识知识,如何利用常识知识,乃至如何定义“常识本身”依然是有待研究的难题。 交大ADAPT实验室近年来正将研究兴趣专注于这一领域。在此过程中,我们也将自己的阅读加以筛选、归类和统计,整合成了一份论文列表,在GitHub上开源。
blmoistawinde
2020-11-24
652
0
困惑度(perplexity)的基本概念及比较多种模型下的计算(N-gram, 主题模型/LDA, 神经网络/RNN)
NLP 服务
https
网络安全
机器学习
深度学习
发现网络上流传的关于困惑度(perplexity)大多数都是利用了N-gram或者主题模型的例子来阐述的。但是现在这个年代来学习这个指标的人多半都是想研究神经网络的,而两者的对困惑度的计算方法又很不同,这就不能不让人对“困惑度”感到“困惑”了。本人虽然才疏学浅,还是斗胆在这里尝试写一篇文章,试图用简洁的方式来梳理清楚其中的困惑。
blmoistawinde
2020-03-20
10.5K
0
实体知识+字典树辅助jieba的分词(并对三国演义进行简单分析)
python
NLP 服务
在做中文NLP的时候,分词可谓是基础中的基础。然而这个基础部分的内容直到今天还是让人不省心,在实际应用中【尤其是在人名等实体的识别上】总是显得漏洞百出。下面以python上比较流行的一个中文分词库jieba为例,看看它的一次表现:
blmoistawinde
2019-10-30
963
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档