腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
程序生活
专栏作者
举报
436
文章
464472
阅读量
57
订阅数
订阅专栏
申请加入专栏
全部文章(436)
编程算法(88)
python(75)
https(48)
其他(46)
神经网络(46)
模型(41)
机器学习(39)
深度学习(39)
网络安全(37)
数据(33)
NLP 服务(26)
人工智能(24)
数据结构(18)
腾讯云测试服务(17)
函数(16)
github(14)
LLM(13)
开源(12)
pytorch(12)
性能(12)
git(10)
tensorflow(9)
php(9)
爬虫(8)
二叉树(8)
论文(7)
ajax(6)
qt(6)
卷积神经网络(6)
opencv(6)
线性回归(6)
大数据(6)
特征工程(6)
data(6)
对象(6)
工具(6)
node.js(5)
html(5)
图像处理(5)
网站(5)
nlp(5)
测试(5)
系统(5)
javascript(4)
数据库(4)
linux(4)
http(4)
keras(4)
image(4)
model(4)
script(4)
text(4)
编码(4)
教程(4)
搜索(4)
优化(4)
数据挖掘(3)
css(3)
sql(3)
中文分词(3)
文字识别(3)
存储(3)
hadoop(3)
hive(3)
numpy(3)
监督学习(3)
腾讯云开发者社区(3)
学习方法(3)
var(3)
工作(3)
基础(3)
框架(3)
排序(3)
设计(3)
事件(3)
数组(3)
索引(3)
字符串(3)
语音识别(2)
bash(2)
r 语言(2)
jquery(2)
bash 指令(2)
mapreduce(2)
批量计算(2)
文件存储(2)
金融风控(2)
容器(2)
分布式(2)
spark(2)
强化学习(2)
markdown(2)
数据分析(2)
数据处理(2)
分类算法(2)
验证码(2)
chatgpt(2)
code(2)
connect(2)
dataset(2)
dom(2)
glm(2)
gpt(2)
href(2)
match(2)
models(2)
prompt(2)
scaling(2)
self(2)
title(2)
ui(2)
遍历(2)
部署(2)
程序(2)
动态规划(2)
服务器(2)
集合(2)
脚本(2)
开发(2)
连接(2)
配置(2)
算法(2)
统计(2)
图片上传(2)
学习笔记(2)
云镜(主机安全)(1)
人脸识别(1)
java(1)
c++(1)
.net(1)
angularjs(1)
vue.js(1)
xml(1)
json(1)
arm(1)
access(1)
打包(1)
ide(1)
api(1)
搜索引擎(1)
centos(1)
apache(1)
容器镜像服务(1)
laravel(1)
访问管理(1)
机器翻译(1)
知识图谱(1)
企业(1)
codeigniter(1)
svg(1)
yarn(1)
serverless(1)
游戏(1)
shell(1)
图像识别(1)
jvm(1)
正则表达式(1)
gui(1)
面向对象编程(1)
决策树(1)
unity(1)
tcp/ip(1)
无监督学习(1)
迁移学习(1)
anaconda(1)
安全(1)
小程序(1)
机器人(1)
nat(1)
processing(1)
机器学习平台(1)
智能推荐平台(1)
智能客服机器人(1)
aigc(1)
anchor(1)
auto(1)
backbone(1)
block(1)
border(1)
chat(1)
ci(1)
class(1)
config(1)
copy(1)
distance(1)
double(1)
edit(1)
event(1)
file(1)
function(1)
google(1)
gpu(1)
graph(1)
height(1)
history(1)
import(1)
input(1)
io(1)
knn(1)
lan(1)
layer(1)
leetcode(1)
line(1)
lstm(1)
microsoft(1)
min(1)
modeling(1)
multilingual(1)
mysql(1)
mysqli(1)
nav(1)
numbers(1)
output(1)
pandas(1)
pdf(1)
pip(1)
png(1)
precision(1)
python3(1)
root(1)
schedule(1)
series(1)
server(1)
setinterval(1)
sh(1)
similarity(1)
size(1)
split(1)
strip(1)
tail(1)
target(1)
task(1)
torch(1)
url(1)
web(1)
x86(1)
xmlhttprequest(1)
yii2(1)
百度(1)
编程语言(1)
变量(1)
博客(1)
代理(1)
递归(1)
定时器(1)
动画(1)
翻译(1)
服务(1)
技巧(1)
计算机(1)
架构(1)
可视化(1)
蓝牙(1)
链表(1)
浏览器(1)
内存(1)
入门(1)
通信(1)
网络(1)
效率(1)
语法(1)
自然语言处理(1)
LoRa(1)
搜索文章
搜索
搜索
关闭
【NLP基础】英文关键词抽取RAKE算法
编程算法
NLP 服务
RAKE英文全称为Rapid Automatic keyword extraction,中文称为快速自动关键字提取,是一种非常高效的关键字提取算法,可对单个文档进行操作,以实现对动态集合的应用,也可非常轻松地应用于新域,并且在处理多种类型的文档时也非常有效。
致Great
2022-09-23
724
0
芒果TV商品意图识别top3思路分享
NLP 服务
主办方提供了商品名称和用户query数据供选手进行模型训练,希望选手能够设计出一套高效、精准的商品意图识别模型,以帮助提升电商搜索的效果,改善顾客的购买体验。
致Great
2022-06-15
1.1K
0
基于Trie 树实现简单的中文分词
数据结构
编程算法
中文分词
NLP 服务
中文分词是中文自然语言处理的基础,中文分词的正确率如何直接影响后续的词性标注(也有些词性标注算法不需要事先分词,但标注效果往往比先分词后标注差),实体识别、句法分析、语义分析。常用的分词方法主要有依赖词典的机械分词和序列标注方法。
致Great
2022-05-13
747
1
nlp-with-transformers实战-01_transformers简介
NLP 服务
迁移学习
机器学习
神经网络
深度学习
2017年,谷歌的研究人员发表了一篇论文,提出了一种用于序列建模的新型神经网络架构。 被称为Transformer的这一架构在机器翻译任务上的表现优于循环神经网络(RNN),在翻译质量和训练成本方面都是如此。
致Great
2022-03-30
470
0
【论文笔记】文本版的Mixup数据增强算法:SSMix
编程算法
图像处理
NLP 服务
论文标题:SSMix: Saliency-Based Span Mixup for Text Classification
致Great
2022-03-16
878
0
Bert预训练新法则!
tcp/ip
NLP 服务
论文简介:还应在遮蔽语言模型中使用 15% 的遮蔽概率吗? 论文标题:Should You Mask 15% in Masked Language Modeling? 论文链接:https://a
致Great
2022-03-11
864
0
文本分类还停留在BERT?对偶对比学习框架也太强了
NLP 服务
论文标题:Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation
致Great
2022-02-12
761
0
【论文笔记】当Bert炼丹不是玄学而是哲学:Mengzi模型
NLP 服务
论文标题:Mengzi: Towards Lightweight yet Ingenious Pre-trained Models for Chinese 论文链接:https://arxiv.org/pdf/2110.06696.pdf 论文代码:https://github.com/Langboat/Mengzi 论文作者:{Zhuosheng Zhang etc.}
致Great
2022-01-06
660
0
中文语言能力评测基准「智源指数」
中文分词
NLP 服务
智源指数排行榜提供多层次维度的评测方案,提供数据集、任务、能力得分,以及智源指数总体得分。智源指数根据标准基线模型(mT5-small)的得分,对参与评测模型的得分进行归一化(括号中显示),最大程度消除不同数据集和评测指标的差异。
致Great
2022-01-06
760
0
ERNIE 3.0 Titan:最强中文预训练模型
NLP 服务
神经网络
深度学习
人工智能
本文介绍了一个中文大语言模型。作者提出了名为ERNIE 3.0的统一框架,用于预训练大规模知识增强模型,并训练了一个具有 100 亿个参数的模型。 ERNIE 3.0 在各种 NLP 任务上的表现优于最先进的模型。为了探索扩展 ERNIE 3.0 的性能,作者在PaddlePaddle平台上训练了具有多达2600亿个参数的百亿参数模型 ERNIE 3.0 Titan。此外,作者设计了一个自监督的对抗损失和一个可控的语言建模损失,使ERNIE 3.0 Titan 生成可信且可控的文本。为了减少计算开销和碳排放,作者为 ERNIE 3.0 Titan 提出了一个在线蒸馏框架,其中教师模型将同时教授学生和自我训练。ERNIE 3.0 Titan是迄今为止最大的中文密集预训练模型。实证结果表明,ERNIE 3.0 Titan在 68 个NLP数据集上的表现优于最先进的模型。
致Great
2022-01-06
892
0
【论文解读】文本分类上分利器:Bert微调trick大全
NLP 服务
论文标题:How to Fine-Tune BERT for Text Classification? 中文标题:如何微调 BERT 进行文本分类? 论文作者:复旦大学邱锡鹏老师课题组 实验代码
致Great
2021-07-08
1.5K
0
NLP数据集列表
NLP 服务
【NLP数据集推荐】 CLUEDatasetSearch https://github.com/CLUEbenchmark/CLUEDatasetSearch 中英文NLP数据集。可以点击搜索。
致Great
2020-12-22
485
0
中文分词工具 MiNLP-Tokenizer
NLP 服务
腾讯云测试服务
api
深度学习
MiNLP-Tokenizer是小米AI实验室NLP团队自研的中文分词工具,基于深度学习序列标注模型实现,在公开测试集上取得了SOTA效果。其具备以下特点:
致Great
2020-11-26
1.5K
0
零基础入门NLP - 新闻文本分类 方案整理
NLP 服务
https
机器学习
神经网络
深度学习
比赛链接:https://tianchi.aliyun.com/forum/#raceId=531810 以下资料整理自比赛论坛,感谢这些无私开源的选手们,以下是整理TOP5方案的主要思路和模型,以便大家学习
致Great
2020-11-24
1.6K
0
动手学深度学习(十一) NLP循环神经网络
NLP 服务
神经网络
机器学习
深度学习
人工智能
本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量
致Great
2020-02-25
707
0
动手学深度学习(十) NLP 语言模型与数据集
NLP 服务
语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为 的词的序列 ,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: 本节我们介绍基于统计的语言模型,主要是 元语法( -gr
致Great
2020-02-25
457
0
NLP系列(一)pkuseg-python:一个高准确度的中文分词工具包
中文分词
NLP 服务
pkuseg是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。pkuseg具有如下几个特点:
致Great
2019-02-13
1.2K
0
pyltp的使用教程
NLP 服务
机器学习
pyltp 是 LTP 的 Python 封装,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。
致Great
2018-08-28
1.4K
0
Sequence to Sequence学习资料
深度学习
NLP 服务
Sequence to Sequence学习资料 seq2seq学习笔记 - CSDN博客 深度学习方法(八):自然语言处理中的Encoder-Decoder模型,基本Sequence to Sequence模型 - CSDN博客 Sequence to Sequence学习简述 NELSONZHAO/zhihu: 知乎专栏源码 zhihu/basic_seq2seq at master · NELSONZHAO/zhihu 从Encoder到Decoder实现Seq2Seq模型 NELS
致Great
2018-07-06
887
0
2017/6/9-Python文件读写的方法
python
NLP 服务
# 使用斜杠“/”: "c:/test.txt"… 不用反斜杠就没法产生歧义了 # 将反斜杠符号转义: "c:\\test.txt"… 因为反斜杠是转义符,所以两个"\\"就表示一个反斜杠符号 # file=open('D:\\jupyter\\test.txt')# #file=open('D:/jupyter/test.txt') #file=open('test.txt')#和程序在一个同一路径下 file=open('test.txt') file.read() 'hi quincyqiang\
致Great
2018-04-11
703
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档