向AI转型的程序员都关注了这个号👇👇👇
机器学习AI算法工程 公众号:datayx
使用:pip install nlpcda
https://github.com/425776024/nlpcda
一键中文数据增强工具,支持:
BIO
数据增强simbert
做生成式相似句生成经过细节特殊处理,比如不改变年月日数字,尽量保证不改变原文语义。即使改变也能被猜出来、能被猜出来、能被踩出来、能被菜粗来、被菜粗、能菜粗来.
文本
转语音
>语音
识别回文本
:基于fastspeech2对文本生成语音,基于wav2vec2语音识别文本例子: input: 新华社北京消息 >
fastspeech2
> x.wav x.wav >wav2vec2
> output: 新华设北京消息
今天是8月29日消息 > 今天是八月二十九日消息 我有1234个苹果 > 我有一千二百三十四个苹果 意义
⚠️ 单纯刷准确率分数的比赛,用此包一般不会有分数提升 API 1.随机(等价)实体替换 参数:
2.随机同义词替换 参数:
3.随机近义字替换 参数:
4.随机字删除 参数:
5.NER命名实体 数据增强 输入标注好的NER数据目录,和需要增强的标注文件路径,和增强的数量,即可一键增强 Ner类参数:
6.随机置换邻近的字
7.等价字替换 参数:
添加自定义词典 用于使用之前,增加分词效果
8.翻译互转实现的增强 1.百度中英翻译互转实现的增强 note: 申请你的 appid、secretKey: http://api.fanyi.baidu.com/api/trans
机器学习算法AI大数据技术 搜索公众号添加: datanlp
长按图片,识别二维码
阅读过本文的人还看了以下文章: TensorFlow 2.0深度学习案例实战 基于40万表格数据集TableBank,用MaskRCNN做表格检测 《基于深度学习的自然语言处理》中/英PDF Deep Learning 中文版初版-周志华团队 【全套视频课】最全的目标检测算法系列讲解,通俗易懂! 《美团机器学习实践》_美团算法团队.pdf 《深度学习入门:基于Python的理论与实现》高清中文PDF+源码 《深度学习:基于Keras的Python实践》PDF和代码 特征提取与图像处理(第二版).pdf python就业班学习视频,从入门到实战项目 2019最新《PyTorch自然语言处理》英、中文版PDF+源码 《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码 《深度学习之pytorch》pdf+附书源码 PyTorch深度学习快速实战入门《pytorch-handbook》 【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》 《Python数据分析与挖掘实战》PDF+完整源码 汽车行业完整知识图谱项目实战视频(全23课) 李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材 笔记、代码清晰易懂!李航《统计学习方法》最新资源全套! 《神经网络与深度学习》最新2018版中英PDF+源码 将机器学习模型部署为REST API FashionAI服装属性标签图像识别Top1-5方案分享 重要开源!CNN-RNN-CTC 实现手写汉字识别 yolo3 检测出图像中的不规则汉字 同样是机器学习算法工程师,你的面试为什么过不了? 前海征信大数据算法:风险概率预测 【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类 VGG16迁移学习,实现医学图像识别分类工程项目 特征工程(一) 特征工程(二) :文本数据的展开、过滤和分块 特征工程(三):特征缩放,从词袋到 TF-IDF 特征工程(四): 类别特征 特征工程(五): PCA 降维 特征工程(六): 非线性特征提取和模型堆叠 特征工程(七):图像特征提取和深度学习 如何利用全新的决策树集成级联结构gcForest做特征工程并打分? Machine Learning Yearning 中文翻译稿 蚂蚁金服2018秋招-算法工程师(共四面)通过 全球AI挑战-场景分类的比赛源码(多模型融合) 斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏) python+flask搭建CNN在线识别手写中文网站 中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程 不断更新资源 深度学习、机器学习、数据分析、python 搜索公众号添加: datayx