数据分析与挖掘

958 篇文章
44 人订阅

全部文章

绝命生

命名实体识别数据预处理

参考:https://github.com/ChileWang0228/Deep-Learning-With-Python/

400
绝命生

基于bert命名实体识别(一)数据处理

要使用官方的tensorflow版本的bert微调进行自己的命名实体识别,需要处理数据成bert相应的格式,主要是在run_classifier.py中,比如说...

4310
绝命生

transformer多头注意力的不同框架实现(tensorflow+pytorch)

现在来解释一下,为什么 num_heads 的值需要能够被 embed_dim 整除。这是为了把词的隐向量长度平分到每一组,这样多组注意力也能够放到一个矩阵里...

3910
绝命生

基于tensorflow的bilstm_crf的命名实体识别(数据集是msra命名实体识别数据集)

github地址:https://github.com/taishan1994/tensorflow-bilstm-crf

3510
绝命生

python实现命名实体识别指标(实体级别)

{'ALBUM': [(18, 3)], 'SINGER': [(11, 3)], 'SONG': [(2, 3), (6, 3)], 'TAG': [(23,...

4220
绝命生

基于tensorflow的文本分类总结(数据集是复旦中文语料)

代码已上传到github:https://github.com/taishan1994/tensorflow-text-classification

6220
绝命生

利用transformer进行中文文本分类(数据集是复旦中文语料)

和之前介绍的不同,重构了些代码,为了使整个流程更加清楚,我们要重新对数据进行预处理。

7120
绝命生

利用CNN进行中文文本分类(数据集是复旦中文语料)

上一节我们利用了RNN(GRU)对中文文本进行了分类,本节我们将继续使用CNN对中文文本进行分类。

8740
绝命生

利用RNN进行中文文本分类(数据集是复旦中文语料)

数据预处理参考利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) ,现在我们有了分词后的train_jieba.txt和test_jie...

8420
绝命生

可变数据类型不能作为python函数的参数

当使用列表作为参数传入函数时,实际上是引用传递。也就是传入的是实际参数的地址,而place=b也就是指向相同的地址。比如以下的:

4010
绝命生

pyspark读取pickle文件内容并存储到hive

在平常工作中,难免要和大数据打交道,而有时需要读取本地文件然后存储到Hive中,本文接下来将具体讲解。

6810
绝命生

pycaret之模型部署

1、预测模型 一旦使用deploy_model将模型成功部署到云中,或者使用save_model在本地成功部署了模型,就可以使用predict_model函数将...

5220
绝命生

pycaret模型分析

解释复杂模型在机器学习中至关重要。 模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。 在PyCaret中解释模型就像编写interpret_model...

6910
绝命生

pycaret模型分析之绘制模型结果

分析训练完成的机器学习模型的性能是任何机器学习工作流程中必不可少的步骤。 在PyCaret中分析模型性能就像编写plot_model一样简单。 该函数将受训的模...

6930
绝命生

pycaret之集成模型(集成模型、混合模型、堆叠模型)

组装训练好的模型就像编写ensemble_model一样简单。它仅采用一个强制性参数,即经过训练的模型对象。此函数返回一个表,该表具有k倍的通用评估指标的交叉验...

6310
绝命生

pycaret之训练模型(创建模型、比较模型、微调模型)

这是我们建议在任何受监管实验的工作流程中的第一步。此功能使用默认的超参数训练模型库中的所有模型,并使用交叉验证评估性能指标。它返回经过训练的模型对象。使用的评估...

7510
绝命生

更简易的机器学习-pycaret的安装和环境初始化

pycaret提供以下6种模块,当你导入相应的模块之后,就将环境切换到了该环境下。

6710
绝命生

python中各种操作的时间复杂度

以下的python操作的时间复杂度是Cpython解释器中的。其它的Python实现的可能和接下来的有稍微的不同。

5010
绝命生

利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料)

其中train存放的是训练集,answer存放的是测试集,具体看下train中的文件:

11752
绝命生

pytorch和tensorflow的爱恨情仇之参数初始化

当然还有一些像:torch.zeros()、torch.zeros_()、torch.ones()、torch.ones_()等函数;

8042

扫码关注云+社区

领取腾讯云代金券