腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1724)
视频
沙龙
2
回答
将
两个
评估
数据
集
传
递给
HuggingFace
Trainer
对象
有没有什么方法可以
将
两个
评估
数据
集
传
递给
HuggingFace
训练器
对象
,以便在训练期间可以在
两个
不同的集合(例如分布内和分布外)上对训练的模型进行
评估
?下面是该
对象
的实例化,它只接受一个eval_dataset
trainer
=
Trainer
( args, train_dataset=train_dataset
浏览 34
提问于2021-08-02
得票数 2
2
回答
如何有效地
将
一个大型并行语料库转换成一个集合
数据
集
来训练一个EncoderDecoderModel?
、
、
、
、
在预编码
数据
集
上工作的典型EncoderDecoderModelfrom transformers import EncoderDecoderModel当使用wmt14
数据
集
时,可以使用预处理/编码
数据
集
来训练模型: train_data = datasets.load_dataset("wmt14", "de-en"的并
浏览 33
提问于2022-10-20
得票数 0
回答已采纳
1
回答
HuggingFace
的“培训”能为课程学习定制吗?
、
、
、
、
我一直在寻找
HuggingFace
转换器
Trainer
对象
(特别是Seq2SeqTrainer)中的某些特性,并想知道它们是否存在,如果存在,如何实现它们,或者我是否需要编写自己的培训循环来启用它们。我希望
将
课程学习应用到我的培训策略中,并定期
评估
该模式,因此,我希望能够做到以下几点 选择模型在每个时期查看训练样本的顺序(似乎传
递给
train_dataset参数的
数据
会被一些内部代码自动调整),即使我设法阻止了这一点,我仍然需要在不同的时期传递不同的有序
数据</
浏览 17
提问于2022-08-26
得票数 0
1
回答
产品描述中的文本分类问题
、
、
我刚开始机器学习,我有一个包含4000到5000项的
数据
集
,它们都是产品描述,结果,我想训练一个模型来将它们分类为1或0,我能用这种文本来训练它吗?
浏览 5
提问于2022-10-09
得票数 -1
1
回答
Pybrain中的交叉验证
、
、
我在网上找到了以下
两个
版本的代码:validator = CrossValidator(
trainer
=
trainer
, dataset=
trainer
.ds, n_folds=5, valfuncmodval = ModuleValidator()
trainer
.trainEpochs(1)
trainer
.trainOnDa
浏览 1
提问于2015-03-11
得票数 1
1
回答
cntk中的eval和test_minibatch
、
、
我们创建了
两个
方法,eval_metric和calc_error,如下所示: predictions =
浏览 1
提问于2017-08-19
得票数 1
回答已采纳
1
回答
我如何知道与预先训练的托卡器一起使用哪些参数?
、
、
我想在
HuggingFace
中使用经过预先训练的模型:tokenizer = AutoTokenizer.from_pretrained(transformer_name) 现在我有了我的模型和标记器,我需要标记我的
数据
集
我的理解是,我总是需要截断我的
数据
,让max_length留
浏览 17
提问于2022-12-02
得票数 1
1
回答
huggingface
transformer models: BERT模型训练开始时的KeyError:'input_ids‘消息
、
、
使用
Huggingface
转换库,当我为掩蔽语言建模任务微调BERT语言模型时,我在最后一步遇到了一个bug。我希望微调它在一个领域的金融语料库,该模型尚未培训。首先,我从一个pandas
数据
帧创建了一个dataset
对象
,该
数据
帧又是从一个包含一列多行文本的csv文件中创建的: unlabelled_dataset = Dataset.from_pandas(unlabelled) 其次,我使用以下代码对
数据
集
进行了标记: tokenizerBERT = BertTokeniz
浏览 117
提问于2020-11-19
得票数 1
1
回答
使用tf.data.Dataset
评估
性能的最佳方法
我训练了一个模型,现在想在测试
集
上
评估
它的性能。测试
集
被加载为tf.data.TFRecordDataset
对象
(来自多个TFRecords,每个
对象
中都有多个示例),该
对象
由大约百万个元组(图像,标签)形式的示例组成,
数据
被批量处理。然后
将
原始标签映射到模型需要预测的目标整数(one-hot编码)。 我知道我可以
将
Dataset
对象
作为输入传
递给
model.predict(),它将输出datase
浏览 33
提问于2020-09-08
得票数 0
1
回答
HuggingFace
的教练会自动忽略模型不需要的功能吗?
、
、
、
具体来说,我的原始
数据
集
包含
两个
列,名为“text”和“label”。在标记“text”之后,dataset
对象
现在又有三个列,名为“input_ids”、“token_type_ids”和“attention_mask”。我知道这三列是BERT模型所必需的,但是当我
将
数据
集
提供给训练器API时,我没有删除原始的“text”列。DatasetDict({ tr
浏览 22
提问于2022-06-30
得票数 0
回答已采纳
1
回答
使用WCF
数据
服务和实体框架控制每个实体实例的字段可见性
、
、
、
四个字段
将
公开可见,其余六个字段
将
需要授权订阅(例如,
两个
用户被标记为好友)。有谁有什么想法可以做吗?或者甚至是一个不同的框架来满足我的需求?
浏览 0
提问于2012-01-13
得票数 0
2
回答
`train.py`和`model_main.py`在Tensorflow
对象
检测API中的区别
、
我通常只是使用train.py来训练使用Tensorflow
对象
检测API。
浏览 0
提问于2019-01-08
得票数 6
1
回答
PyTorch-YOLOv3精度度量
、
、
我正在使用现有的PyTorch-YOLOv3 3体系结构,并通过google对其进行培训,以识别自定义
数据
集
作为研究手稿。基本上,我想使用
对象
检测算法来计算图像中
两个
类的
对象
数。有人告诉我,为了我的目的,我应该为模型生成验证/训练曲线,并创建一个混淆矩阵来
评估
训练模型的分类器元素。我有一个想法,修改培训脚本,以便在培训期间
将
培训指标输出到csv文件中,但我不熟悉如何创建一个混淆矩阵来
评估
经过培训的模型。 此外,在计算机视觉领域,应该为手稿生成
浏览 0
提问于2019-12-10
得票数 0
回答已采纳
1
回答
传递多个
数据
源/
集
的方法?以RDLC报表为业务
对象
根据我所读到的,我可以
将
业务
对象
传
递给
我的报表来填充它们。我有一个具有嵌套属性的业务
对象
,其中有些是类实例。访问它们没有问题,因为我几乎可以
将
类作为字段拖动,然后
将
表达式编辑为类似于value.Name的内容。问题是业务
对象
中的“我的集合”没有显示在报表
数据
资源管理器中。在从
对象
中添加新
数据
集
时,我可以看到我的原始业务
对象
被列出了3倍如下 MainWindowViewModel
浏览 0
提问于2014-06-22
得票数 0
1
回答
将
数据
集
拆分为训练、验证和测试的正确方法是什么?
、
、
、
、
classB folder //test再次,我了解了如何使用python库拆分文件夹,该文件夹
将
数据
拆分为以下结构folder classC foldermodel.evaluate(test_generator,batch_size=32) 在这
浏览 1
提问于2022-08-09
得票数 1
回答已采纳
1
回答
PIGLatin是否支持带Parquet文件的谓词下推
、
、
我正在
评估
基于Hadoop的
数据
集
存储选项。当前的设置如下所示: 我遇到了RC,ORC和Parquet。我看到了,但是
浏览 4
提问于2015-10-27
得票数 0
1
回答
我们能在Javascript文件中使用空手道的匹配函数吗?
我试图在Karate中编写一个通用的JS函数,它将从
数据
库中提取结果并将其存储在Json
对象
中,并将其与外部json文件进行比较。我希望比较JS函数本身中的这
两个
对象
,而不是将
对象
传
递给
被调用的空手道脚本。然而,当我试图在JS函数中比较模糊匹配字符串时,它不会被
评估
。(当我
将
Json
对象
返回到空手道并使用空手道的“匹配”函数时,它就能工作了)。 有什么方法可以在JS文件中调用空手道的匹配函数吗?
浏览 2
提问于2018-04-18
得票数 1
回答已采纳
1
回答
如何捕获导入脚本函数的打印
、
、
、
我有一个神经网络的
数据
处理机函数,它定义了一个生成器
对象
,所以我可以很容易地将它传
递给
在tensorflow中实现的训练和测试功能。我目前正在为我的小项目编写一个
评估
脚本,能够捕获
数据
采集器的打印(我从
评估
脚本中调用了它)
将
非常方便,以便知道我目前正在
评估
的
数据
集
--进一步的演示代码。train_data, gt = next(train_gen) current_dataset = ***print of Data
浏览 11
提问于2022-05-04
得票数 0
回答已采纳
1
回答
如何设置适当的回调来检索
数据
我有以下情况,我有
两个
班级。我通过回调函数
将
类1的实例传
递给
类2的实例。最终的目标是连接到某个东西(比如sql server)并检索一些
数据
集
,可能每隔x分钟检索一次。我如何修改下面的代码,以便在
将
类1的
对象
传
递给
类2的
对象
之后,我可以以某种方式让
对象
1完成所有的工作。实际上,我需要实现连接到SQl并将
数据
放在类foo的work()函数中。更重要的是,我如何在main()中将结果
集
浏览 2
提问于2014-09-15
得票数 3
1
回答
SAS
对象
列表
、
、
、
在SAS中,我希望
将
数字和字符类型以及不同维度的变量数传
递给
用户定义的模块。这可以通过创建
对象
列表并将列表传
递给
模块来实现。例如,在R中,这种
数据
类型被称为"list“。如何在SAS IML中创建任意
对象
的列表?亚历克斯 可选参数的概念在长期内受到限制,因为我需要传递
两个
或更多的参数,而不是15个或更少的参数。names = {A, B, C}; 在一个循环中,我
将
根据名称创建临时
数据</em
浏览 2
提问于2014-12-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券