开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我在哪里可以找到现有的预先训练的火炬模型？

您可以在以下地方找到现有的预先训练的火炬模型：

PyTorch Hub（https://pytorch.org/hub/）：PyTorch Hub 是一个官方的模型库，提供了各种预先训练的火炬模型。您可以在该网站上搜索您感兴趣的模型，并获取其相关信息、代码和使用示例。
GitHub（https://github.com/）：GitHub 是一个开源代码托管平台，许多研究人员和开发者会在 GitHub 上分享他们的预先训练的火炬模型。您可以通过在 GitHub 上搜索相关关键词，如 "PyTorch models" 或 "pretrained PyTorch models" 来找到这些模型。
Kaggle（https://www.kaggle.com/）：Kaggle 是一个数据科学竞赛平台，许多参赛者会在竞赛中使用预先训练的火炬模型。您可以在 Kaggle 上浏览和下载这些模型，并学习其他参赛者的代码和技巧。
论文和研究论坛：许多研究论文和学术研究论坛会提供预先训练的火炬模型的链接或代码。您可以通过搜索相关领域的论文和论坛，如 arXiv（https://arxiv.org/）或 OpenReview（https://openreview.net/），来找到这些模型。

需要注意的是，以上提到的资源可能包含来自不同作者和组织的模型，因此在使用这些模型时，您需要仔细阅读其相关文档和许可证，确保符合使用规定。

相关搜索:在Google app Engine中我可以在哪里找到我的应用程序的名称？在java文件中，我在哪里可以找到我用蓝色圈出的记号的引用？在NLTK中，我在哪里可以找到ClassifierBasedPOSTagger的所有POS的标签定义？在tensorflow.keras.experimental模型中的哪里可以找到export_saved_model属性？在使用训练-测试拆分后，我是否应该用整个数据集重新训练模型，以找到最佳的超参数？在哪里可以找到维基百科或像谷歌新闻这样的大型文章数据集上的预先训练好的doc2vec模型？在我的系统中哪里可以找到App Engine Maven插件的当前安装版本？我可以删除预先训练好的Keras模型中的层吗？我可以在mxnet上运行使用tensorflow训练的模型吗？我可以在不重新编译的情况下训练复合模型的各个部分吗？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

数字人点燃亚运主火炬，从这篇ICCV论文透视蚂蚁的生成式AI黑科技

作为开幕式的核心创意，数实互联的火炬点燃形式冲上了热搜，引发了人们的重点关注。上亿人参与的数字人点火是一个前所未有的创举，涉及了大量先进且复杂的技术，其中最重要的莫过于如何让数字人「动起来」。...随着工程师不断优化，这项技术在移动端的体验也在变得更好，刚刚结束的亚运火炬线上传递活动就是个很好的例子：想要成为火炬手，我们只需要点开支付宝 App 的小程序。...区块链等多种技术结合，保证了人人都可以成为数字火炬手，参与火炬传递。...另外，开幕式点火仪式后，每位数字火炬手都可以收到一张数字点火专属证书，绘有每位数字火炬手独一无二的形象，这张证书会通过分布式技术存储在区块链上。...智能化交互：基于预训练的音色克隆，支持分钟级音频输入生成个性化数字人音色；并布局基于大模型的数字人交互。

3296 0

2022北京冬奥会开幕式，一场事关元宇宙数字科技与美学创新的大融合

张艺谋认为，从2008到2022，开幕式的内核实现了从“我”到“我们”的升级，要讲全人类共有的精神和理念，构建人类共同体的伟大主题。...在舞台效果呈现中，激光刻刀在冰立方上逐一“雕刻”24届冬奥会的标志，不同的运动主题动态任务逐一出现，而这一环节的背后也融汇了中国传统的水墨艺术。...大雪花来到舞台中央并缓缓升起，火炬手将火炬放置在了大雪花中间的主火炬台。与以往不同的是，最后一棒的火炬手没有去点火，而是直接把手持火炬插接在了主火炬身上，没有引燃的过程实现了火焰的无缝连接。...据了解，这种“默契配合”并非精准排练，而是来自于英特尔3DAT三维运动员追踪技术，它带来了可以让地面的屏幕瞬间对演员位移做出实时反馈并呈现艺术效果的技术方案。...将来，3DAT技术也将被广泛应用于很多领域，特别是在赛场之外为运动员训练提供专业洞察的领域包括健康、理疗、动画、游戏等更多场景。

6291 0

北大视频大模型新SOTA，搞笑抖音视频AI秒懂笑点｜开源

值得注意的是，Video-LLaVA在训练过程中没有使用成对的视频和图片数据，但在训练后，LLM令人惊讶地展现出同时理解图片和视频的能力。...该研究还与InstructBLIP，Otter，mPLUG-owl 等图片语言大模型在图片语言理解任务上进行了比较，结果如表2所示：为了评估预先对齐视觉输入的效果，研究团队进行了大量的对比实验。...有关图6的实验结果显示，与分离的视觉表示相比，联合的视觉表示在4个视频问答数据集上显著提升了性能。这一发现表明，预先对齐的视觉表征有助于LLM进一步学习和理解视频内容。...它提供了更好的能力，使得模型能够更有效地处理视频问答任务并展现出更好的性能表现。同时论文还验证了无论是对于图片还是视频，在联合训练中他们能相互受益。...通过联合训练视频数据，对于图片理解任务，可以缓解幻觉问题。类似的趋势也在LLaVA-Bench基准测试上观察到。在视频理解方面，联合训练的也得到了明显的提升。

1361 0

基于 Keras 对深度学习模型进行微调的全面指南 Part 1

我将借鉴自己的经验，列出微调背后的基本原理，所涉及的技术，及最后也是最重要的，在本文第二部分中将分步详尽阐述如何在 Keras 中对卷积神经网络模型进行微调。首先，为什么对模型进行微调？...另一个问题是，如果我们的数据集很小，那么在小数据集上微调预先训练的网络可能会导致过拟合，特别是如果网络的最后几层是全连接层，就像 VGG 网络的情况。...我们希望保持这些权重的完整。相反，我们将在后面的层中专注于学习数据集中的特殊特征。在哪里找到预训练网络？这要取决于深度学习框架。...找到这些预训练模型的最好方法是用 google 搜索特定的模型和框架。但是，为了方便您的搜索过程，我将在流行框架上的常用预训练 Covnet 模型放在一个列表中。...您也可以在 Twitter 上关注我 @flyyufelix。

1.4K1 0

逆天的语言AI模型来了！编故事以假乱真，问答翻译写摘要都行，横扫各大语言建模任务

在不需要对任何其他任务进行针对性训练的情况下，GPT-2还能完成阅读理解、常识推理、文字预测、文章总结等多种任务，效果好到让人怀疑：这个模型后面单怕藏着一位语文老师吧！语言模型全能王 ?...作为一个没有经过任何领域数据专门训练的模型，它的表现，比那些专为特定领域打造的模型还要好。...从北京开始，火炬将经过六大洲，途经丝绸之路沿线的城市。此次接力还会将火炬送上珠穆朗玛峰，这是接力的最后一站。问题1：接力从哪里开始？问题2：这个地方有什么值得注意的吗？...但在很大程度上，模型还是和GPT一样：使用语言建模作为训练信号，以无监督的方式在大型数据集上训练一个Transformer，然后在更小的监督数据集上微调这个模型，以帮助它解决特定任务。 ?...“不过，它们看上去能用英语交流，我相信这也是一种进化的信号，或者至少也是社会组织的一种变化。”他说。

5622 0

Python 图像处理实用指南：11~12

给定包含一些对象（例如动物、汽车等）的图像，目标是使用预先训练的 YOLO模型和边界框检测这些图像中的对象。...我们可以使用标准的预训练模型，如 VGG16/19、ResNet50 或 InceptionV3 模型（在 ImageNet 上预训练，有 1000 个输出类，可在中找到）https://gist.github.com...使用预先训练的 torch 模型进行 cv2 神经风格转换在本节中，我们将讨论如何使用深度学习来实现神经风格转移*（NST。你会惊讶于我们可以用它生成的艺术图像。...取而代之的是，我们将使用一个预先训练好的火炬模型（火炬是另一个深度学习图书馆），具有特定的图像风格，即梵高的星夜画。...问题使用预先训练的快速 RCNN 和 MobileNet 模型进行实时目标检测。我们使用一个 YOLO v2 预训练模型来实现目标检测。尝试使用 YOLO v3 预先训练的模型来实现对象检测。

1K2 0

技术干货 | 达观数据智能问答技术研究

可以将句子用词袋模型d∈Rn表示，模型中某个词i的权重为 ,其中ci是词i在该句子中出现的次数。...如下面一些句子，高亮的部分是卷积神经识别的核心词，它们是在300维的Max-pooling层向量里的5个最大神经元激活值，回溯找到原始句子中的词组。...在高分辨率层级无共现关系的文本，可能在低分辨率存在更抽象的语义关联。DeepMatch模型借助主题模型反映词的共现关系，可以避免短文本词稀疏带来的问题，并且能得到不同的抽象层级的语义相关性。...通过将问答对以翻译模型进行训练（问题作为原语言，答案作为目标语言），在新来一个问题时，可以在没有任何历史相似问题的情况下得到较接近的答案。...，我们都不知道你们在哪里达观数据很厉害->我们知道通过产生式的翻译模型，即使基于大量的语料训练，很有可能效果还是不够理想，因此经常作为基于规则和检索的问答系统的辅助方式。

1.3K11 0

速速上线，亚运火炬手集合啦！

海报上还会显示你是第几位亚运火炬传递的助力者，每一张都是一份独一无二的亚运数字纪念品哦。...另外也提醒各位火炬手们，在光线明亮情况下拍摄的正面大头照，可以让人脸融合的效果达到最佳哦。同时也感谢超会拍照的海马体照相馆为此次活动提供的支持。...在“杭州第19届亚运会”官方微信，或“都市快报”官方微信里回复关键词“助力”，就能获取活动链接；或在橙柿互动APP的首页，你也可以找到活动的入口。...一张报销单引发的"吐槽大会" | 戳中打工人的爽点，3步就够了 | AI会是考试作弊的终结者吗？| 腾讯云AI「承包了一片海」| 久违了，我我我我的童年照！| 劳模打字人，走出另一条路 | 宝！...| 腾讯混元大模型，向你问好！| 腾讯云AI绘画全新发布：25+风格，5秒生成点击下图可进入「腾讯云AI体验中心」免费体验

2353 0

北京冬奥会“黑科技”起底，看得见的“智能化”来临

AI实时特效团队前期进行了大量的筹备工作，通过几万张照片训练AI模型。这套AI模型具备通用识别的能力，再通过学习现场演员的服装和道具，可以更加精准地识别。...这个效果的实现，需要精确的时间控制，背后是开幕式的一个“时间轴”，所有的设备运动都是跟着时间轴去运转，达到分秒不差，才呈现出整场演出的精彩。此外，冰立方的升降定位也非常有难度。...此外，“主路+环路”备份的高冗余控制系统确保了火炬台播控系统的超高可靠性。...以汉堡包制作为例，智能汉堡机从加热面包、现煎肉饼到配搭生菜、酱汁，全部由烹饪机器人自主完成，汉堡包就像流水线上的产品一样，以统一标准快速生产，每20秒就能做出一个汉堡包，既保证口味，也提升配餐效率。...系统每3秒采集一次体温数据，一旦超过37.3℃，就会自动向防疫人员报警，结合其内置的定位功能，能够方便防疫人员快速找到体温异常的人员。

7071 0

如何用神经网络“寻找威利”

详细过程可参考这里，训练和评估过程也可以在作者的GitHub上找到。准备模型 TensorFlow物体检测API提供了一组性能不同的模型，它们要么精度高，但速度慢，要么速度快，但精度低。...也就是说，与其从头开始训练新模型，不如从预先训练过的模型中获取知识，将其转移到新模型的训练中，这是一种非常节省时间的方法。...作者使用了在COCO数据集上训练过的搭载Inception v2模型的RCNN。该模型包含一个.ckpycheckpoint文件，可以利用它开始训练。...然后就可以开始训练啦。训练 TensorFlow物体检测API提供了一个十分容易上手的Python脚本，可以在本地训练模型。...作者写了几个简单目标定位的脚本，其中find_wally.py和find_wally_pretty.py都可以在他的GitHub上找到，并且运行起来也很简单：或者不过当你在自己的模型或图像上运行脚本时

1K6 0

机器学习（四）通过递归的矩阵向量空间预测组合语义摘要简介方法结果结论

我们的模型为解析树中的每个节点分配向量和矩阵：向量捕获组成部分的固有含义，而矩阵捕获它如何改变相邻单词或短语的含义。这种矩阵向量RNN可以学习命题逻辑的运算符和自然语言的含义。...在这些模型中，单词的含义被编码为从单词及其相邻单词的共现统计中计算出的向量。这些向量已经表明它们与人类对词相似性的判断有很好的相关性（Griffiths et al。2007）。方法 ?...递归矩阵向量模型.png 初始化用预先训练的50维词向量初始化所有的单词向量将矩阵初始化为X=I+ε，其中I�是实体矩阵组合 ?...组合.png 训练我们通过在每个父节点顶部添加一个softmax分类器来训练向量表示，以一种情感分类或一些关系分类 ? softmax.png 其中W label∈R K×n是权重矩阵。...•使用的功能是手动开发的，不一定会捕获该单词的所有功能。结论我们的模型建立在语法上合理的解析树上，可以处理组合现象。我们的模型的主要新颖性是矩阵向量表示与递归神经网络的组合。

8307 0

Uber的一键式聊天智能回复系统

然后，系统会向司机发出前四个最相关的回复，分别是“ 是的，我在路上 ”，“ 抱歉，堵车了 ”，“ 我在您的上车地点 ”，以及“ 请给我打电话“。这是回复检索步骤。...下面的图6使用t-SNE图在二维投影中可视化单词向量。由于它捕获了单词的语义，因此模型可以将相似的单词聚集在一起。...预处理的消息将通过预先训练的Doc2vec模型编码为固定长度的向量表示，之后我们使用向量和意图检测分类器来预测消息的可能意图。...我们还在研究更多特定于Uber的上下文功能，如地图和交通信息，并计划将它们合并到我们现有的模型中。...在高层次上，OCC是一个多回合对话系统的自然应用，因为司机伙伴们和乘客们可以在他们找到对方之前进行多次对话。

9023 0

怎样才能将信息保存10亿年？

其实这还是说那些质量最好的存储器，根据研究，现有的普通量子存储器，有三分之二在五百年内就会坏。...（当时的科技已经可以将人冷冻，所以活个几百年也是常事）政府立刻命令博物馆的研究停下来，转而研究怎样备份现代的重要数据，让它们至少在五个世纪后还能读出来，呵呵……后来，从我这里分出一个研究机构，我们才能继续研究博物馆...可你别说，还真的找到了一亿年前留下来的信息，当然不是人类留下的，是恐龙的脚印。 “研究继续进行，但没有什么进展，科学家们显然已经有了一些结论，但在我面能是欲言又止。...她现在想起来在哪里见过这造型:那是法国先贤祠中的卢梭墓，从墓中就伸出一只这样擎着火炬的手，现在这些灯发出昏黄的弱光，这光不像是电发出的，更像奄奄一息的小火苗。 “孩子，你好像不爱说话。”...程心失神地笑笑说:“哪里，老人家，只是……面对这些我不知该说什么。” 是啊，能说什么呢?

79012 0

揭秘全球刷屏的冬奥开幕式黑科技

开幕式不再只为我去表演，而是为了你去表演，为了大家去表演，文化自信就是表现在这一方面。」从2008到2022，14年过去，本次冬奥开幕式成为展示中国文化自信的最精彩的舞台！...踏着「雪花」，点燃圣火本次开幕式上最受瞩目的，无疑是巨型「雪花」形主火炬台。据报道，这一前所未有的雪花形态主火炬台，无论是整体硬件支撑还是软件系统，均由京东方自主研发设计。...英特尔为此设计开发了多个深度神经网络模型，能够高效检测识别这么多的演员并实时输出他们的运动轨迹数据。 AI实时特效团队前期进行了大量的筹备工作，通过几万张照片训练AI模型。...这套AI模型具备通用识别的能力，再通过学习现场演员的服装和道具，可以更加精准地识别。...最终，由北京电影学院的艺术效果团队基于每个演员的位置在地面实时渲染出艺术特效，同时迅速反馈给LED控制器，有了这种巧妙的配合，观众就可以看到演员们脚下的屏幕与他们默契交互的惊艳效果了。

4191 0

赛尔笔记 | 自然语言处理中的迁移学习(下)

简单：在预训练的模型上添加线性层 ? 更复杂的：将模型输出作为单独模型的输入当目标任务需要预训练嵌入中所没有的交互时，通常是有益的 4.1.2 – 结构：修改模型内部各种各样的原因: ?...主要问题:调整还是不调整(预先训练好的重量)? 不改变预先训练的重量 Feature extraction (预训练的)权重被冻结 ? 线性分类器是在预训练的表示上进行训练的 ?...）微调 k 轮次嵌入层以外的预训练层训练所有层直到收敛 4.2.2 – 优化：学习率主要想法：使用更低的学习率来避免覆盖掉有用的信息在哪里以及在什么时候？...预训练模型的 HuggingFace 仓库大型预先训练模型 BERT, GPT, GPT-2, Transformer-XL 的仓库提供一个简单的方法来下载、实例化和训练PyTorch中预先训练好的模型...开放问题和方向预训练的语言模型的缺点概述：语言模型可视为一般的预训练任务；有了足够的数据、计算和容量，LM可以学到很多东西在实践中，许多在文本中表示较少的东西更难学习预先训练好的语言模型并不擅长

1.2K0 0

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

大型语言模型(llm)是在巨大的文本语料库上训练的，在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在培训结束时被“具体化”。...根据一些人的说法，接触这种新知识可能会导致模型产生幻觉。这是因为模型被训练成生成不以其预先存在的知识为基础的事实(或者可能与模型的先前知识冲突)。...作者详细研究了一个经过微调的模型会发生什么，以及它在获得新知识后的反应会发生什么。他们尝试在微调后对示例进行知识级别的分类。一个新例子固有的知识可能与模型的知识不一致。...所以未知的例子似乎是有害的，但它们的负面影响主要体现在训练的后期阶段。下图显示了数据集示例的已知和未知子集的训练精度作为微调持续时间的函数。可以看出，该模型在较晚阶段学习了未知样例。...并且带有“我不知道”标记的结果可以找到其他策略来克服这些微调的局限性。这项研究是非常有意思，它表明微调的因素以及如何解决新旧知识之间的冲突仍然不清楚。这就是为什么我们要测试微调前和后结果的原因。

1111 0

AI 行业实践精选：利用深度学习识别交通信号灯

这让我的准确率非常快的就达到了90%以上。 Nexar在它的挑战页面中提到，使用 GoogLeNet 框架来微调，准确率可能达到93%。我不能完全确定我哪里做错了，我应该再查一下。...SqueezeNet 模型似乎是一个非常不错的选择，它有一个用 ImageNet 数据库进行训练的预先训练模型，而且 ImageNet 数据库可以很方便地从 Caffe 的 Model Zoo 中获取。...通过重新贴标签，模型的准确率提高情况如下： 93.5% → 94.1% 模型集如果同时使用若干个模型并且取其平均结果，也可以提升精确度。在训练过程中，我对模型集里不同模型的变型做了些实验。...重新训练出来的模型，尽管单独使用时精度较低，但当它与其他预先训练的细调过的模型组合在一起时，精度获得了极大的提升。可能是因为，跟那些预先训练过细调过的模型相比，该模型学习到了更多不同的特征。...模型#1 —— 运用重复采样的方法，预先训练网络在重新贴签的训练集里训练（在修复了真实值的错误之后）。模型基于 SqueezeNet 在 ImageNet 训练后的预先训练的模型进行了细调。

2.6K8 0

GMIS 2017 | 腾讯AI Lab副主任俞栋：语音识别研究的四大前沿方向

这也就是为什么很多研究人员都一直认为要解决这个问题其实只要找到一个非常有效的，从一个序列到另外一个序列转换的模型就可以了。...这样做还有另外一个好处，因为所有的这些人工的 component 都可以去掉了，所以整个的训练流程也就可以缩短。...问题一：在这样的架构下面，有没有更好的模型结构或训练准则，能够比现有的 CTC 或者 Attention 模型更好。...所以在训练过程当中，你无法预先知道是把说话人 A 的声音作为输出 1 的 supervision 还是输出 2 的 supervision。...每次我拿到新的混合语音时，并不预先设定它的 supervision 标签什么样，而是针对当前模型动态地决定当下我的 supervision 应该是什么样。

1.2K8 0

Survey | 生物医学文本挖掘最新进展

而因为深度学习技术可以在没有额外特征工程的情况下以端到端的方式进行训练，所以现在许多学术研究者都致力于将其应用于NER。...PPIs对于理解复杂的疾病机制和设计适当的治疗方法是必不可少的。现有的PPI提取方法有基于规则的和自动的。其中，共现就是基于规则的一种方法。 GPA在精准医学中起着核心作用。...现有的DDI提取方法有基于共现的、基于规则的和机器学习的方法。关系抽取本质上是一个分类问题，可以用经典的有监督机器学习技术来解决。...但如果有足够的训练数据，那一些基本的深度方法如RNN、CNN等都可以用于生物医学路径提取。...目前，已经开发了各种工具使用ABC共现模型来生成假设。例如：从MEDLINE摘要标题中的生物医学术语的共现识别现有的关联、利用全面的文本和结构知识来推断因果假设等等。

1.2K5 0

Win10+Python3.6下Pytorch安装(基于conda或pip)

）库，在机器学习和其他数学密集型应用有广泛应用。...但由于Torch语言采用Lua，导致在国内一直很小众，并逐渐被支持Python的Tensorflow抢走用户。...Pytorch特点及优势 2.1 Pytorch特点 PyTorch提供了运行在GPU / CPU之上，基础的张量操作库; 可以内置的神经网络库; 提供模型训练功能; 支持共享内存的多进程并发（multiprocessing...）; （最大优势）改进现有的神经网络，提供了更快速的方法 - 不需要从头重新构建整个网络，这是由于PyTorch采用了动态计算图（动态计算图）结构，而不是大多数开源框架（ TensorFlow，Caffe...，CNTK，Theano等）采用的静态计算图; 提供工具包，如火炬，torch.nn，torch.optim等; 安装Pytorch Pytorch官网https://pytorch.org/ ?

8843 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭