打开源数据集_开源数据集_车辆开源数据集 - 腾讯云开发者社区

谷歌的工程师们经常被问到这样的一个问题——怎么上手用深度学习做语音识别或其它音频识别，比如关键词或指令？目前，出现了一些很优秀的开源语音识别系统，例如Kaldi，就能把神经系统作为其中的一个模块。但其的高度复杂性，并不适合解决简单问题的指南。更重要的是，对于新手而言，免费、公开可获取到的数据并不多，适合简单的关键词也不是很多。为解决这一问题，谷歌的TensorFlow 和 AIY 团队创建了TensorFlow 和 AIY 团队创建了Speech Commands Dataset，即“语音命令数据

内含教程丨音色克隆模型 GPT-SoVITS，5 秒语音就能克隆出相似度 95% 的声音

RVC 创始人开源了一款音色克隆项目 GPT-SoVITS，仅需提供 5 秒语音样本，便可收获相似度达到 80%~95% 的克隆语音。

您找到你想要的搜索结果了吗？

是的

没有找到

有了这个，做机器学习项目再也不用担心数据集了

业界 | 谷歌开放语音命令数据集，助力初学者利用深度学习解决音频识别问题

选自Google Research 机器之心编译参与：路雪近日，谷歌开放语音命令数据集，发布新的音频识别教程，旨在帮助初学者利用深度学习解决语音识别和其他音频识别问题。语音命令数据集地址：http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz 音频识别教程地址：https://www.tensorflow.org/versions/master/tutorials/audio_recognition 在谷歌，我们经常被问到如何使

011

超算跑模型｜ CLIP 图像文本多模态学习

实验｜Aircloud 算力支持｜幻方AIHPC CLIP(Contrastive Language-Image Pre-Training，以下简称 CLIP) 模型是 OpenAI 在 2021 年初发布的用于匹配图像和文本的预训练神经网络模型，可以说是近年来在多模态研究领域的经典之作。该模型直接使用大量的互联网数据进行预训练，在很多任务表现上达到了目前最佳表现（SOTA）💯。本次我们尝试使用 Google 开源的 Conceptual Captions 数据集来训练 CLIP 模型，并对

七夕女神来我家吹空调发现遥控器找不见了！快用Yolov5训练个目标识别模型并调用手机摄像头找找！

？女神说要来我家吹空调我揉了揉惺忪的双眼，反复确认了多遍，嗯，没有看错！为了给女神一个好的印象，我打算提前打开空调让室内降到一个舒适的温度；可猛然间发现空调遥控器找不见了！这可怎么办？我急中生智：可以用 Yolov5 训练个空调遥控器目标识别模型并调用手机摄像头找找看嘛！事不宜迟，开整！

Hugging Face 大模型评测榜集合收录 OpenCompass！

在过去的半年多里，大语言模型的发展突飞猛进，无论是产业界还是学术界，均取得了丰硕成果。如何量化大模型性能，开源模型与闭源模型的差距有多大，这些都是整个社区都非常关心的话题。然而大模型评测本身也是一项复杂的系统性工程，各类评测榜单的具体标准也是一团迷雾，让人真假莫辩。

使用Labelimg进行数据标注

数据标注是计算机视觉和机器学习项目中至关重要的一步，而使用工具进行标注是提高效率的关键。本文介绍了LabelImg，一款常用的开源图像标注工具。用户可以在图像中方便而准确地标注目标区域，为训练机器学习模型提供高质量的标注数据。LabelImg已经成为研究者和开发者在计算机视觉项目中不可或缺的工具之一。

人工检查，11 个类、97942 个标签，Roboflow 开源自动驾驶数据集可以使用啦

机器学习是通过举例来教计算机算法以执行新任务的过程，但是，ML 模型只能在和它们所训练的数据一样的情况下表现良好。

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

7 月 19 日，Meta 终于发布了免费可商用版本 Llama 2，让开源大模型领域的格局发生了巨大变化。

使用YOLOv5模型进行目标检测！

目标检测是计算机视觉领域的一大任务，大致分为一阶段目标检测与两阶段目标检测。其中一阶段目标检测模型以YOLO系列为代表。最新的YOLOv5在各个数据集上体现出收敛速度快、模型可定制性强的特点，值得关注。本文主要讲解如何从零训练自己的YOLOv5模型与一些重要参数的含义。

CVPR-17：谷歌大规模视频理解 Kaggle 挑战赛，首次加入音频特征

【新智元导读】谷歌昨天发布消息，更新了此前开源的含上万个视频的大规模数据集 Youtube-8M，新的数据集除了标签升级，还首次包含了预计算的音频特征（pre-computed audio features），有助于联合视听（时间）建模。此外，谷歌还联合Kaggle举办了视频理解竞赛，邀请参与者使用Youtube-8M作为训练数据，利用谷歌云机器学习平台构建视听内容分类模型。相关内容会在今年的CVPR会议上作为Workshop 展出。去年9月，我们发布了YouTube-8M数据集，该数据集涵盖上千万个代表

全球最大的第一视角视频数据集开源，取自真实生活，还能提升厨艺

最近，一个有趣的视频数据集开源了，它不仅能助你研究生涯一臂之力，或许还能提升你的……嗯，厨艺。

R环境安装

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。简单来说，R是一门统计计算语言，是一套开源的数据分析解决方案。

Python大数据之pandas快速入门(一)

pandas是用于数据分析的开源Python库，可以实现数据加载，清洗，转换，统计处理，可视化等功能。

PapersWithCode和arXiv再次合作！可一键显示论文使用的数据集

Papers with Code果真是AI领域的学术神器，继去年10月在arXiv上引入代码之后，PaperswithCode和arXiv合作又出新功能啦！

从零开始 Mask RCNN 实战：基于 Win10 + Anaconda 的 MaskRCNN 环境搭建

大名鼎鼎的 Mask RCNN 一举夺得 ICCV2017 Best Paper，名声大造。Mask RCNN 是何恺明基于以往的 Faster RCNN 架构提出的新的卷积网络，实现高效地检测图中的物体，并同时生成一张高质量的每个个体的分割掩码，即有效地目标的同时完成了高质量的语义分割。

多视图几何三维重建实战系列之COLMAP

为了方便大家了解基于多视图立体的三维重建技术，更重要的是能亲手利用开源数据集或者自己采集的影像跑一遍流程，进而对整个流程更为熟悉，本文整理了近年来几种经典的基于传统方法和基于深度学习方法的三维重建技术Pipeline，并详细介绍从多视图影像到深度图估计，再到恢复三维点云的整个过程。

多视图几何三维重建实战系列之COLMAP

低代码开发之开源数据可视化分析平台datagear

DataGear是一款开源免费的数据可视化分析平台，自由制作任何您想要的数据看板，支持接入SQL、CSV、Excel、HTTP接口、JSON等多种数据源。系统基于Spring Boot、Jquery、ECharts等技术开发。

小 Mil 来了！Milvus 智能问答机器人上线

它究竟有什么功能，又是怎么实现的呢？今天我要带大家来了解这个基于 Milvus 的 FAQ 问答机器人-MilMil。

基于yolov4的目标检测_yolov5预训练模型

YOLOv5的代码是开源的，因此我们可以从github上克隆其源码。不得不说GitHub的确是全球最大的男性交友网站，里面的人个个都是人才，yolov5发布才一年左右的时间，YOLOv5就已经更新了5个分支了，分别是yolov5.1-yolov5.5分支。该项目就是利用的yolov5.5分支来作为讲解。

如何借助 JuiceFS 为 AI 模型训练提速 7 倍

海量且优质的数据集是一个好的 AI 模型的基石之一，如何存储、管理这些数据集，以及在模型训练时提升 I/O 效率一直都是 AI 平台工程师和算法科学家特别关注的事情。不论是单机训练还是分布式训练，I/O 的性能都会显著影响整体 pipeline 的效率，甚至是最终的模型质量。

基于PyTorch+YOLOv4的口罩佩戴检测，附数据集

本项目是利用YOLOv4进行口罩佩戴检测，使用PyTorch实现。虽然现在国内疫情基本得到有效遏制，但防控仍不可过于松懈，在一些公共场合佩戴口罩还是必不可少的。基于此，自己做了该项目，后续打算继续改进，争取将其运行到边缘设备上。希望本项目能给疫情常态化防控出一份力，也希望真正的新年早日到来。

基于yolov4的目标检测_yolov3目标检测

0.052秒打开100GB数据？这个Python开源库这样做数据分析

许多组织都在尝试收集和利用尽可能多的数据，以改善其经营方式，增加收入和提升影响力。因此，数据科学家面对50GB甚至500GB大小的数据集情况变得越来越普遍。

爱了！0.052s 打开 100GB 数据，这个开源库火爆了！

【数据使用】3问视觉项目中的数据整理，这点小事你是不是都掌握好了？

大家好，欢迎来到我们的技术专栏《数据使用》，这一个专栏主要讲解在深度学习技术中数据使用相关的内容。

Databricks来搅局了：0门槛克隆ChatGPT，完全开源可随意修改商用

编译｜核子可乐、Tina 全球首个完全开源的大语言模型，性能堪比 GPT3.5！大数据热潮催生了许多成功的公司，例如 Snowflake、Databricks、Splunk 和 Cloudera。现在我们进入了生成式人工智能时代，那么会不会有新的“人工智能和大数据”结合方式？最近，大数据公司 Databricks 就在生成式人工智能领域采取了行动。两周前，该公司发布了一个名为 Dolly 的开源大型语言模型，旨在应对市场对于生成式 AI 及相关应用的旺盛需求，我们可以称之为 Dolly 1.0

皮带撕裂监测识别系统

皮带撕裂监测识别系统通过yolov5网络模型深度学习技术，皮带撕裂监测识别系统自动对运输机皮带状态进行全天候不间断实时检测，皮带撕裂监测识别系统检测到撕裂跑偏时，皮带撕裂监测识别系统立即抓拍告警及时同步信号给运输机停止运输机。YOLOv5是一个在COCO数据集上预训练的物体检测架构和模型系列，它代表了Ultralytics对未来视觉AI方法的开源研究，其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。YOLOv5是YOLO系列的一个延申，可以看作是基于YOLOv3、YOLOv4的改进作品。YOLOv5没有相应的论文说明，但是作者在Github上积极地开放源代码，通过对源码分析，我们也能很快地了解YOLOv5的网络架构和工作原理。

Weka机器学习平台的迷你课程

机器学习是个非常吸引人的研究领域，但是您怎么把它真正地应用到您自己的问题上呢？

【工具】安利 3 个 pandas 数据探索分析神器！

EDA是数据分析必须的过程，用来查看变量统计特征，可以此为基础尝试做特征工程。东哥这次分享3个EDA神器，其实之前每一个都分享过，这次把这三个工具包汇总到一起来介绍。

安利3个Python数据分析EDA神器！

轻松完成700多条指令、成功率达97%！谷歌开源机器人领域transformer

机器之心报道编辑：杜伟、陈萍谷歌机器人团队等在机器人领域构建了一个多任务 transformer 模型，显著改进了对新任务、环境和对象的零样本泛化。我们知道，机器学习（ML）多个子领域（如 NLP 和 CV）的最新重大进展通过一种共享的通用方法实现，该方法充分利用大规模、多样化数据集以及有效吸收所有数据的表达模型。尽管已经有各种尝试将这种方法应用于机器人技术，但机器人还没能利用到高性能模型。构成挑战的因素有几个。首先缺乏大规模和多样化机器人数据，这限制了模型吸收广泛机器人经验的能力。数据收集对于机器

一网打尽“小黄图”！手把手教你造一只AI鉴黄神器（内附代码及数据集）

机器学习和深度学习发展到了今天，造出的AI已经可以在下棋方面狂虐人类。设计个识别不雅图片的算法也不难实现。

ImageNet零样本准确率首次超过80%，地表最强开源CLIP模型更新

虽然ImageNet早已完成历史使命，但其在计算机视觉领域仍然是一个关键的数据集。

ImageNet零样本准确率首次超过80%，地表最强开源CLIP模型更新

---- 新智元报道编辑：LRS 【新智元导读】开源模型OpenCLIP达成ImageNet里程碑成就！ ‍ ‍ 虽然ImageNet早已完成历史使命，但其在计算机视觉领域仍然是一个关键的数据集。 2016年，在ImageNet上训练后的分类模型，sota准确率仍然还不到80%；时至今日，仅靠大规模预训练模型的zero-shot泛化就能达到80.1%的准确率。最近LAION使用开源代码OpenCLIP框架训练了一个全新的 ViT-G/14 CLIP 模型，在 ImageNet数据集上，原版O

OmniSci GPU 数据库提升了庞大的数据集

参考链接： Python | 使用XlsxWriter模块在Excel工作表中绘制甜甜圈图

一分钟跑出 AI 图像的生成平台

Stability AI 最近推出了一个名为 StableStudio 的 AI 图像生成平台，这是一个开源的、基于社区驱动的平台，任何人都可以访问和使用。StableStudio 提供了一系列功能强大的工具和库，包括预训练模型、数据集、模型评估和调试工具等，可以帮助开发者快速构建和训练高质量的图像生成模型。

安利 3 个 pandas 数据探索分析神器！

手把手教你搭建 ELK 实时日志分析平台

本篇文章主要是手把手教你搭建 ELK 实时日志分析平台，那么，ELK 到底是什么呢？

一分钟跑出 AI 图像的生成平台

击败ChatGPT？OpenChat霸榜斯坦福AlpacaEval开源榜首，性能高达105.7%

一夜之间，全新开源模型「OpenLLM」击败ChatGPT的消息，在网上引起轩然大波。

小数据福音！BERT 在极小数据下带来显著提升的开源实现

本文授权转载自学术平台 PaperWeekly，公众号ID：paperweekly

Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集

李林编译整理量子位报道 | 公众号 QbitAI Google今天推出了一个语音指令数据集，其中包含30个词的65000条语音，wav格式，每条长度为一秒钟。这30个词都是英文的，基本是yes

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐