首页
学习
活动
专区
圈层
工具
发布
首页标签数据集成

#数据集成

轻量化、可视化、开放化的数据集成工具

LMArena中文榜大洗牌:国产大模型包揽前列,GPT-4 Turbo跌出百名开外

架构师李哲

就在百度世界大会前夕,全球最具影响力的大模型评测平台LMArena发布的最新排名,让海外开发者社区发出了"Baidu is back?"的惊叹。这份发布于202...

23410

数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”

架构师李哲

当大模型陷入“数据饥渴”,我们是否只能无止境地堆砌算力与语料?新加坡国立大学的最新研究给出了否定答案。本期将深入解读其提出的扩散语言模型(DLM),揭示它如何在...

8910

道路表面缺陷数据集(裂缝/井盖/坑洼)(6000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】

一键难忘

数据集已划分为train、test、val。共计6000张图片,对应标注文件,数据集见文末。

25310

结项报告完整版:Apache SeaTunnel 支持 Flink 引擎 Schema Evolution 功能

Apache SeaTunnel

过去两周,我们对开源之夏活动中表现优异的开发者们进行了简单的采访,初步粗略地了解了一下他们的开发过程和心得体会。今天,我们将通过同学们的完整结项报告,深入了解项...

10010

Apache SeaTunnel 支持 Metalake 开发了!避免任务配置敏感信息暴露

Apache SeaTunnel

今年的开源之夏活动已接近尾声,Apache SeaTunnel 社区的开发者们在经过漫长的开发过程也都收获了自己的成果。上周,我们通过文章《巾帼力量助力 Fli...

10910

面向智慧牧场的牛行为识别数据集(5000张图片已划分、已标注) | AI训练适用于目标检测任务

一键难忘

在现代智慧农业(Smart Agriculture)中,牲畜行为识别是提高养殖效率与动物健康监测的重要环节。牛作为主要的经济牲畜之一,其行为变化往往直接反映健康...

13110

面向智慧牧场的牛行为识别数据集(5000张图片已划分、已标注) | AI训练适用于目标检测任务

一键难忘

在现代智慧农业(Smart Agriculture)中,牲畜行为识别是提高养殖效率与动物健康监测的重要环节。牛作为主要的经济牲畜之一,其行为变化往往直接反映健康...

10610

qData数据中台【商业版】v1.1.10 全新发布:多源数据集成全面升级,清洗规则体系再进化!

吴同

qData 作为新一代智能数据中台,本次 v1.1.10 版本 围绕「多源数据集成」「MongoDB 数据源接入」「清洗规则体系完善」等核心方向进行了重大升级,...

10920

Apache SeaTunnel 9 月动态:多模块修复 + 新功能上线,社区贡献成果亮眼

Apache SeaTunnel

本月,社区 21 位贡献者共同参与了 Apache SeaTunnel 的修复与功能升级,助力数据同步能力提升。

8010

基于表格和文本证据的自动事实核查技术

用户11764306

在事实提取与验证研讨会(FEVER)上,我们将宣布FEVER系列第三届事实核查挑战赛的获胜者。这项挑战延续了2018年的FEVER共享任务和2019年的FEVE...

9410

工业粉尘检测数据集:从数据采集到模型训练(4000 张图片已划分、已标注)| 适用与目标检测

一键难忘

随着工业智能化与安全生产要求的不断提升,粉尘检测逐渐成为环境监测与安全防护领域的重要研究方向。在矿山、工厂、建筑工地等高粉尘场景中,粉尘浓度过高不仅影响生产效率...

19110

AI时代,为什么数据集成平台的价值不降反升?

IT-王大拿

AI时代非但没有削弱数据集成的价值,反而将其从后台支撑推向了战略核心。一个强大、自动化、智能化的数据集成平台,是确保企业AI项目能够高效、规模化落地,并最终产生...

9610

如何判断企业是否需要iPaaS平台?就看这5个集成痛点

IT-王大拿

iPaaS(Integration Platform as a Service)是一种云服务,用于支持云环境内部、云环境与本地部署系统之间以及本地部署系统内部的...

13210

别盲选!如何找到最适合你业务的API管理与集成平台?一文教你精准决策

老刘聊集成

作为一个在系统集成行业干了十几年的技术人,这几年在帮助客户进行平台选型的过程中,关注到了一个十分有意思的问题——许多集成平台都为自己加了API管理的功能,在功能...

15610

数据孤岛不是问题,“数据脏乱差”才是真正障碍, ETL价值重估

用户7966476

在过去十几年里,企业在谈数据时最常提到的一个词是“数据孤岛”。ERP、CRM、OA、SCM……每一个系统都像是一个“烟囱”,数据难以互通,信息共享不足,导致业务...

16110

Syslog日志集成搭建

TurboEx技术分享

搭建一个完整的 syslog → Filebeat → Elasticsearch → Kibana 测试环境,详细的分步骤配置手册,包括 Linux (Fil...

13310

51种语言理解数据集发布与多语言NLU技术突破

用户11764306

MASSIVE数据集包含100万条标注语料,涵盖51种类型学多样语言,包含18个领域、60种意图和55个槽位。该平行数据集的特点是每条语句均提供全部51种语言版...

12010
领券