首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NLP 民工的乐园

中文谣言数据: github[38] 该数据文件中,每一行为一条json格式的谣言数据,字段释义如下: rumorCode: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。...任务型对话英文数据集: github[97] 【最全任务型对话数据集】主要介绍了一份任务型对话数据集大全,这份数据集大全涵盖了到目前在任务型对话领域的所有常用数据集的主要信息。...中文NLP数据增强(EDA)工具 github[156] [ ] 英文NLP数据增强工具 github[157] [ ] 一键中文数据增强工具 github[158] 104....中文全词覆盖BERT及两份阅读理解数据 github[176] DRCD数据集由中国台湾台达研究院发布,其形式与SQuAD相同,是基于繁体中文的抽取式阅读理解数据集。...新冠肺炎相关数据 新冠及其他类型肺炎中文医疗对话数据集 github[343] 清华大学等机构的开放数据源(COVID-19)github[344] 278.

1.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

「PowerBI」从数据民工数据白领蜕变之旅(一)-工具总览

在人人都是数据分析师的时代,没有哪个人哪个岗位可以和数据脱钩。...数据分析的前提是有干净完整规范的数据存在,为了这个前提,许多人活在数据民工的状态(天天搬砖干苦累活),将大量的时间耗费在一些无意义的、没价值的、产出低的数据处理中。...为了得到一个能够使用的数据源,需要有一个数据准备的过程,此过程专业一点来说,是数据ETL的过程(Extract 抽取,Transfrom转换、Load加载),在拿到最初的数据源用作数据分析时(甚至有时还要自己准备去做好模板去分发供生产数据环节使用...Excel催化剂现有的100+功能中,起码有90+的功能是为了服务数据ETL部分的,相信在Excel催化剂的这一系列辅助功能的支持下,数据民工的状态将得到非常大的改善。...结语 时代在进步,人的能力也被重新要求,在数据领域,数据ETL的本领的掌握,能够帮助我们从数据民工式的繁重工作中得以解脱出来,换来的是我们通过脑力的劳动,学习先进的工具,更轻松地完成数据加工、整理、处理等工作

1.7K10

聊聊通常构建数据指标体系,告别数据初级民工

“没有一套合理的数据指标体系,纵然你有再多的数据,分析起来根本无从下手。”做数据分析时的你是否深有同感?...因此今天我会先讲解如何构建数据指标体系,接着再谈谈数据分析方法,从这两方面分享我所掌握的数据分析有关的知识。 ? 首先是数据指标体系。...在我们日常的工作、项目中,往往已经有了一套成熟的指标体系,一般用不着我们去从零开始构建数据指标体系,但这并不意味着我们不需要这项能力,因为这是区分你和广大“数据民工”的关键所在。...下面,我把数据指标体系的构建过程分成三步: 一、分析数据组成 二、明确核心指标 三、构建数据模型 如果还想了解详细的知识和数据分析相关干货,我刚好为大家争取到一个福利,现在你可以免费报名网易云课堂的《...网易直播课内容详情 1月19日 20:00&职场晋升必备: 制作酷炫报表,4步带你学习数据可视化 场景工具:用Tableau学习如何管理数据 流程处理: 利用业务拆解找到数据指标、进行数据可视化 学习成果

50410

精读《民工叔单页数据流方案》

早期前端是没有数据流概念的,因为前端非常薄,每个页面只要展示请求数据,不需要数据流管理。...这次我们来看看民工叔徐飞在 QConf 分享的主题:单页应用的数据流方案探索。...3 精读 一切技术都要看业务场景,民工叔的 单页应用数据流方案 解决的是重前端的复杂业务场景,虽然现在前端几乎全部单页化,但单页也不能代表业务数据流是复杂的,比如偏数据展示型的中台单页应用就不适合使用这套方案...数据存储方式按照视图形态来,因为视图之间几乎毫无关联,而且特别是数据产品,后端数据量巨大,把数据处理过程搬到前端是不可能的(为了推导出一个视图形态数据,需要动辄几GB的原始数据运算,存储和性能都不适合在前端做...分形的优点 分形保证了两点: 组件和数据流融为整体,与外部数据流隔离,甚至将数据处理也融合在数据管道中,便于调试。 便于组件复用,因为数据流作为组件的一部分。

32510

为什么“高大上”的算法工程师变成了数据民工

实际中的算法工程师:提出假设->收集数据->预处理->预处理->训练模型->调试->调试->重新收集数据->预处理->收集更多数据->调试->调试->调试->…->放弃。...为什么“高大上”的算法工程师实际上是个数据民工,要寻找这种理想与现实的差距的原因,首先要理解一个事实:只有人能够理解数据,机器不能。...从“IT精英”到“IT民工”或者“码农”,这种称呼上的转变并非笑谈,而是真实的反应了计算机编程领域门槛逐步降低的过程。...所以,我们应当给听上去高大上的“算法工程师”或者“数据科学家”起一个类似的外号,比如“数据民工”、“机农”或者“蒜农”之类,以免不明真相的孩子们被“高大上”的称号吸引而误入歧途。...天朝的程序员们有一种矛盾心态,一方面自称“民工”,认为编程是一种只适合30岁之前的年轻人从事的体力劳动,而另一方面却又把技术看的非常重要,甚至在业余时间也喜欢大谈技术,或者以攻击其他程序员使用的技术为乐

2.2K90

数据ETL」从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典

而此插件凝聚了笔者在数据分析领域中数据ETL部分的绝大部分的场景,并让这些场景可以低门槛化让几乎只需入门级的Excel用户即可学习掌握。...在此数据ETL专题的系列中,我们一起来重温此经典,同时也让后关注者可以有更好地导读性指引。...例如本以为不太重要的地理数据采集中的两点路径规划功能,最终却是企业项目里最刚需的功能。...结语 本篇主要给大家重温Excel催化剂插件在数据ETL方面的作用和价值,在中小型数据规模下,和一些日常部门级别的数据处理、分析需求上,非常多的功能可完全匹配到位,无需成为一个多高级的Excel用户,一样可以在...笔者未来聚焦在数据领域的分享,不限于Excel,会分享更多Sqlserver、dotNET、Azure、PowerBI等话题,升级数据分析的能力,欢迎继续关注。*

33040

【AI的正面与侧面】披着光鲜的外衣的“数据民工

人工智能需要数据,高质量的标注数据决定了一家人工智能公司竞争力。通常来说,数据标注得越准确、数量越多,算法模型的效果就越好,自然产品的体验也会更近一步,然而这么多结构化数据哪里来?...于是有种产业叫数据工厂。 ? 眼下这些数据工厂业务大多是标注数据,即根据项目方要求,人工为图片、视频和语音内容打标签、做标记。...小编曾采访过一家专业的数据加工平台,旗下有12家下辖数据工厂及2000余名数据操作员来支持数据的采集、清洗、标记等产品化服务。...与专业的数据标注公司业务类似的还有数据众包平台,以百度众包平台为例,号称是有10000+名专职外场数据采集员,5000+在线数据标注人员。...而在产业链的最底层是更为现实的一面,一批批身份各异,从未被提起的人们成为了新时代的数据民工。人工智能,仍需要大量的人工劳动给养,其实并不高大上。

1.1K50

数据ETL」从数据民工数据白领蜕变之旅(五)-使用dotNET脚本实现SSIS无限扩展

,给大家带来在SSIS环境下调用百度AI接口,让非结构化的数据转换为可分析的结构化数据供下游Excel、PowerBI等分析工具使用。...最后我们回到数据库中可发现,已经从我们Excel的两列数据,经过转换后,生成了其他四列的数据。此时我们已经完成了从非结构化的文本评论数据,转变为可分析的情感倾向的分析。...* 系列文章 从数据民工数据白领蜕变之旅(一)-工具总览 https://www.jianshu.com/p/2bd3f90206ec 从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典 https...://www.jianshu.com/p/cb89929bb8ae 「数据ETL」从数据民工数据白领蜕变之旅(三)-除了Excel催化剂之外PowerQuery值得期待 https://www.jianshu.com.../p/d154b09c881d 「数据ETL」从数据民工数据白领蜕变之旅(四)-有了PowerQuery还需要SSIS吗?

2.2K10

数据ETL」从数据民工数据白领蜕变之旅(六)-将Python的能力嫁接到SSIS中

目标我们存到关系数据库中,这样数据的二次利用才更方便,并且数据库的存储数据量也可以得到保障。 最终我们的数据流任务如下图,增加加载时间,方便后期审核。...* 系列文章 从数据民工数据白领蜕变之旅(一)-工具总览 https://www.jianshu.com/p/2bd3f90206ec 从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典 https...://www.jianshu.com/p/cb89929bb8ae 「数据ETL」从数据民工数据白领蜕变之旅(三)-除了Excel催化剂之外PowerQuery值得期待 https://www.jianshu.com.../p/d154b09c881d 「数据ETL」从数据民工数据白领蜕变之旅(四)-有了PowerQuery还需要SSIS吗?...https://www.jianshu.com/p/7ca5a3785bd0 「数据ETL」从数据民工数据白领蜕变之旅(五)-使用dotNET脚本实现SSIS无限扩展 https://www.jianshu.com

3K20

数据ETL」从数据民工数据白领蜕变之旅(四)-有了PowerQuery还需要SSIS吗?

其实,对某些数据ETL它是有缺陷的,例如不能扩展性地使用正则表达式处理字符串数据; 最后,它很大的弊端是目标数据只能进入到PowerPivot层面,不能回到关系型数据库这样更友好的数据存储区,数据处理好...控制流中的数据流任务,可以再嵌套一个循环结构的容器,就变成批量执行某个数据流任务单元了,例如抽取某个文件夹下的所有Excel文件数据数据库中,使用循环容器,就可以将任务分解成循环执行【Excel文件抽取数据数据库...首先,拖一个数据流任务出来。 双击数据流任务,或直接切换到数据流选项卡中,来到数据流任务的设计界面。...* 系列文章 从数据民工数据白领蜕变之旅(一)-工具总览 https://www.jianshu.com/p/2bd3f90206ec 从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典 https...://www.jianshu.com/p/cb89929bb8ae 从数据民工数据白领蜕变之旅(三)-除了Excel催化剂之外PowerQuery新物种同样值得期待 https://www.jianshu.com

3.4K20

新生代 IT 农民工:月均收入 10571 元

2021年8月16日,《2020年北京市外来新生代农民工监测报告》发布,为了进一步做好农民工服务工作,了解外来农民工在京工作、生活需要,国家统计局北京调查总队在全市范围开展了农民工市民化进程动态监测调查...2020年监测数据显示,新生代农民工占比达到50.1%,男性占比高于女性。新生代农民工中男性占比为66.3%,比上年提高4.6个百分点;男性占比高于女性32.5个百分点,比上年提高9.1个百分点。...2020年北京市外来新生代农民工监测报告 为了进一步做好农民工服务工作,了解外来农民工在京工作、生活需要,国家统计局北京调查总队在全市范围开展了农民工市民化进程动态监测调查,2020年监测数据显示,新生代农民工...31-40岁农民工占比提高。新生代农民工平均年龄31.4岁,比上年增加0.4岁。...2.“90后”农民工收入略高 调查样本中,“90后”农民工月均收入6424元,比新生代农民工群体平均水平高210元。

22520

新生代农民工需要懂的策略设计模式

这几天朋友圈被“新生代农民工”刷屏了,看到有这样一张截图: 新生代农民工正名 代码里写了约 30 个 if else 逻辑,从程序语义以及程序效率理论上是会有一定的影响,最主要的是可能会被其他“新生代农民工...”嘲笑 一位经验老道的民工则会用一手 switch case 或策略模式来重构代码,那么什么是策略模式呐?...六、总结 策略设计模式让各种算法的代码、内部数据和依赖关系与其他代码隔离开来。不同客户端可通过一个简单接口执行算法,并能在运行时进行切换。...当然在设计实现程序功能的时候,如果需要使用策略设计模式,也更需要我们的工程师有一个功能全局把控的能力,才能更好将依赖关系拆分,抽象化,以此才能凸显“新生代”民工的不同!

18330

数据民工,也能移动办公了:目标检测标注App上线Google Play,分分钟创建私人数据

白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要快速建立目标检测模型,建立自己私人数据集吗? 现在用手机就可以做到。...你可以随时随地,分分钟创建目标检测数据集。 不需要再像之前那样先拍照、再上传到电脑,最后标注等冗杂的步骤,现在一个手机就可以搞定。 ?...创建数据集,通常来讲,主要包括3个步骤: 1、收集图像 2、注释图像 3、下载注释 基于此,这个名为ManthanoAI的团队就开发了这款工具,目前可以在Google Play上免费下载。 ?...创建步骤 创建数据集的第一步——上传图像。就跟平常的App一样,要么直接拍照,要么从相册中提取。 拍照之后,就直接储存在了这个界面上。 ? 接下来就到了「注释图像」的阶段。 ?...这样,你的私人数据集就完成了。 ManthanoAI团队 ? 这个团队总部设在瑞士,有两位创始人,Anes Prasovic和Marc Willhaus,他们分别获得理学和工学硕士学位。

35540

数据ETL」从数据民工数据白领蜕变之旅(七)-将Excel(PowerQuery+VBA)的能力嫁接到SSIS中

* 系列文章 从数据民工数据白领蜕变之旅(一)-工具总览 https://www.jianshu.com/p/2bd3f90206ec 从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典 https...://www.jianshu.com/p/cb89929bb8ae 「数据ETL」从数据民工数据白领蜕变之旅(三)-除了Excel催化剂之外PowerQuery值得期待 https://www.jianshu.com.../p/d154b09c881d 「数据ETL」从数据民工数据白领蜕变之旅(四)-有了PowerQuery还需要SSIS吗?...https://www.jianshu.com/p/7ca5a3785bd0 「数据ETL」从数据民工数据白领蜕变之旅(五)-使用dotNET脚本实现SSIS无限扩展 https://www.jianshu.com.../p/8de014b1f957 「数据ETL」从数据民工数据白领蜕变之旅(六)-将Python的能力嫁接到SSIS中 https://www.jianshu.com/p/033342b02dae

4.5K20

数据ETL」从数据民工数据白领蜕变之旅(三)-除了Excel催化剂之外PowerQuery新物种同样值得期待

在自助式BI时代以前,Excel级别的数据ETL工作,非常低效,动不动就要启用VBA来完成一些常见的需求,自带的原生功能,未能满足大量的繁琐数据ETL刚需功能。...PowerQuery一个很深入的集成性在于,其数据加载的过程中,原生地开发其以Excel智能表的形式加载出来,并且以数据连接的方式和源数据和加工过程相连接,所以非常好的体验在于数据源更新后,只需刷新一下结果表即可按原来配置过的逻辑对数据进行更新...在第三方插件中,这个过程肯定需要重新在界面上重来一遍,所以重复性逻辑数据更新还是压倒性地好于第三方插件。...笔者未来聚焦在数据领域的分享,不限于Excel,会分享更多Sqlserver、dotNET、Azure、PowerBI等话题,升级数据分析的能力,欢迎继续关注。...* 系列文章 从数据民工数据白领蜕变之旅(一)-工具总览 https://www.jianshu.com/p/2bd3f90206ec 从数据民工数据白领蜕变之旅(二)-重温Excel催化剂经典 https

1.2K20

新时代前端农民工应该怎么准备面试(二)

const { code } = generate(ast); // code: var a = 1; console.log('code: ', code); 如果你想了解上述输入源对应的 AST 数据或者尝试自己编译...在浏览器或者服务的文件系统中运行 ES6 代码时,需要解析所有的模块文件,然后将模块转换成 Module Record 数据结构,具体如下图所示: 事实上, ES Module 的加载过程主要分为如下三个阶段...运行(Evaluation):运行代码,给内存地址填充运行时的模块数据。...和绑定每一个导出变量对应的内存地址(从上图可以发现值还没有被填充,而 function 则可以在链接阶段进行初始化),导入同样对应的是导出所对应的同一个内存地址,因此对导入变量进行处理其实处理的是同一个引用地址的数据...1 console.log(e); }, 2e3); })(); })(); 可以发现 CommonJS 规范在编译后会缓存模块的信息,从而使得下一次将从缓存中直接获取模块数据

74110

Google 发布 Cloud AutoML 降低机器学习门槛,调参民工前景堪忧

2017 年,我们推出了 Google Cloud Machine Learning Engine,它可以帮助那些具有机器学习专业知识的开发人员,轻松构建适用于任何类型数据的ML模型。...Google Cloud 旗下的 Kaggle 竞赛,是专为数据科学家和ML研究人员建立的社区,目前已经有超过一百万的成员。...对于指定任意数据,特定需求, AutoML Vision 能够将数据转换为定制的高质量的ML模型。...Urban Outfitters 的数据科学家 Alan Rosenwinkel 说:“我们一直试图向客户提供精准的商品推荐、筛选和搜索服务。这时,创建并维护一套完整的产品属性就显得非常重要。...原本这些设备拍下的数据需要大量的人力进行分析和标注,比如这个是大象、那个是狮子、那个是长颈鹿。

1.1K40
领券