首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏成员
2149
文章
2148096
阅读量
191
订阅数
独家 | 自动化探索性因素分析(EDA)来更快更好地理解数据
EDA是我们更好地理解数据集的重要方式之一。几乎所有的数据分析和数据科学专家都在产生新观点或者数据建模之前先做EDA。在现实生活中,依赖于数据集的复杂度和完整性,这个过程会花费大量时间。当然,变量越多,我们在下一步开始前就需要探索越多才能获得结论。
数据派THU
2023-11-13
3000
独家 | 17个可以用于工作自动化的最佳Python脚本(下集)
您是否厌倦了在日常工作中做那些重复性的任务?简单但多功能的Python脚本可以解决您的问题。
数据派THU
2023-11-12
1.3K0
独家 | 17个可以用于工作自动化的最佳Python脚本(上集)
您是否厌倦了在日常工作中做那些重复性的任务?简单但多功能的Python脚本可以解决您的问题。
数据派THU
2023-11-12
1.1K0
借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统
本文约2600字,建议阅读5分钟近期,纽卡斯尔大学联合费拉科学有限公司联合开发了一个针对多头奶牛的自动化、实时跛行检测系统。该系统能够按照跛行评分系统将奶牛进行分类,并且准确度高达 94%-100%。目前,该研究成果已发表在《Nature》上。 因口蹄疫等疾病造成的奶牛跛行对畜牧业而言,已成为一个全球性话题。相关科普显示,它不仅会导致奶牛产奶量降低、繁殖效率下降,还会导致奶牛过早地被淘汰。国家动物健康监测服务奶业报告数据显示,奶牛有 16% 的淘汰率是由跛行引起的。 跛行已成为奶牛业面临的主要危机之一,因此
数据派THU
2023-05-18
1820
前沿技术 | 自动机器学习综述
来源:小金博士公众号 本文约5000字,建议阅读10分钟 本文将探索目前可用于自动化过程的框架,以帮助读者了解在自动化机器学习方面可能出现的情况。 自动机器学习综述 自从计算机时代开始,科学家和工程师们就一直想知道如何像人类一样,给计算机注入学习的能力。艾伦·图灵是第一批提出智能理论的科学家之一,该理论设想有一天计算机能够达到与人类同等的智能水平。从那时起,机器学习领域发生了一系列巨大的飞跃。我们已经看到机器学习在许多情况下击败或至少匹配特定的人类认知能力,例如在ResNet(一种深度残留的网络架构)的情况
数据派THU
2023-03-29
9710
干货 | 医疗健康类APP违法违规个人信息收集的自动化检测技术研究
以下内容整理自清华大学《数智安全与标准化》课程大作业期末报告同学的汇报内容。 第一部分:概述 一、研究背景 APP兴起在带给人们便利的同时,也在逐渐蚕食着人们的隐私边界。 与此同时,“互联网+医疗”使得医疗健康类APP兴起。 二、研究目的 本文旨在建构针对医疗健康类APP的自动化违规收集行为的检测技术,帮助人们快速掌握隐私政策文本的主要信息,规避APP违规收集个人信息的行为。 三、研究对象 本文将重点关注医疗健康类APP中的在线问诊类APP,因为其使用人数较多,且相较于其他APP,涉及到的个人信息
数据派THU
2023-03-29
4480
【干货书】工业自动化与机器人技术与应用
来源:专知本文为书籍介绍,建议阅读5分钟这本书集中在自动化和机器人的工业应用。 这本书讨论了由于工业4.0而发生的根本技术变化,重点是提供对第四次工业革命的更好的理解。它还提出了一个详细的跨学科知识的分析,数值建模和仿真,以及应用信息物理系统,其中信息技术和物理设备创建协同系统导致前所未有的效率。 https://www.routledge.com/Industrial-Automation-and-Robotics-Techniques-and-Applications/Kumar-Babu/p/boo
数据派THU
2022-09-07
3720
告别手摇织布机的AI时代
本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处本文约5000字,建议阅读10+分钟AutoML带来的不仅仅是量变,更是产业变革的奇点。 18世纪60年代,当蒸汽机被发明时,绝大多数人并没有意识到“工业革命”的到来; 1946年ENIAC问世时,人们也意识不到,计算机会在半个世纪后,成为支撑社会运转、科技创新的基础设施; 即便是2005年,人们也想象不到无需现金,仅用一部手机就可以解决衣食住行的几乎所有需求;无需单独的相机,也可以随时随地记录身边的点滴。 每当颠覆性技术诞生时,
数据派THU
2022-08-29
1450
【干货书】机器人过程自动化管理,技术,应用
来源:专知本文为书籍介绍,建议阅读5分钟RPA与业务流程管理、机器学习和人工智能有关。 这本书汇集了来自研究和实践的专家。它包括创新机器人过程自动化(RPA)概念的设计,相关研究领域(如人工智能,AI)的讨论,现有软件产品的评估,以及现实生活中实施项目的发现。 类似于制造业中体力工作的替代(蓝领自动化),机器人过程自动化试图用软件机器人代替办公室和管理过程中的智力工作(白领自动化)。RPA开发的起点是观察到——尽管使用了面向流程的企业系统(如ERP、CRM和BPM系统)——额外的手工活动在今天仍然是必不可
数据派THU
2022-07-25
2910
将数学题转化成代码,谷歌这项研究让机器证明的正确率大幅提高
来源:机器之心本文约1700字,建议阅读20+分钟研究者预估,如果达到 100% 的正确率水平,「我们肯定会创造出赢得国际数学奥林匹克金牌的 AI 智能体。」 计算机被用来验证数学证明已经有一段时间了,但它们只有在使用专门设计的证明语言准备问题时才能做到这一点,而无法处理数学符号和数学家使用的书面文本的混合体。 如果把用自然语言编写的数学问题转换为正式代码,让计算机更容易解决它们,或许能够帮助构建能探索数学新发现的机器。 这个过程被称为形式化(formalisation),但仅仅一个证明就可能需要数年的工作
数据派THU
2022-07-19
2690
独家 | 什么是零信任(附链接)
原文:June 7, 2022 by RICK MERRITT 翻译:赵茹萱 校对:王洪菠本文约3300字,建议阅读5分钟事实上,网络中充满了数据,其中很多数据可以被人工智能实时筛选,自动地增强数据的安全性。 互联网时代的复杂性引发了安全漏洞的数字瘟疫。持续不断的数据和身份盗窃催生了一场新的运动和一个现代的口头禅——零信任,这甚至成为美国总统授权的主题。 那么,什么是零信任呢? “零信任是一种网络安全策略,用于验证每个用户、设备、应用程序和交易。零信任意味着,任何用户或流程都不应该被信任。”这一定义来自于
数据派THU
2022-06-17
1.2K0
中国工业机器视觉产业发展白皮书(附ppt)
《中国工业机器视觉产业发展白皮书(2021)》主要聚焦机器视觉在工业领域的应用,包括工业自动化领域的图像传感器,以及基于视觉技术的工业解决方案。白皮书通过行业发展环境、趋势以及市场分析、应用场景分析呈现了工业机器视觉发展状态及发展趋势。
数据派THU
2021-10-19
8880
独家 | 在时间关系数据上AutoML:一个新的前沿
现实世界中的机器学习系统需要数据科学家和领域专家来建立和维护,而这样的人才却总是供不应求。自动化机器学习(AutoML)由于在构建和维护机器学习工作流中的关键步骤中所展现出的广泛适用性,使得该领域的研究前景一片光明。它减轻了人类专家的工作负担,使他们能够专注于复杂、非重复和具有创造性的学习问题。
数据派THU
2019-11-26
8550
独家 | 一文盘点AutoML 库(附PPT等链接)
Jeff Dean在ICML 2019上进行了有关AutoML的演讲,并将自动化分为4个级别:
数据派THU
2019-11-20
6720
不看后悔!2019年人工智能行业的25大趋势
编者按:知名创投研究机构CB Insights调研了25种最大的AI趋势,以预测2019年该技术的下一步趋势,他们根据行业采用率和市场优势评估了每种趋势,并将其归类为必要性、实验性、威胁性、暂时性四类。
数据派THU
2019-05-09
4960
独家 | 用Python Featuretools库实现自动化特征工程(附链接)
本文简要介绍特征工程的基本组成部分,并用直观的示例理解它们,最后给出使用Python Featuretools库实现自动化特征工程的操作过程。
数据派THU
2018-12-11
1.5K0
玩转数据、拥抱智能 | 清华大学大数据能力提升项目宣讲会火热来袭
9月6日晚,由清华大学研究生院和数据科学研究院(以下简称“数据院”)共同举办的大数据能力提升项目新生宣讲会在西阶梯教室成功举行。
数据派THU
2018-09-17
6130
站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办
2018年4月27日,由清华-青岛数据科学研究院主办、清数大数据产业联盟协办的第二届“大数据在清华”高峰论坛于主楼接待厅拉开帷幕。此次论坛以“站立潮头、无问西东”为主题,邀请了清华大学副校长杨斌,中国科学院院士、清华计算机系教授张钹,中国工程院院士、北京清华长庚医院执行院长董家鸿,清华大学法学院院长申卫星教授,清华大学自动化系教授张长水等大数据领域一线的专家学者,以清华1996级电机系校友、百融金服CEO张韶峰为代表的产业界杰出校友,就“自然语言处理、计算机视觉等技术研究”以及“大数据在交通、医疗、金融及司法等领域的应用实践”等主题进行了探讨,共话数据科学的发展、趋势及现状。
数据派THU
2018-07-30
3910
清华大学张长水教授:机器学习和图像识别(附视频、PPT下载)
本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。
数据派THU
2018-07-30
2.2K0
耕耘数据,融合发展——2018年度数据科学研究院RONG教授座谈会成功举办
2018年05月07日,以“耕耘数据、融合发展”为主题的2018年度数据科学研究院(以下简称“数据院”)RONG教授座谈会于双清大厦拉开帷幕。数据院院长俞士纶、副院长王建民、执行副院长韩亦舜出席此次座谈会,与来自不同学院的六位RONG教授齐聚一堂,就数据科学领域的教学及科研工作进行了交流、探讨及展望。
数据派THU
2018-07-30
3660
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档