数据派THU

368 篇文章
68 人订阅

全部文章

用户1269631

干货 | 下一代数据网:数据驱动的云网链一体化(附视频)

本讲座选自清华-青岛数据科学研究院大数据基础设施研究中心特聘研究员刘运渠9月5日在Odaily星球日报 X 36Kr P.O.D大会上所做的题为《下一代数据网:...

331
用户1269631

避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)

本文是老司机给数据科学家新手的一些建议,希望每个致力于成为数据科学家的人少走弯路。

591
用户1269631

玩转数据、拥抱智能 | 清华大学大数据能力提升项目宣讲会火热来袭

9月6日晚,由清华大学研究生院和数据科学研究院(以下简称“数据院”)共同举办的大数据能力提升项目新生宣讲会在西阶梯教室成功举行。

482
用户1269631

收藏 | 应对程序员面试,你必须知道的8大数据结构

瑞士计算机科学家Niklaus Wirth在1976年写了一本书,名为《算法+数据结构=编程》。

400
用户1269631

基于问题导向与成果产出的教学模式:《大数据与城市规划》特色课程

[ 编者按 ]2015年12月,清华大学推出“大数据能力提升项目”,旨在促进大数据人才培养,服务国家大数据发展战略。项目由清华-青岛数据科学研究院(以下简称:数...

673
用户1269631

第一届全国计算社会科学高端论坛在清华大学举行

8月28日至29日,由清华大学社科学院、清华大学计算社会科学平台、清华大学数据科学研究院联合举办的“第一届全国计算社会科学高端论坛”在清华大学召开。来自国内外2...

381
用户1269631

独家 | 初学者的问题:在神经网络中应使用多少隐藏层/神经元?(附实例)

本文将通过两个简单的例子,讲解确定所需隐藏层和神经元数量的方法,帮助初学者构建神经网络。

420
用户1269631

干货 | 只有100个标记数据,如何精确分类400万用户评论?

迁移学习模型的思路是这样的:既然中间层可以用来学习图像的一般知识,我们可以将其作为一个大的特征化工具使用。下载一个预先训练好的模型(模型已针对ImageNet任...

722
用户1269631

独家 | 全解用Python建立能源市场算法交易的机器学习框架(附链接)

人工智能的新突破每天都成为头条新闻。在金融领域,机器学习的广泛运用和强大的应用,客户们并不了解。事实上,很少有像金融行业那样具有深厚历史、清楚明了和结构化数据的...

693
用户1269631

清华“法律数据科研平台”向校内师生开放试运行

为进一步响应学校“跨学科建设”的号召,清华大学社会科学学院刘涛雄教授在清华大学第一届全国计算社会科学高端论坛首次对外透露,作为计算社会科学学科平台的子平台,“法...

562
用户1269631

独家 | 一文读懂PySpark数据框(附实例)

本文中我们将探讨数据框的概念,以及它们如何与PySpark一起帮助数据分析员来解读大数据集。

501
用户1269631

13张动图助你彻底看懂马尔科夫链、PCA和条件概率!

[ 导读 ]马尔科夫链、主成分分析以及条件概率等概念,是计算机学生必学的知识点,然而理论的抽象性往往让学生很难深入地去体会和理解。而本文,将这些抽象的理论概念,...

671
用户1269631

独家 | 一文带你读懂特征工程!

本文描述了一个典型的基于跨行业标准流程的标准机器学习管道,作为数据挖掘行业的标准过程模型。

481
用户1269631

干货 | 纽约大学陈溪: AlphaGo Zero技术演进的必然性(附PPT)

本讲座选自纽约大学助理教授陈溪近日在2018第二届杉数科技AI大师圆桌会上所做的题为《 AlphaGo Zero技术演进的必然性-机器学习与决策的有机结合》的演...

682
用户1269631

独家|一文解读合成数据在机器学习技术下的表现

本文将通过介绍两个分布模型,并运用它们到合成数据过程中,来分析合成数据在不同机器学习技术下的表现。

614
用户1269631

综述 | 近年来深度学习的重要研究成果(附PDF)

本文列举出了近年来深度学习的重要研究成果,从方法、架构,以及正则化、优化技术方面进行概述。

711
用户1269631

教你用Keras和CNN建立模型识别神奇宝贝!(附代码)

在今天博客的最后,你将会了解如何在你自己的数据库中建立、训练并评估一个卷积神经网络。

471
用户1269631

干货收藏 | 计算机学习绝对不能错过的10大网站(内附网站链接)

本文整理出大数据和人工智能领域最实用,质量最高的10大技术网站信息,既可以用于丰富技术知识,也可以用于学术研究。

362
用户1269631

TensorFlow超级指南 | 你能想到的TF教程和资源都在这里

本文涵盖与TensorFlow相关的教程、书籍、工具、求职等的大量信息。尽数资源,应有尽有。

842
用户1269631

用这种方法实现无监督端到端图像分类!

FAIR 的研究者提出了一种为卷积网络进行大规模端到端训练的聚类方法。他们证明了用聚类框架获得有用的通用视觉特征是可实现的。

691

扫码关注云+社区