首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【资料】7篇重要的数据科学论文

【资料】7篇重要的数据科学论文

作者头像
陆勤_数据人网
发布2018-10-08 15:59:37
1.1K0
发布2018-10-08 15:59:37
举报

笔者邀请您,先思考:

1 您阅读过哪些经典的数据科学论文?请留言

这是回到学校的时间,这里有一些论文让你在这个学年忙碌。 所有论文都是免费的。 这份清单远非详尽无遗,但这些是数据科学和大数据方面的一些重要论文。

谷歌搜索

  • PageRank - 这篇论文解释了Google搜索背后的算法。

Hadoop

  • MapReduce - 本论文介绍了处理大数据及的编程模型。 特别是,它是hadoop中使用的编程模型。
  • Google File System - hadoop的一部分是HDFS。 HDFS是论文中解释的分布式文件系统的开源版本。

NoSQL

这些是推动/开始NoSQL的两篇论文。 每篇论文都描述了一种旨在大规模扩展的不同类型的存储系统。

  • Amazon Dynamo
  • Google Bigtable

机器学习

  • 数据挖掘中的10种算法| pdf download - 本文涵盖了一些重要的机器学习算法(确切地说是10个)。
  • 关于机器学习的一些有用的事情 - 本论文充满了提示,技巧和见解,使机器学习更加成功。

Bonus Paper

  • 随机森林 - 最流行的机器学习技术之一。 它在Kaggle比赛中被大量使用,即使是获胜者也是如此。

你觉得还有其他任何文件应该列在名单上吗?

原文链接: http://101.datascience.community/2013/08/26/7-important-data-science-papers/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 谷歌搜索
  • Hadoop
  • NoSQL
  • 机器学习
  • Bonus Paper
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档