首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

7篇重要的数据科学论文

笔者邀请您,先思考:

1 您阅读过哪些经典的数据科学论文?请留言

这是回到学校的时间,这里有一些论文让你在这个学年忙碌。 所有论文都是免费的。 这份清单远非详尽无遗,但这些是数据科学和大数据方面的一些重要论文。

谷歌搜索

PageRank- 这篇论文解释了Google搜索背后的算法。

Hadoop

MapReduce- 本论文介绍了处理大数据及的编程模型。 特别是,它是hadoop中使用的编程模型。

Google File System- hadoop的一部分是HDFS。 HDFS是论文中解释的分布式文件系统的开源版本。

NoSQL

这些是推动/开始NoSQL的两篇论文。 每篇论文都描述了一种旨在大规模扩展的不同类型的存储系统。

Amazon Dynamo

Google Bigtable

机器学习

数据挖掘中的10种算法| pdf download - 本文涵盖了一些重要的机器学习算法(确切地说是10个)。

关于机器学习的一些有用的事情 - 本论文充满了提示,技巧和见解,使机器学习更加成功。

Bonus Paper

随机森林- 最流行的机器学习技术之一。 它在Kaggle比赛中被大量使用,即使是获胜者也是如此。

你觉得还有其他任何文件应该列在名单上吗?

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。

平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。

您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。

我们努力坚持做原创,聚合和分享优质的省时的数据知识!

我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180907G1QWIA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券