首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

数据“厨师”ETL竞赛:今天的数据能做些什么?

我们提供Slashdot新闻论坛1999年以来的数据。Slashdot(有时缩写为“/.”)是一个社会新闻网站,成立于1997年,主题为科技。...我们开始寻找关于给定产品的客户互动的公开数据,并偶然发现了Slashdot数据集。Slashdot数据集中的用户不是严格意义上的客户; 他们通过社交论坛与特定主题进行交互。...因此,假设谈论产品是谈论通用主题的一个特例,我们决定采用Slashdot数据集进行分析。我们在这里为今天的挑战再次提出这个相同的数据集。...Slashdot数据集收集许多子论坛的帖子和评论,如科幻小说,Linux,天文等。大多数用户使用他们的用户名发文或评论,也有些用户匿名参与。...[qifjorh0z3.png] 图1:SlashDot数据集。左侧为种子帖子的数据; 右侧为相关评论的数据 我们可以从这些数据中提取什么?我们已经知道用户谈论政治。还有什么可能有趣的?

1.7K50
领券