文章/答案/技术大牛

发布

社区首页 >问答首页 >当使用数据科学时，图形应该是从一个新的数据库生成，还是应该用管道连接起来呢？

问当使用数据科学时，图形应该是从一个新的数据库生成，还是应该用管道连接起来呢？
EN

Stack Overflow用户

提问于 2022-11-30 16:00:59

回答 1查看 37关注 0票数 0

我在数据科学公司工作了三年多了，我仍然不知道所有采用的最佳实践。我的问题是关于建立几个数据库来制作图表。

例如，如果我想要创建一个人口超过50,000居民的图形，我应该进行筛选并创建一个新的数据框架来生成一个图，还是应该通过将操作链接到管道来实现呢？

作为一种良好的实践，我应该创建一个新的数据库，然后制作图表：

pop_top10 <- data %>%
   filter(population > 50000)

或

data %>%
   filter(population > 50000) %>%
   ggplot() +
   geom_bar(aes(x = reorder(city, -population), y = population), stat = 'identity')

当然，这只是一个例子，我希望你能理解这个问题。如果我要制作10个图形，我是否必须制作10个子集？

dplyr

filter

charts

pipe

回答 1

Stack Overflow用户

发布于 2022-11-30 16:38:36

首先是一个database != data.frame。我建议做一些关于数据库是什么的研究。

如果您正在讨论是否要为每个图创建多个特定的数据帧。您可以根据您的参数值构建一个函数来执行筛选/子设置。然后，将子设置的data.frame中的管道输送到ggplot函数中，所有这些函数都位于它自己包含的环境中。这消除了将多个data.frames保存到globalEnv()中的创建。或者，如果子设置的表很重要，则可以将这些表以及它们的情节保存在列表中。

对于“良好实践”，很大程度上取决于您的用例是什么。生成绘图后，需要表中的数据吗？如果没有，则不需要保存一堆data.frames，也不必使用这些data.frames保存一堆绘图。如果我需要制作大量的情节，我通常会把它们添加到一个列表中。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74630727

复制

相似问题

问当使用数据科学时，图形应该是从一个新的数据库生成，还是应该用管道连接起来呢？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当使用数据科学时，图形应该是从一个新的数据库生成，还是应该用管道连接起来呢？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当使用数据科学时，图形应该是从一个新的数据库生成，还是应该用管道连接起来呢？
EN