文章/答案/技术大牛

发布

社区首页 >问答首页 >数据预处理库

问数据预处理库
EN

Data Science用户

提问于 2019-01-17 10:15:11

回答 3查看 107关注 0票数 0

我刚开始深造。只有当我需要对神经网络的数据进行预处理时，我才知道什么是科学知识。还有其他好的图书馆吗？

scikit-learn

回答 3

Data Science用户

发布于 2019-01-18 20:00:48

预处理占整个管道的50% .有了更好的数据，您就可以建立更好的机器学习/深度学习模型。但不幸的是，清理数据需要时间和经验。你需要把它想象出来，把你的手弄脏。简而言之，其目的是消除噪音、垃圾和离群点。

Python中有一些非常好的数据可视化库，如：

MatplotLib
海航
GGPlot
Bokeh
PyGal
普洛特利
和更多。

既然您对Scikit学习很满意，正如您在问题中提到的那样，我建议您在scikit学习中查找预处理模块，它包含几个API，例如特征提取、规范化、特性缩放、均值去除、方差缩放、标准化等等。

但是，了解数据、将其可视化为故事并手动、缓慢地清理数据总是更好，而不是通过预定义的框架或管道传递数据。

这些视频：

可能会有帮助。还有更多的更容易获得。祝你好运！

还有，如果我的回答对你有帮助的话，请投我的票。它鼓励社区相互帮助。

票数 1

Data Science用户

发布于 2019-01-17 17:06:35

你可以用毕道尔获得一堆预先训练过的模型

https://pytorch.org/docs/stable/torchvision/models.html

有一门很棒的课程是关于https://www.udacity.com/course/deep-learning-pytorch--ud188的

票数 0

Data Science用户

发布于 2019-01-18 18:43:19

根据您的注释，您可以使用各种库来支持一些预处理，比如处理丢失的值。在头顶上，熊猫是一个非常好的图书馆来做所需的工作。它支持处理丢失的值、编码和许多其他很酷的特性。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/44141

复制

相似问题

问数据预处理库
EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据预处理库EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据预处理库
EN