首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >数据预处理库

数据预处理库
EN

Data Science用户
提问于 2019-01-17 10:15:11
回答 3查看 107关注 0票数 0

我刚开始深造。只有当我需要对神经网络的数据进行预处理时,我才知道什么是科学知识。还有其他好的图书馆吗?

EN

回答 3

Data Science用户

发布于 2019-01-18 20:00:48

预处理占整个管道的50% .有了更好的数据,您就可以建立更好的机器学习/深度学习模型。但不幸的是,清理数据需要时间和经验。你需要把它想象出来,把你的手弄脏。简而言之,其目的是消除噪音、垃圾和离群点。

Python中有一些非常好的数据可视化库,如:

既然您对Scikit学习很满意,正如您在问题中提到的那样,我建议您在scikit学习中查找预处理模块,它包含几个API,例如特征提取、规范化、特性缩放、均值去除、方差缩放、标准化等等。

但是,了解数据、将其可视化为故事并手动、缓慢地清理数据总是更好,而不是通过预定义的框架或管道传递数据。

这些视频:

可能会有帮助。还有更多的更容易获得。祝你好运!

还有,如果我的回答对你有帮助的话,请投我的票。它鼓励社区相互帮助。

票数 1
EN

Data Science用户

发布于 2019-01-17 17:06:35

你可以用毕道尔获得一堆预先训练过的模型

https://pytorch.org/docs/stable/torchvision/models.html

有一门很棒的课程是关于https://www.udacity.com/course/deep-learning-pytorch--ud188

票数 0
EN

Data Science用户

发布于 2019-01-18 18:43:19

根据您的注释,您可以使用各种库来支持一些预处理,比如处理丢失的值。在头顶上,熊猫是一个非常好的图书馆来做所需的工作。它支持处理丢失的值、编码和许多其他很酷的特性。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/44141

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档