我刚开始深造。只有当我需要对神经网络的数据进行预处理时,我才知道什么是科学知识。还有其他好的图书馆吗?
发布于 2019-01-18 20:00:48
预处理占整个管道的50% .有了更好的数据,您就可以建立更好的机器学习/深度学习模型。但不幸的是,清理数据需要时间和经验。你需要把它想象出来,把你的手弄脏。简而言之,其目的是消除噪音、垃圾和离群点。
Python中有一些非常好的数据可视化库,如:
既然您对Scikit学习很满意,正如您在问题中提到的那样,我建议您在scikit学习中查找预处理模块,它包含几个API,例如特征提取、规范化、特性缩放、均值去除、方差缩放、标准化等等。
但是,了解数据、将其可视化为故事并手动、缓慢地清理数据总是更好,而不是通过预定义的框架或管道传递数据。
这些视频:
可能会有帮助。还有更多的更容易获得。祝你好运!
还有,如果我的回答对你有帮助的话,请投我的票。它鼓励社区相互帮助。
发布于 2019-01-17 17:06:35
你可以用毕道尔获得一堆预先训练过的模型
https://pytorch.org/docs/stable/torchvision/models.html
有一门很棒的课程是关于https://www.udacity.com/course/deep-learning-pytorch--ud188的
发布于 2019-01-18 18:43:19
根据您的注释,您可以使用各种库来支持一些预处理,比如处理丢失的值。在头顶上,熊猫是一个非常好的图书馆来做所需的工作。它支持处理丢失的值、编码和许多其他很酷的特性。
https://datascience.stackexchange.com/questions/44141
复制相似问题