机器之心报道
机器之心编辑部
参与:路
近日,来自南京航空航天大学的研究者提出并开源了一个用于主动学习的 Python工具包 ALiPy。它不仅提供 20 余种当前最优算法的实现,还支持用户在不同主动学习环境下轻松配置和实现自己的算法。
简介
ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。
特征
模型独立
不限制分类模型的类型。用户可以按需求在 sklearn 中使用 SVM,或者在 TensorFlow 中使用深度模型。
模块独立
用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。
无需继承即可实现自己的算法
对用户自定义函数限制极少。
支持不同设置
支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。
强大的工具
保存和加载中间结果、多线程、分析实验结果等。
快速启动
用户可以通过以下命令启动 ALiPy:
pip install alipy
详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。
实现策略
ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。
如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:
实例查询
Noisy Oracles
不同成本数据集
特征查询