鸿之微大数据分析软件Data Studio,是鸿之微科技推出的面向工业、科学计算领域的数据分析、拟合和可视化软件。
融合相关性分析、PCA、LDA等数据分析方法与挖掘技术,Data Studio可以实现对数据的清洗、探索性分析、拟合、建模等一系列功能。Data Studio是探索数据潜在规律的有力工具, 能加快用户数据分析效率,提供快速信息提取、帮助决策分析、指导科学生产与工艺优化等。
01
拟合功能
Data Studio包含强大的线性拟合、多项式拟合、非线性拟合功能、适用于各类基本初等函数,以及相对复杂的Gaussian函数、Gamma函数、Richards函数等。其内置多种拟合函数,包含针对2D 模型的11类、68种内置函数,以及针对3D模型的7类、25种内置函数。此外,用户可以根据自身需求,新建并保存自定义Python函数并进行数据拟合。拟合过程中,用户选取模型后,可以自定义设置拟合的初始参数,拟合后可以在“详细”页面查看拟合参数、均方误差、相关系数等参数并导出到文件。为便于使用者在近百种函数中迅速找到拟合效果最好的模型,Data Studio提供的曲线搜索功能可以自动采用所有模型分别对数据进行拟合,并根据拟合的均方误差值对模型优劣进行排序,如图4所示。
图1 数据拟合内置2D函数(动图)
图2 2D 拟合结果展示(动图)
图3 拟合结果分析展示
图4 曲线搜索功能(动图)
02
数据分析功能
借助Data Studio,可以通过检查及删除离群点、检查线性相关性筛选自变量的方式进行数据清洗。利用Lowess,Savitzky-Golay算法对曲线光滑处理。并利用小提琴图、多类小提琴图、柱状图、等高线图等图表分析数据点分布,快速了解数据概况。通过二维散点图、伪3D散点图、线性相关性热力图可视化分析数据的相关性。以及利用PCA,LDA等方法进行模型的建立和导出。
图5 等高线图与填充等高线图
图6 相关性分析:a)伪3D散点图、b)线性相关性热力图,
数据概况分析:c)小提琴图、d)柱状图
图7 PCA建模
03
读取曲线数据
Data Studio读取图片中的曲线数据功能,手动选择和自动选择数据点。
图8 读取曲线数据
04
Data Studio功能列表
1. 曲线拟合,线性拟合、多项式拟合、基本函数拟合、非线性拟合,拟合后可查看拟合参数、均方误差、相关系数等并导出到文件。
2. 曲线搜索,自动采用所有模型分别对数据进行拟合,按均方误差值对模型优劣进行排序。
3. 数据概况分析,小提琴图、多类小提琴图、柱状图、多类柱状图。
4. 离群点分析,Z-Score、LOF(局部异常因子)。
5. 相关分析,二维散点图、伪3D散点图、线性相关性热力图。
6. 自变量筛选,相关系数筛选。
7. 建模,PCA(主成分分析)。
8. 自定义python函数拟合。
9. 读取pdf文件中的表格。
10. 读取图片中曲线数据。
11. 读取Mysql 数据库。
12. 读取mat 格式文件。
13. Pearson,Spearman,Kendall 相关系数计算。
14. 读取图片中曲线数据自动识别数据点功能。
15. 表格基本操作与运算。
16. 处理数据中空值。
17. 拟合后计算拟合函数值,导数,积分。
18. LDA降维分析。
19. 计算数据基本统计信息。
20. 曲线光滑功能:Lowess,Savitzky-Golay算法。
21.绘制折线图,双Y轴折线图,累积折线图,堆积面积图功能。
22. 绘制饼图,柱状图,堆积柱状图,百分比柱状图功能。
23. 绘制等高线,填充等高线功能。
24. 绘制多功能散点图功能。
25. 线性插值,拉格朗日插值,埃尔米特插值,二次样条插值,三次样条插值功能。
21-25为当前版本新增功能。
领取专属 10元无门槛券
私享最新 技术干货