鸿之微大数据分析软件 Data Studio,是鸿之微科技推出的面向工业、科学计算领域的数据分析、拟合和可视化软件。融合相关性分析、PCA、LDA 等数据分析方法与挖掘技术,Data Studio 可以实现对数据的清洗、探索性分析、拟合、建模等一系列功能。Data Studio 是探索数据潜在规律的有力工具, 能加快用户数据分析效率,提供快速信息提取、帮助决策分析、指导科学生产与工艺优化等。
拟合功能:
Data Studio 包含强大的线性拟合、多项式拟合、非线性拟合功能、适用于各类基本初等函数,以及相对复杂的 Gaussian 函数、Gamma 函数、Richards 函数等。其内置多种拟合函数,包含针对 2D 模型的11类、68种内置函数,以及针对 3D 模型的7类、25种内置函数。此外,用户可以根据自身需求,新建并保存自定义Python函数并进行数据拟合。拟合过程中,用户选取模型后,可以自定义设置拟合的初始参数,拟合后可以在“详细”页面查看拟合参数、均方误差、相关系数等参数并导出到文件。为便于使用者在近百种函数中迅速找到拟合效果最好的模型,Data Studio 提供的曲线搜索功能可以自动采用所有模型分别对数据进行拟合,并根据拟合的均方误差值对模型优劣进行排序,如图4所示。
图1 数据拟合内置2D函数(动图)
图2 2D 拟合结果展示(动图)
图3 拟合曲线积分计算展示
图4 曲线搜索功能(动图)
数据分析功能:
借助 Data Studio,可以通过检查及删除离群点、检查线性相关性筛选自变量的方式进行数据清洗。利用 Lowess,Savitzky-Golay 算法对曲线光滑处理。并利用小提琴图、多类小提琴图、柱状图等图表分析数据点分布,快速了解数据概况。通过二维散点图、伪 3D 散点图、线性相关性热力图可视化分析数据的相关性。以及利用 PCA,LDA 等方法进行模型的建立和导出。
图5 曲线光滑
图6 相关性分析:a)伪3D散点图、b)线性相关性热力图,数据概况分析:a)小提琴图、b)柱状图
图7 LDA建模
读取曲线数据:
DataStudio 读取图片中的曲线数据功能,手动选择和自动选择数据点。
图8 读取曲线数据
Data Studio功能列表:
曲线拟合,线性拟合、多项式拟合、基本函数拟合、非线性拟合,拟合后可查看拟合参数、均方误差、相关系数等并导出到文件。
曲线搜索,自动采用所有模型分别对数据进行拟合,按均方误差值对模型优劣进行排序。
数据概况分析,小提琴图、多类小提琴图、柱状图、多类柱状图。
离群点分析,Z-Score、LOF(局部异常因子)。
相关分析,二维散点图、伪3D散点图、线性相关性热力图。
自变量筛选,相关系数筛选。
建模,PCA(主成分分析)。
自定义python函数拟合。
读取pdf文件中的表格。
读取图片中曲线数据。
读取Mysql 数据库。
读取mat 格式文件。
Pearson,Spearman,Kendall 相关系数计算。
读取图片中曲线数据自动识别数据点功能。
表格基本操作与运算。
处理数据中空值。
拟合后计算拟合函数值,导数,积分。
LDA降维分析。
计算数据基本统计信息。
曲线光滑功能:Lowess,Savitzky-Golay算法。
14-20为当前版本新增功能。
领取专属 10元无门槛券
私享最新 技术干货