首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

第9章:生物力学中的机器学习-增强人体运动分析 《体育、运动与健康领域的人工智能》

1

主要内容介绍

1. 生物力学与机器学习概述

生物力学研究背景

• 生物力学通过跨学科研究方法,对人体运动进行建模、模拟和分析,以预防损伤、治疗疾病和提高性能。传统的实验室测量系统(如红外相机、测力板和肌电图)虽精确但昂贵且受限,可穿戴传感器(如惯性测量单元)近年来得到广泛应用,虽存在挑战,但能在自然环境中长时间研究人体运动。

机器学习基础

• 机器学习是人工智能的一个子领域,包含监督学习、无监督学习和强化学习三种范式。监督学习用于预测离散类别(分类)或连续值(回归);无监督学习用于发现数据中的模式和关系,包括降维和聚类;强化学习通过智能体与环境的交互学习最优行动。

本文由郭佰鑫(Max)翻译,作者联系方式放在文末了,有任何问题欢迎留言,每一条都会看的

2. 监督学习在生物力学中的应用

分类

基础与应用:在生物力学中,分类算法将高维数据组织成有意义的组或类,如对肌肉激活模式进行分类以评估膝关节损伤后的神经肌肉控制缺陷。常用算法包括决策树、支持向量机和人工神经网络等。

示例研究:Christian等人利用支持向量机对急性前交叉韧带损伤患者的步态模式进行分类,通过主成分分析和递归特征消除提取特征,训练线性支持向量机区分受伤和健康组,分类准确率达100%,还引入了分类器导向的步态评分来评估步态质量,治疗后受伤组步态评分提高。

回归

基础与应用:回归算法用于预测连续数值,通过学习标记数据集中的关系,对生物力学变量进行预测。不同的回归算法适用于不同复杂程度的运动,如线性回归适用于简单运动,而更复杂的算法适用于步态预测。

示例研究:Stetter等人使用人工神经网络基于可穿戴传感器数据预测运动中的膝关节力,通过对参与者在多种运动中的数据进行训练,评估结果显示垂直膝关节力的预测效果良好。

3. 无监督学习在生物力学中的应用

降维

基础与应用:降维算法旨在减少数据集中的特征数量,同时保留关键信息。在生物力学中,主要应用于将高维生物力学数据简化为有意义的运动协同,以及作为机器学习模型开发中的特征工程步骤。

示例研究:Trudeau等人将主成分分析和支持向量机相结合,评估不同跑鞋对足底负荷的影响。通过主成分分析提取足底负荷特征,然后使用支持向量机确定不同鞋款条件下负荷特征的差异,分类准确率较高。

聚类

基础与应用:聚类算法将相似的数据点分组,以发现数据中的固有分组。在生物力学中,可用于确定针对个体的最佳干预措施,如选择合适的鞋类或优化训练方案。

示例研究:Van Drongelen等人利用聚类分析单侧髋关节骨关节炎患者的步态补偿策略。通过主成分分析进行降维,然后使用层次聚类和k - 均值算法确定聚类数量并识别患者亚组,结果显示不同聚类的患者在髋关节伸展峰值上存在差异。

4. 强化学习在生物力学中的应用

强化学习通过智能体在环境中根据奖励和惩罚反馈学习采取行动,在生物力学中可优化假肢控制,开发能够在高维生物力学系统中生成生理可行运动的模型控制器,还可通过估计关节力矩为监督学习或传统分析提供替代方法。

5. 总结与展望

总结:机器学习通过增强对高维数据的分析能力,补充了传统的生物力学分析方法。其应用价值取决于传统生物力学分析步骤和与特定任务相关的机器学习模型质量。

展望:未来,机器学习与生物力学的结合将不断深化,包括深度学习算法的进一步集成,应用于实时监测和反馈系统,以及跨学科团队合作和数据共享推动创新。同时,可解释性机器学习将提高结果的信任度和透明度。

主要内容如下

欢迎各位阅读后转发

第9章 生物力学中的机器学习:增强人体运动分析

Bernd J. Stetter和Thorsten Stein著

摘要:人体运动的生物力学分析对于发现预防损伤、治疗疾病和提高性能的策略具有重要意义。在此背景下,通常使用基于实验室的生物力学测量系统或可穿戴传感器收集高维数据集。近年来,机器学习(ML)在挖掘高维生物力学数据潜力方面越来越受欢迎。机器学习有三种主要范式:监督学习、无监督学习和强化学习,其中前两种主要用于生物力学。在监督学习中,例如通过回归算法使用可穿戴传感器数据训练ML模型对膝关节损伤状态进行分类或预测膝关节力。生物力学应用中的无监督学习包括,例如将高维运动学数据简化为紧凑的低维表示或识别特征人群组,如具有相似步态异常的个体。强化学习例如为开发能够生成生理上可行的高维运动的生物力学模型控制器提供了一种有前景的方法。基于ML的分析很好地补充了传统的生物力学分析,因为两者都有各自的优缺点。总体而言,ML可以支持我们对人体运动生物力学的理解,并优化运动模式以预防损伤以及提高人类健康和性能。

关键词:步态分析;生物力学建模;可穿戴传感器;运动学;动力学;机器学习算法;数据驱动方法;信号处理;日常活动;运动

9.1引言

运动是人类生活的一个重要方面,因为它确保了身体的移动性,从而实现了与环境的相互作用。因此,人体运动是许多科学学科的重要课题,包括生物力学。生物力学是一门科学学科,除其他外,它涉及人体运动的建模、模拟和分析,以发现预防损伤、治疗疾病和提高性能的策略(Seth等人,2018)。这需要一种跨学科的研究方法,有效地整合来自解剖学、生理学、物理学、工程学、计算机科学等方面的知识。如今,生物力学是一个快速发展的学科,涵盖了各种各样的研究问题和应用领域(例如,Uchida和Delp(2021);https://isbweb.org/)。

在生物力学中,人体运动通常在实验室条件下使用红外摄像系统、测力板和肌电图(EMG)进行研究。使用这些系统收集的数据以及人体测量数据构成了生物力学模型的输入,这些模型能够计算出不能简单直接测量的其他变量(例如,关节角度、关节力矩和关节力)。通过这种最先进的方法,可以在短时间内收集许多高维数据集。这种方法非常复杂和精确,但也非常昂贵且局限于实验室(Dorschky等人,2023)。为了能够在实验室外对人体运动进行生物力学分析,近年来可穿戴传感器(例如,惯性测量单元(IMUs))的使用越来越多(Díaz等人,2020;Mundt,2023)。这些传感器佩戴在身体附近,对佩戴者的运动影响很小,并提供了在自然环境中长时间研究人体运动的可能性。这些环境可以是日常生活或训练、康复和比赛期间的运动。在这些情况下的人体运动分析对于监测运动表现、预防损伤和管理疾病进展非常重要(Preatoni等人,2022)。可穿戴传感器价格较低,并能够进行具有生态学效度的数据收集。然而,使用可穿戴传感器时也存在一些挑战,例如传感器漂移、噪声、校准误差、运动伪影、数据传输错误和未测量的信号(例如,地面反作用力),这些都必须考虑(Dorschky等人,2023;Hafer等人,2023)。

原则上,基于实验室的生物力学测量系统和可穿戴传感器都可用于收集许多高维数据集。根据研究问题(例如,膝关节骨关节炎患者步态训练的效果),记录或计算的生物力学数据集(例如,步行过程中膝关节力矩的时间序列)通常会简化为一个单一的离散参数(例如,站立阶段的最大膝关节内收力矩)。然后对这些离散参数进行统计假设检验。通过这种有充分依据的方法,不能完全排除在高维数据集中以复杂的非线性关系形式隐藏着进一步重要信息的可能性,这些信息在研究问题的背景下可能是相关的。在这种情况下,传统的简单统计分析达到了其极限。相比之下,机器学习(ML)领域明确地专注于开发能够识别高维数据集中的模式并进行预测的算法。ML和生物力学的交叉正是本章所关注的主题。在简要介绍ML主题之后,目的是根据最重要的ML算法介绍生物力学中的一些应用,从而为读者提供该主题的入门概述。本章最后对未来发展进行了展望。

9.2机器学习基础

ML是人工智能(AI)的一个子领域,它包含来自统计学(例如,线性回归和k - 均值聚类)、计算机科学(例如,数据结构和算法)以及神经科学(例如,神经网络和学习)等方面的元素。它涉及创建能够从数据中自动学习而不是通过显式编程学习的算法,并根据一些性能指标随时间提高其性能(Alpaydin,2020)。ML包括三种主要的学习范式,尽管也存在混合形式(Alpaydin,2020):(1) 在监督学习中,算法使用与已知输出标签相关联的输入数据进行训练。监督学习包括分类(例如,急性前交叉韧带(ACL)损伤患者的步态模式分类;第9.3.1节)和回归(例如,基于可穿戴传感器数据预测膝关节力;第9.3.2节),使其适用于具有定义数据含义的标记特征的数据可用的情况。(2) 无监督学习涉及在未标记数据中发现模式以理解数据的含义。降维(例如,将高维运动学数据简化为有意义的低维表示;第9.4.1节)和聚类(例如,将由于髋关节骨关节炎具有相似步态补偿策略的患者分组;第9.4.2节)代表无监督学习,能够深入了解数据组织和关系。(3) 最后,强化学习采用一种不同的方法,与监督学习中使用样本数据进行训练不同,一个智能体与环境交互通过试错学习最优行动。通过以奖励或惩罚的形式接收反馈,成功的行动被“强化”,使行为适应以最大化累积奖励(例如,根据关于运动成功或失败的反馈优化假肢控制;第9.5节)。

当一个ML算法使用数据进行训练时,会创建一个ML模型。例如,回归算法的训练(即学习回归系数)创建一个预测模型。当预测模型接收新的、未见过的数据时,该模型可以根据用于训练模型的数据提供预测。然而,无论之前提到的ML算法类型如何,开发一个ML模型的过程是相似的。

▲ 图9.1展示了开发一个用于生物力学目的的机器学习模型所涉及的主要步骤,并附有简要说明,这些步骤发生在模型应用之前。PCA:主成分分析;SVM:支持向量机

图9.1说明了为生物力学应用开发一个ML模型所涉及的主要步骤。它从使用各种系统(如运动捕捉、可穿戴传感器或EMG)收集数据开始,以确定描述不同层面运动模式的变量(例如,关节角度、肌肉激活)。这是通过信号处理和生物力学建模实现的。随后,当处理高维数据时,采用特征工程来导出一个低维表示。在下一步中,必须根据生物力学任务和数据的特征选择一个合适的ML算法(例如,用于分类的决策树)。在数据的训练集上进行训练过程中,调整模型参数以最小化误差或最大化性能。当训练一个ML模型时,避免欠拟合和过拟合至关重要。欠拟合发生在模型不能充分代表训练数据时,导致高训练误差,而过拟合发生在模型过度拟合训练数据时(Dorschky等人,2023)。最后,使用数据的一个测试集(也称为验证集)进行验证,以评估训练模型的性能并确保对未见过的数据具有泛化能力。生物力学ML应用中常见的验证方法是K - 折交叉验证(KFCV)和留一受试者交叉验证(LOSOCV)(Dorschky等人,2023;Halilaj等人,2018)。KFCV(例如,10 - 折交叉验证)将数据集划分为k个子集或“折”(例如,k = 10),用每个折作为测试集一次,其余数据作为训练集对算法进行k次训练。LOSOCV将每个受试者的数据仅分配到训练集或测试集(即,折的数量等于受试者的数量)。性能指标在所有迭代中平均。每种方法都有其优点和局限性,选择取决于数据集大小、计算资源以及应用场景的具体特征等因素。

9.3监督学习

监督学习是一种ML范式,其中算法在一个标记数据集上进行训练,以学习输入特征和相应输出标签之间的关系(Alpaydin,2020)。术语“标签”,也称为响应或因变量,指的是算法学习预测的输出或结果(Halilaj等人,18)。例如,在一个用于诊断的ML模型中,它可以代表疾病状态,而在一个回归模型中,它表示一个生物力学时间序列,例如一个步态周期中的地面反作用力。这需要使用一个数据集,其中输入(例如,关节运动学)和输出(例如,步态异常)在模型开发中都是已知的。目标是让算法学习一个从输入到期望输出的映射函数,使其能够对新的、未见过的数据进行预测。标记数据集例如将包括正常和异常步态的实例,允许算法辨别模式并对未来个体的步态特征进行预测。监督学习包括两个主要的子类型:分类(第9.3.1节),涉及预测离散类别;以及回归(第9.3.2节),涉及预测连续值。

9.3.1分类

9.3.1.1基础与生物力学应用

生物力学中的ML分类算法涉及根据特定标准将高维数据组织成有意义的组或类,从而能够分析人体运动模式。生物力学中的一个例子是肌肉激活模式的分类,其中分类模型被训练以评估膝关节损伤后神经肌肉控制的缺陷(Mohr等人,2019)。如第9.2节所述,它从数据收集和必要的计算开始,以获得感兴趣的生物力学变量(例如,关节角度、肌肉激活)。接下来,通过生物力学领域知识或对原始或预处理数据进行降维(见第9.4.1节)来提取相关特征。确定的特征作为分类算法的输入。常见的算法包括决策树、支持向量机(SVM)和人工神经网络(ANN),它们学习数据中的模式和关系以准确分类生物力学数据(Alpaydin,2020;Halilaj等人,18)。由于可能的算法种类繁多,算法选择可能是开发良好分类模型的一个具有挑战性的部分(Alpaydin,2020;Halilaj等人,18)。因此,根据具体应用测试不同的算法可能是值得的,因为不是每个算法在每个应用中都会产生良好的结果(Richter等人,18)。

表9.1 利用分类研究人体运动生物力学的示例研究

9.3.1.2示例研究:“基于支持向量机的步态模式分类”

Christian等人(2016)进行了一项研究,调查了SVM在分析近期ACL损伤患者的运动学步态模式以及评估治疗干预的影响方面的应用。通过将步态运动学视为高维数据而不是离散变量,可以更全面地了解步态特征,有助于对步态进行客观评估,并减少观察性步态分析中的主观偏见。该研究记录了7名男性急性单侧前交叉韧带(ACL)断裂患者和7名健康男性的下半身和胸部的14个反射标记的3D轨迹。采用主成分分析(PCA,第9.4.1节)和递归特征消除(即选择特征子集的算法)从步态周期的3D标记轨迹中提取特征,从而降低维度。与此同时,基于两个主成分(PCs)训练一个线性SVM以区分受伤组和健康组,并进行交叉验证以评估分类准确率,结果为100%。SVM模型(Alpaydin,2020)可以被解释为一个超平面,在这种由于两个PCs的特定情况下本质上是2D中的一条线,它以一种最大化间隔的方式将两组分开,即超平面与每组中最接近的点之间的距离。这个超平面是由SVM算法创建的决策边界。最接近这个超平面的点是支持向量,它们本质上决定了超平面的位置和方向。通过调整这个超平面的位置和方向,SVM算法找到最佳的边界,最好地将两组分开。此外,Christian等人(2016)引入了一个分类器导向的步态评分作为步态质量的度量。因此,计算沿着超平面的法向量的欧几里得距离(表示最大可分离性的方向)来对步态模式进行评分。在手动治疗后,使用SVM模型对受伤组进行重新评估。结果显示步态评分提高,表明受伤组的步态模式变得更接近健康组的步态模式。提高的步态评分与患者的临床评级一致。该研究表明,用于分类的SVM模型有效地检测到由ACL损伤引起的步态改变,其结果与临床评估一致。此外,可视化能力有助于关键运动学特征的解释,增强了诊断集成。

9.3.2回归

9.3.2.1基础与生物力学应用

ML回归算法专注于基于输入数据预测连续范围内的数值(即输出)(Alpaydin,2020)。这涉及训练一个算法以学习标记数据集中的关系,使其能够对未见过的数据进行未来预测。这些算法是解决生物力学变量所带来的独特挑战的重要工具,由于生物和环境因素的复杂相互作用,生物力学变量通常难以评估和解释。通过对复杂关系的系统研究,回归提供了一个进行预测的有价值的框架。例如,回归算法与可穿戴传感相结合,最近已被证明在“野外”运动分析中与使用传统的基于物理的模型相比,能够实现相似甚至更好的性能(Dorschky等人,2023)。回归算法的训练从收集并经常预处理的数据开始,例如通过生物力学建模确定感兴趣的生物力学变量(例如,关节力)。可以根据所研究关系的复杂性应用各种回归算法,如线性回归、多项式回归、SVM回归或ANN(Alpaydin,2020)。研究表明,所需的算法复杂性根据运动的复杂性而变化;基本算法如线性或多项式回归在预测一维健身房锻炼的关节角度和关节力矩方面已显示出有效性,而在步态预测中则需要更复杂的算法(Mundt,2023)。无论算法的复杂性如何,它们从标记数据集(即监督学习)中学习以建立输入数据(例如,关节角度)和输出数据(例如,关节力)之间的关系。在训练之后,回归模型必须进行典型的模型评估以评估其性能和泛化能力(第9.2节),这对于确定模型的可靠性和有效性至关重要。在验证模型并确认其在期望范围内的准确性之后,它可以应用于特定的生物力学任务。表9.2提供了在生物力学应用中使用回归的研究的选择性概述,其中许多研究专注于预测难以评估的变量。使用回归模型进行时间序列预测在弥合基于实验室的研究和实际应用之间的差距方面起着关键作用(Dorschky等人,2023;Mundt,2023)。体育生物力学和临床生物力学研究等不同领域的正常和病理运动分析都可以从关节角度、力矩和力的预测中受益。

表9.2 利用回归研究人体运动生物力学的示例研究

9.3.2.2示例研究:“基于人工神经网络的膝关节力预测”

我们进行了一项使用ANN预测运动中膝关节力(KJF)的研究,基于从两个可穿戴传感器获得的数据(Stetter等人,19)。动机是克服内部膝关节载荷的移动评估中的局限性,这对于提供足够的损伤预防策略至关重要。13名参与者在右大腿和小腿上佩戴了两个可穿戴传感器(即,IMU)。参与者进行了各种运动,包括直线运动、方向改变和跳跃,同时同步记录IMU信号以及全身运动学和地面反作用力。使用全身生物力学模型确定3D KJF。然后在一个数据集上训练一个ANN,该数据集将IMU信号作为ANN输入和3D KJF作为输出,用于所有运动,学习IMU信号和KJF时间序列之间的关联。

▲ 图9.2展示了人工神经网络(ANN),它以可穿戴传感器数据作为输入(i1到i12,用绿色表示),以预测三维膝关节力作为生物力学输出(o1到o3,用红色表示)(Stetter修改,2021年)。该人工神经网络有两个隐藏层(浅灰色框),一个有250个神经元(n1到n250),另一个有100个神经元(n1到n100),它们与输入和输出节点相连。圆圈代表人工神经网络的节点。

ANN模型如图9.2所示,训练过程可以描述如下(Alpaydin,2020):权重,表示神经元之间连接的强度,以及偏差,它与输入的加权和一起调整输出,被随机初始化。当训练开始时,输入数据通过网络传递,计算预测。这些预测与实际输出使用一个损失函数进行比较,以测量差异。通过反向传播,计算损失相对于每个权重和偏差的梯度,使得可以通过一个优化算法进行调整。这个迭代过程,重复多次称为轮次(epochs),优化算法的性能。为了防止过拟合,定期在一个验证集上评估算法的性能,如果改进停滞则提前停止训练。这个训练过程重复13次以进行LOSOCV(见第9.2节)并评估模型对新的、未见过的数据的预测性能。评估结果显示,对于大多数(16个中的11个)分析的运动,垂直KJF具有良好的一致性(相关系数≥0.81且相对均方根误差≤20.3%)。16个运动中的10个对于前后KJF显示出可比的估计准确性(相关系数≥0.80且相对均方根误差≤22.9%)。观察到内外侧KJF的估计准确性显著下降(相关系数≤0.60且相对均方根误差≥27.7%)。总之,该研究作为一个例子说明了ML回归与可穿戴传感器相结合如何用于预测有价值的生物力学变量(即,KJF)以评估关节载荷。通过解决移动KJF评估中的局限性,该研究为现场诊断引入了新的可能性,可能在未来增强损伤预防策略。

9.4无监督学习

无监督学习是一种ML范式,其中算法分析未标记数据以在没有预定义输出标签的明确指导下揭示内在模式或聚类(Alpaydin,2020)。在生物力学中,这例如可以涉及检查没有预定义类别或标签的关节运动学数据,目的是在高维数据中发现有意义的关系(例如,耦合的角运动)或识别特征群体(例如,具有步态异常的人)。无监督学习包括两个主要的子类型:降维(第9.4.1节),旨在捕捉数据的关键特征;以及聚类(第9.4.2节),其中数据点根据相似性进行分组。

9.4.1降维

9.4.1.1基础与生物力学应用

降维涉及旨在减少数据集中的特征或变量数量同时保留其关键信息的算法(Alpaydin,2020)。这个过程反映了将高维数据转换为低维表示,使其更易于生物力学分析和ML模型开发(见第9.2节)。在过去几十年中,降维在生物力学应用中的两个主要领域已经确立:(1) 按照模块化控制架构的思想将高维生物力学数据简化为有意义的运动学或肌肉协同,以简化控制。这是由肌肉骨骼系统的复杂性所推动的,该系统由大约700块肌肉和300个机械自由度组成(Bernstein,1967)。这个高度冗余的系统使我们能够以无数种方式完成运动任务。运动控制和生物力学研究中的一个长期问题是中枢神经系统(CNS)如何解决这种冗余。此外,在我们的一生中,我们获得了许多运动技能,例如走路或打高尔夫球。这在运动控制和生物力学研究中提出了另一个关键问题:CNS如何表示这种多样性?为了回答这些基本的科学问题,降维算法发挥了作用,因为它们提供了一种从高维生物力学数据中提取有意义的低维表示(通常称为协同)的解决方案。这种协同可以存在于运动学或肌肉层面(Daffertshofer等人,2004;Tresch等人,206),并且它们通常代表共同作用以产生单独任何一个元素无法产生的结果的组成元素(图4.1)。例如,当对直线行走、转90°弯和上楼的高维运动学数据进行主成分分析(PCA)时,前五个协同解释了每个运动任务在54维空间(18个标记×3D坐标)中超过80%的方差(Stetter等人,2020)。类似基于PCA的方法已被用于研究姿势控制和量化运动技术(Federolf,2016)。替代的降维算法,如非负矩阵分解,已被特别证明在评估运动可能通过少量肌肉协同组合产生的假设方面是有价值的(Tresch等人,206)(图9.3)。

▲ 图9.3展示了降维应用的示例,即主成分分析(PCA),通过低维运动协同来表示高维步行运动。还提供了每个运动协同所代表的整个运动各方面的简要描述。

(2) 作为开发ML模型以提高分类、回归或聚类性能的一个步骤的特征工程或选择。其基础在于任何ML算法(例如,SVM)的复杂性取决于输入的数量。这决定了计算的运行时间和所需的内存,以及训练这样一个算法所需的示例数量(Alpaydin,2020)。特征工程涉及从数据集中选择一个子集的重要特征并丢弃其余特征,通常通过降维算法实现。通过消除冗余特征,ML模型的复杂性可以降低,并且由高度相关或有噪声的特征引起的过拟合可以减轻(Mundt,2023)。此外,良好的特征工程是从高维生物力学数据开发ML模型的一个重要步骤,因为它可以即使使用简单算法(如逻辑回归)也能导致高模型性能(Halilaj等人,18)。然而,在减少数据维度的同时保持足够的相关信息是一个不小的挑战。为此,可以根据领域知识手动选择特征(例如,切割运动中的峰值膝关节角度),或者采用数据驱动的方法,如计算时间序列的汇总指标(例如,信号的平均值;Halilaj等人,18)。此外,更多的开源工具箱[例如,Tsfresh(Christ等人,2018),或Chameleon(Thilakeswaran等人,2021)]包括各种降维算法已经可用,并且在生物力学的ML应用中经常使用(Mundt,2023)。例如,Moghadam等人(2023)(见表9.2)在使用最重要的特征训练回归算法之前,使用Tsfresh工具箱从EMG和IMU信号中提取特征。需要牢记的是,虽然自动特征提取技术,如广泛使用的PCA,可以捕捉到数据的一些重要性,但它们可能会生成难以解释或与特定输出缺乏相关性的特征(Halilaj等人,18)。根据Halilaj等人(18),当结合代表不同生物力学量(例如,膝关节角度和力矩)的特征时,必须根据预期的ML算法对特征进行重新缩放,如z - 分数归一化,以便进一步分析。表9.3提供了使用降维算法的研究的选择性概述。它侧重于生物力学应用的两个主要领域:高维生物力学数据的有意义简化和特征工程。

9.4.1.2示例研究:“足底压力数据的降维以评估不同跑鞋的效果”

Trudeau等人(2015)进行了一项研究,调查了一种新方法的应用,即结合PCA和SVM,以评估不同鞋类干预对足底负荷的影响。使用PCA提取不同的负荷特征,即从跑步的站立阶段将高度维的足底负荷模式简化为其最重要的信息。之后,使用一个SVM模型(见第9.3.1节)来确定这些负荷特征在三个不同重量、缓冲和鞋底构造的鞋类条件下是否以及如何不同。对于每个鞋类条件,从42名活跃的休闲跑步者使用由99个压力单元组成的鞋垫(由一个105个元素的单元矩阵表示,其中6个元素设置为零)记录10个跑步步幅的站立阶段的足底压力数据。为了开始降维,创建了一个具有126,000行(即,42名参与者×3双鞋×10次试验×100个时间点)和105列(即,压力单元)的矩阵,并通过减去每个鞋类在试验和参与者之间的平均力向量进行标准化。对这个输入矩阵应用PCA。这个过程可以描述如下(Alpaydin,2020):首先,计算协方差矩阵,通过指示变量(即,压力单元)一起变化的程度来总结变量之间的关系。接下来,PCA对协方差矩阵进行特征值分解以找到其特征向量和特征值。特征向量代表数据中最大方差的方向,而特征值指示沿着这些方向的方差大小。特征向量根据其相应的特征值进行排序,最高的特征值代表第一个主成分(PC)。随后的特征向量代表方差逐渐减小的正交方向。最后,PCA将原始数据投影到由PCs定义的新正交轴上。这种转换导致数据的低维表示,称为PC分数,捕捉到最重要的变异模式。在该研究的应用中,维度降低到35个PCs,反映了99%的数据方差,并与三个剩余向量结合进行进一步分析。在降维之后,应用成对线性SVM算法通过研究超平面的法向量来表征鞋类条件之间力模式的系统差异(见第9.3.1节)。进行了留一受试者交叉验证(LOSOCV),并且三个成对的SVM模型的分类准确率高于94%。根据PC分数(即,足底负荷特征)对鞋子之间的特征差异(例如,前脚更大的力)进行量化和解释。该研究表明,降维是ML模型开发中的一个有帮助的步骤,使高维数据可解释,并成功应用分类算法。从实际角度来看,这项研究作为一个例子说明了ML如何帮助选择合适的鞋类或指导针对特定人群(如神经病变患者)的鞋类干预。

表9.3 利用降维算法研究人体运动生物力学的示例研究

9.4.2聚类

9.4.2.1基础与生物力学应用

聚类是指ML算法根据数据集中的模式或相似性将相似的数据点分组在一起(Alpaydin,2020)。聚类的目的是发现数据中的固有分组,其中同一聚类中的成员彼此之间比与其他聚类中的成员更相似。在生物力学领域,一个常见的目标是确定针对个体的最佳干预措施,例如选择理想的鞋类或优化训练协议。虽然这个任务听起来几乎微不足道,但由于个体对给定干预的反应是因人而异的,导致相同的干预对一个人有益但对另一个人不利(Hoerzer等人,15),所以它变得相当具有挑战性。这些个体反应例如在各种干预措施中都有观察到,包括鞋类、跑步表面和矫形器(Hoerzer等人,15)。因此,从数据分析的角度确定最适合的干预措施远非简单。探索性数据分析,例如对对特定干预(例如,一种特定的治疗方法)或产品(例如,一双跑鞋)有相似反应的个体的运动模式进行聚类,是克服这一挑战的一个有帮助的概念。过程从数据准备开始,包括使用生物力学建模确定感兴趣的变量,例如关节运动学。随后,可以从通常是高维的数据集选择或提取相关特征,例如包括来自多个关节和维度的运动学数据,使用降维算法(见第9.4.1节)。接下来,根据数据集的特征和具体的生物力学任务选择一个聚类算法。典型的算法是k - 均值、层次聚类或自组织映射。这些算法根据潜在的聚类方法将数据集划分为相似数据点的聚类。一种常见的方法是基于质心或分区的聚类(例如,k - 均值),它基于数据点到选定中心值的接近程度(例如,欧几里得距离)工作。基于连通性的聚类,如层次聚类,根据数据点之间的距离(例如,欧几即,欧几里得距离)将数据点分配到聚类中。接近彼此的数据点被分组到同一聚类中。还有其他方法,如基于分布的聚类,它使用统计分布(例如,高斯分布)来聚类数据(Xu & Tian,15)。自组织映射是一种替代的聚类方法。它们是人工神经网络,将高维数据投影到一个低维的节点网格上,通常是二维的,从而能够识别相似数据点的群体。一旦聚类完成,使用诸如轮廓系数或簇内平方和等指标评估聚类的质量(Halilaj等人,18)。这种评估有助于评估聚类如何很好地且稳健地代表数据的底层结构。最后,使用诸如散点图或树状图等技术对聚类进行解释和可视化,以深入了解数据的模式。聚类已经在从体育[例如,根据跑步运动学对个体进行分组(Hoerzer等人,15)]到临床应用[例如,对脑瘫患者的不同步行模式进行分组(Roche等人,14)]的各种生物力学应用领域中使用。表9.4提供了使用聚类来调查人体运动生物力学的研究的选择性概述。

表9.4 利用聚类研究人体运动生物力学的示例研究

9.4.2.2示例研究:“聚类以识别由于髋关节骨关节炎导致的步态补偿策略”

在van Drongelen等人(2021)的一项研究中,聚类被用于根据步态适应对单侧髋关节骨关节炎患者进行分组。这些患者即使在全髋关节置换手术后也经常在步态生物力学方面存在缺陷。在关节置换后对持续运动异常风险的患者进行术前识别对于调整或个性化康复计划是有帮助的。改进的康复计划例如可以防止邻近关节的退行性关节疾病的发展。所进行的分析包括三个连续的步骤:首先,对步态运动学进行降维;其次,对髋关节骨关节炎患者的数据进行聚类(n = 51);第三,对不同聚类中的患者的步态生物力学与健康对照(n = 46)进行统计比较。使用PCA进行降维,得到三个主成分解释了胸部、骨盆、髋关节、膝关节和足部运动学步态周期时间序列数据的70%。基于前三个主成分的分数使用层次聚类来确定适当的聚类数量,并涉及评估 scree图和轮廓系数。scree图显示了簇内平方和与聚类数量的关系。随着聚类数量的增加,平方和减小,但速率下降。最佳聚类数量在曲线的“肘部”处指示,其中下降速率减缓且曲线变平。轮廓系数测量对象在聚类内与其他聚类中的点相比的相似性,有助于选择具有最高平均轮廓分数的聚类数量。这些分析帮助确定了两个聚类的最佳数量。使用这样的测试对于确保确定聚类中心的其他算法最好地代表数据的底层结构是重要的(Halilaj等人,18)。随后,使用具有定义的两个聚类数量的k - 均值算法来识别不同子组中的患者。这样,算法首先随机选择每个聚类的质心,然后将数据点(即,患者)分配到最近的质心,根据分配的数据点的均值更新质心,并迭代直到收敛,即质心不再显著变化(Alpaydin,2020)。目标是最小化簇内方差,使聚类内的数据点相似,而不同聚类中的数据点不同。该研究结果显示,聚类的特征是在髋关节伸展峰值上存在差异,其中髋关节伸展较少的聚类与健康对照相比偏离显著更多。至少在全髋关节置换手术后一年,步态模式接近健康个体的步态模式,但没有完全正常化,因为两个聚类仍然与健康对照存在偏差。总体而言,该研究表明聚类对于识别表现出不同类型步态适应的髋关节OA患者的亚组是有用的。在未来,术前步态评估和分配到特征群体可能有助于为更好的术后结果定制康复计划。

9.5强化学习

强化学习是一种ML范式,基于一个智能体根据奖励和惩罚形式的反馈在环境中学习采取行动以实现特定目标的思想(Alpaydin,2020)。在生物力学背景下,强化学习传统上扮演着次要角色(Halilaj等人,18;Wu等人,21)。然而,随着测量技术、肌肉骨骼建模的进步以及生态瞬时评估技术的出现,这些算法在解决生物力学研究课题方面变得越来越受欢迎。例如,强化学习可以通过使算法根据关于运动成功或失败的反馈调整其控制策略来优化假肢控制(Wen等人,20)。在计算机科学和生物力学社区中,对运动的控制和生物力学进行建模的努力一直在进行(Halilaj等人,18;Seth等人,18)。在不同场景下模拟生理上准确的运动可以支持从业者在诸如手术规划和辅助设备原型制作等任务中。然而,现有方法受到生物力学模型的大而复杂的解空间的限制,限制了它们的适用性(Kidziński等人,18)。强化学习为开发能够在高维生物力学系统中生成生理上可行运动的模型控制器提供了一种有前景的方法(Kidziński等人,18)。此外,强化学习可以通过从肌电图或关节运动学估计关节力矩为生物力学中的监督学习或传统分析提供替代方法(Wu等人,21)。总体而言,强化学习在生物力学中为优化运动模式、个性化康复计划以及为自适应辅助设备的发展提供信息带来了新的机会。未来在这一领域的研究有可能显著增强人体运动生物力学及相关应用。

9.6总结与展望

9.6.1总结

本章的目的是提供ML在人体运动生物力学背景下应用的入门概述。在第9.2节对该主题进行简要介绍之后,介绍了与监督学习(第9.3节)、无监督学习(第9.4节)和强化学习(第9.6节)这三种主要ML范式相关的生物力学应用实例。重点是与前两种范式相关的ML算法,到目前为止它们主要用于生物力学。总之,ML通过增强对高维数据的分析能力补充了传统的生物力学分析方法。在许多ML在生物力学中的应用中,总体价值很可能取决于传统生物力学分析步骤以及与特定生物力学任务相关的ML模型的质量。例如,用于为ML算法生成训练数据的应用生物力学测量系统、信号处理程序和建模技术可以显著影响结果。此外,解释ML模型的结果通常需要结合生物力学发现,这些发现可能是使用经典生物力学方法得出的。

9.6.2展望

展望未来,ML和生物力学的交叉有望增强人体运动分析。ML算法使研究人员能够从高维生物力学数据中提取精细的模式,从根本上改变我们分析人体运动的能力。一个显著的趋势是高级ML算法(如深度学习)的更深入整合。例如,卷积神经网络(CNN),一种具有许多处理层的人工神经网络,是一种深度学习算法(Alpaydin,2020)。在CNN中,卷积层可以自动从数据中提取相关特征。这些层对于时间序列可穿戴传感器数据由于在时间和传感器轴上的固有相关性而证明是有效的(Dorschky等人,2023)。然而,需要谨慎,因为深度学习可能只有在有大型数据集或预训练网络可用时才合适(Halilaj等人,18)。ML的应用延伸到实时监测和反馈系统。通过利用可穿戴传感器和生物力学模型,可以创建个性化的反馈回路以优化运动模式、预防损伤和提高性能,在包括体育、康复和人体工程学等各种领域。跨学科团队从不同背景和数据共享倡议有望推动该领域的创新。随着ML的普及继续增长,建立在生物力学和ML交叉处进行研究和报告的良好实践是至关重要的,整合诸如严格的模型评估等重要方面。这确保得出的结论是有效和可重复的(Halilaj等人,18)。随着ML融入生物力学,对结果的信任和信心对于用户接受至关重要。可解释性ML可以通过使ML算法更透明和可追溯来帮助实现这一点,具体通过开发白盒模型而不是黑盒模型,例如通过ML可解释性方法(Linardatos等人,21)。此外,增强透明度将有助于实际解决方案以满足法律要求,如欧盟的《通用数据保护条例》(GDPR),该条例要求机器学习模型具有可追溯性。

总之,机器学习在生物力学中的前景是有希望的,有可能改变我们对人体运动生物力学的理解,优化运动模式,预防损伤,并提高人类健康和性能。通过负责任地整合先进技术和协作努力,我们可以解锁对人类福祉具有深远影响的新见解。

参考文献

1. Alpaydin, E. (2020). Introduction to Machine Learning (Vol. Fourth edition). The MIT Press.

3. Bernstein, N. (1967). The co - ordination and regulation of movements. Pergamon Press.

16. Kidziński, Ł., Mohanty, S. P., Ong, C. F., Hicks, J. L., Carroll, S. F., Levine, S., Salathé, M., & Delp, S. L. (2018). Learning to run challenge: Synthesizing physiologically accurate motion using deep reinforcement learning. In The NIPS ‘17 Competition: Building Intelligent Systems, Cham.

17. Kohonen, T. (2001). Self - organizing maps. Springer.

27. Seth, A., Hicks, J. L., Uchida, T. K., Habib, A., Dembia, C. L., Dunne, J. J., Ong, C. F., DeMers, M. S., Rajagopal, A., Millard, M., Hamner, S. R., Arnold, E. M., Yong, J. R., Lakshmikanth, S. K., Sherman, M. A., Ku, J. P., & Delp, S. L. (2018). OpenSim: Simulating musculoskeletal dynamics and neuromuscular control to study human and animal movement. Plos Computational Biology, 14(7). https://doi.org/10.1371/journal.pcbi.1006223

32. Thilakeswaran, D., McManis, S., & Wang, X. R. (2021). Chameleon: A python workflow toolkit for feature selection. In Data mining, Singapore.

35. Uchida, T. K., & Delp, S. L. (2021). Biomechanics of movement: The science of sports, robotics, and rehabilitation. Mit Press.

作者介绍:郭佰鑫(Max)

作者Max,一位大三的本科生,社交自媒体平台专注于输出体育科技以及体育科学相关内容,期待未来有能力的基础下能加入更多基于人工智能的体育分析与科技。有其他科研合作的欢迎您的联系

Linkedin领英:Baixin Guo

期待科研/产品合作!也期待和各位翻译出版前沿的书籍!接流程图/项目科研思路设计

▼ 麻烦您带一下备注!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OzsexfHVDnqUYoSZ1FBaAWmA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券