摘要: 针对现有机械手移动偏差控制技术存在的轨迹控制不连续、复杂度高、综合效率低等问题,以机器学习和深度学习为基础提出一种混合神经网络控制算法。分析机械手各关节、连杆的空间坐标转换关系,以 RBF 为基础构建混合神经网络模型,选用逆多二次函数作为模型的激活函数,分别确定中间隐层和输出层的权值; 引入 LSTM 长短记忆算法,利用 LSTM 算法的输入门、遗忘门和输出门结构设计,抑制坐标数据训练时出现的梯度膨胀问题,并给出精确的轨迹修正指令。仿真结果表明: 提出的混合神经网络算法采样点轨迹偏差均值为 0. 02 mm,VARP 值趋近于 0,具有更好的自动控制稳定性和更高的控制效率。
关键词: 混合神经网络; 机械手; 自动控制; RBF 神经网络; LSTM 算法
唐翠微 机床与液压 2021-11-28
工业机械手自动化控制是一项集机械制造、控制工程、计算机科学、传感器技术、仿生学、人工智能等技术于一身的前沿技术[1-2]。随着现有工业机械手控制技术的不断发展,在许多高温、高压、高辐射性及污染性较强的恶劣环境下,机械手能够替代人工完成作业任务[3]。对比早期的工业机械手,现有工业机械手不仅在小型化、轻量化及控制精度上有了本质改善,且制造成本也大为降低[4],使得工业机械手能够应用到工业生产线,提高产品生产和加工的效率[5]。伴随着新一轮技术革命的到来,工业机械手控制技术正朝着集成化、模块化、智能化的方向发展,并且机械手控制技术与人工智能、机器学习、远程控制等技术结合紧密程度不断提高[6-7],工业机械手的应用领域也朝着高精度的方向发展。
机械手移动轨迹自动控制是机械手的核心研究问题。现有的轨迹控制方法主要包括曲线拟合控制、模糊推理控制、PID 控制等。其中曲线拟合方案通过对多项式序列权值的优化调整[8],实现对机械手行进轨迹的修正和自动控制,但曲线拟合很难满足机械手行进轨迹的连续性,且修正局部曲线时容易导致相邻段的轨迹出现偏差; 模糊推理控制算法在轨迹控制中先将输入指令转换为模糊量,再基于模糊规则得到清晰的输出控制量,该种方式适合于指令集较为复杂的机械手系统[5],但模糊控制算法的模糊规则及隶属度函数的确定极为复杂,制约了该控制方法的进一步推广使用; PID 控制是一种使用范围十分广泛的控制算法[9],PID 控制器具有结构简单、控制效率高等优点,但由于误差积分的引入容易引起积分饱和[10]和控制量饱和[11],进而降低对机械手整体的控制精度。随着人工智能、机器学习和深度学习技术的不断发展,它们与机械领域的结合紧密程度不断提高,本文作者将多种神经网络算法进行深度融合,提出一种混合神经网络算法,用于机械手移动轨迹的控制,以弥补现有控制算法的不足,改善控制精度。
1 机械手空间运动学分析
机械手的结构相对复杂,连杆和关节之间具有强耦合性和高度非线性特征,在机械手负重移动过程中还有很多不确定因素对移动轨迹造成影响。机械手末端执行器在设定好的程序控制下,沿指定轨迹移动,机械手关节和连杆的移动及空间坐标转换以末端执行器为基础做出适时调整[12-13]。机械手由多个连杆和关节组成,关节及连杆复杂的坐标变换可以通过齐次坐标来表示[14-15]。机械手运动过程中各连杆参数和关节的空间坐标关系见图 1。
机械手运动齐次坐标系中包含的 4 个核心参数分别为 θi、di、Li 和 βi,当 4 个核心参数确定以后,相邻连杆和关节之间的空间位姿关系和相对坐标即确定。4 个参数的内涵见表 1。
当表 1 中的各项参数被确定后,即可确定关节 i - 1 和关节 i 之间的空间坐标关系,而关节 i 的空间坐标变换矩阵 Gi 参数变量表示为 Gi = cosθi - sinθ1 cosθi sinθisinβi βicosθi sinθi cosθicosβi - cosθisinθi βisinθi 0 sinθ1 cosθi di 0 0 0 1 ( 1) 坐标变换矩阵是机械手正向运动、逆向运动求解的基础,机械手关节空间坐标与笛卡尔空间坐标的转换过程见图 2。
以六自由度机械臂为例,机械手的正向运动学方程表示为0 6F: 0 6F= G1·G2·G3·G4·G5·G6 = 0 1F( θ1 ) 1 2F( θ2 ) 2 3F( θ3 ) 3 4F( θ4 ) 4 5F( θ5 ) 5 6F( θ6 ) ( 2) 通过设定每个关节的初始位置,并将各参数输入变换矩阵,即可计算出机械臂末端执行器的轨迹坐标。逆向运动是已知笛卡尔空间坐标系,求解各关节、连杆坐标的过程。逆向求解的过程更为复杂,但机械手末端执行器的轨迹点坐标值与各关节变换矩阵的乘积相等,联立方程组可以求出机械手运动过程中的空间坐标。在实际计算中由于解方程组的方法过于复杂,常用求变换矩阵的逆矩阵方法获得最终的结果,先依次求出关节 1 和关节 2 的逆矩阵,再向右与 G-1 6 相乘: G-1 2 ·G-1 1 ·0 6F·G-1 6 = G3·G4·G5 ( 3) 由于笛卡尔空间矩阵和机械手移动矩阵恒等式关系的存在,可依次求出机械手各关节的旋转角度与连杆空间移动距离。
2 混合神经网络模型的建立
工业机械手移动过程的控制属于一种典型非线性控制,尽管经典 BP 神经网络系统具有较强的自学习能力,但其在参数选择及数据训练中存在收敛慢、映射能力弱等不足。近年来,随着人工智能和机器学习技术的不断发展和进步,各种新的深度学习算法在数据计算能力、学习能力和训练能力等方面已经有了较大的突破。本文作者将 RBF( Radial Basis Function,径向基函数) 神经网络和 LSTM( Long Short - Term Memory,长短时记忆网络) 进行深度融合,其中 RBF 能够将采集到的当前机械手各关节、连杆的空间坐标数据输入径向基函数,实现移动坐标数据从低维到高维的转换,输出标准化的、与理论轨迹偏差更小的控制指令; 而 LSTM 能够从原始机械手移动坐标数据中提取到时序特征,以更准确地传达指令,并更好地修正机械手末端执行器轨迹。混合神经网络模式在结构设计上以 RBF 为基础,其中输入量 P、输出量 Q 和输入偏移 B 分别如下: P = p1,p2,···,pn [ ] T ∈ Rn Q = q1,q2,···,qm [ ] T B = b1,b2,···,bm [ ] { T ( 4) 设 ω ∈ Rn×m 为中间隐含层到输出层的权值,函数 φi ( p) 为混合神经网络隐含层内第 i 个节点所对应的激活函数,第 i 个节点对应的中心值为 ci。混合神经网络中间隐含层设计以 RBF 神经网络为主体,就能够保持中心点径向对称,通过控制输入量与中心点距离,调整激励函数的激活值。混合神经网络的结构设计见图 3。
在径向基函数的选择方面,混合神经网络以逆多二次函数作为激活函数: φi ( pi ) = 1 ( p 2 i + η2 ) 1 /2 ( 5) 输入混合神经网络模型的机械手空间位移样本,首先经过聚类处理确定数据的中心点,再通过激活函数和模型扩展系数确定输入数据与中心点的距离。输入数据的训练过程步骤: 步骤 1,利用激活函数确定输入数据隐含层节点的中心值。步骤 2,确定聚类中心后,计算已输入的机械手空间位姿坐标值与聚类中心的距离 ‖pi - ci‖。步骤 3,基于最小距离原则对数据进行分类,当满足如下条件时,得到的训练数据为满足控制条件的输入数据: φi‖pi - ci‖ = min‖pi - ci‖ ( 6) 当满足条件 ci ( i + 1) ≠ ci ( i) 时输入数据点的聚类过程结束。步骤 4,当混合神经网络中间隐含层节点扩展系数确定以后,再分别计算输出层的权值 ω。
3 算法融合与机械手移动轨迹的控制修正
RBF 神经网络模型与经典 BP 算法、CNN 算法等一样,在反向传播计算中易出现梯度爆炸的情况,为此本文作者利用 LSTM 算法对 RBF 模型进行优化,构建一种混合神经网络模型。LSTM 具有很强的记忆性,能够有效解决输入数据训练和学习中的时序排列问题,并提取机械移动轨迹的波动特征,实现轨迹的修正和纠偏。LSTM 引入了门的机制来解决梯度下降问题,LSTM 神经网络算法模型包含了输入门、遗忘门和输出门,LSTM 门的结构设计如图 4 所示。
图 4 中 ξt 作为混合神经网络的遗忘门,决定了在 t 时刻输入数据特征状态的保留情况,其取值区间在 0 ~ 1 之间,当 ξt 值为0 时表示完全遗忘,ξt 值为1 时代表完全保留: ξt = φt ( wξ·pit + bξ ) ( 7) 式: φt 为混合神经网络模型在 t 时刻对应的激活函数; wξ 为遗忘门 ξt 对应的权重矩阵; bξ 为与遗忘门对应的偏置。输入门 it 决定了在 t 时刻,混合神经网络中间隐层能有多少状态单元 Jt 被保留: it = φt ( wi·pit + bi ) Jt = ξt·Jt -1 + pt ( 8) 式中: Jt -1 为上一期状态单元。LSTM 算法中的当前记忆与上一期的长期记忆 Jt -1 组合,形成了新的单元状态。经过神经网络训练和数据迭代后,输出值 qt 表示为 qt = ot·tanhJt ot = φt ( wo·pit + bo ) ( 9) 输入的空间位姿数据、移动数据经混合神经网络模型精确计算后,当前的移动轨迹与理论轨迹偏差及线速度、角速度偏差指标被反馈到控制中心,并重新给出新的移动指令。考虑到机械手轨迹的跟踪控制至少需要调整线速度和角速度两个变量,机械手末端执行器整体被看做一个质点,机械手在 t 时刻移动的线速度 vt 为机械手移动方向的切线速度; 而机械手移动的角速度 ωt 为单位时间内的关节旋转角度: ωt =Δθ /Δt ( 10) 轨迹移动自动化控制的目的是在下一个 t+1 时刻寻找与理论运动控制向量 ( vt+1,ωt+1 ) T 偏差最小的空间坐标集合,即: lim ( Δvt,Δωt ) T →0 ( 11) 在混合神经网络模型控制下,能够随时监控和反馈笛卡尔坐标系下机械手的实时位姿,通过混合模型中间隐层对输入坐标数据空间位姿的计算和判断,确定轨迹局部偏差值范围,再通过参数运算、逆向求解计算出在机械手关节空间的当前坐标值。模型给出纠偏后的参考运动轨迹,能够保证局部坐标系下轨迹偏差最低,机械手移动过程动态纠偏始终存在,LSTM 计算上一个时间周期状态单元与当前周期状态单元的状态偏差,自动控制输出结果的偏差,以达到控制机械手动态全局轨迹的目的。
4 仿真分析
4. 1 实验准备与参数设定
为进一步验证混合神经网络算法在机械手轨迹修正方面的效果,以本地某汽车制造企业的焊接机械手为研究对象,实地测量和记录了机械手的各项工作参数及焊接过程中焊道接缝的轨迹出现的偏离情况。以工业机械手的真实工作参数为基础,并借助 MATLAB 仿真系统模拟焊接机械手的工作过程。焊接机械手的实物图及 MATLAB 轨迹模拟仿真分别如图 5 和图 6 所示。机械手与末端执行器临近的两个关节 ( 关节 5 和关节 6) 、连杆运动过程对末端执行器的影响最大,以规划和控制该段轨迹为例验证提出的基于混合神经图 6 基于 MATLAB 的机械手运动模拟网络 算 法 的 自 动 控 制效果。机 械 手 末 端 执行器 的 初 始 点 坐 标 为 ( -20,- 10,16) cm,机械 臂 轨 迹 自 控 控 制前,关 节 5 和 关 节 6 的齐 次 坐 标 系 的 参 数设定见表 2。
4. 2 实验结果与分析
从机械手关节 5 到末端执行器的规划路径上,随机选取 15 个样本数据点,观测经过混合神经网络算法修正控制后实际轨迹与理论轨迹之间的偏差。为了使评判结果更为客观,同时引入了传统的曲线拟合控制、模糊推理控制和 PID 控制参与对比。轨迹纠偏结果见表 3。
采样点数据统计结果显示: 多个采样点轨迹与理论值比较,混合神经网络算法自动控制后实际轨迹与理论值偏差均值较小,远低于 3 种现有控制算法,能够更好地满足企业焊道要求; 而从 VARP 值的统计结果来看,混合神经网络算法 VARP 值精确到 0. 01 后趋近于 0,而曲线拟合方法和 PID 控制方法的 VARP 值分别为 0. 02,表明机械手轨迹经过自动化控制后,局部仍有较大的偏差。机械手被广泛应用到工业领域,除了考虑移动轨迹的控制精度以外,工作效率也是衡量机械手性能的重要指标之一。将仿真迭代次数设定为 60 次,观测优化前和优化后关节 5 和关节 6 运动时间的变化,见图 8 和图 9。
焊接机械手移动过程中基于混合神经网络算法优化后,关节 5 和关节 6 的移动时长分别减少了 0. 530 s 和 0. 495 s,对于企业而言,能够显著提高批量作业的效率。
5 结束语
随着人工智能技术、机器学习技术的不断发展和进步,以神经网络和深度学习为代表的智能算法越来越多地被应用到工业制造领域。在机械手轨迹自动控制和偏差修正中,本文作者将 RBF 神经网络与 LSTM 算法进行了深度融合,利用 LSTM 长短记忆结构门的设计,抑制神经网络隐含层数据训练中出现的梯度膨胀问题,提高轨迹定位的精度。仿真实验结果也证明: 混合神经网络自动控制算法,对于轨迹偏差纠正和机械手工作效率提高具有良好的改善作用。
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >