关键词:
燃料电池混合动力汽车
能量管理策略
车速预测
自适应等效氢耗最小策略
深度强化学习
摘要:
随着国际能源局势矛盾恶化,各个国家对于新能源的重视程度加深,这为汽车行业的发展提出了新的要求。燃料电池由于其能源转换效率高、环境友好、能源补充迅速等优点越来越受到人们的重视。由于燃料电池系统的动态响应慢、输出特性较软,通常与其他能量源共同使用,因此合理的能量管理策略对于提升燃料电池混合动力汽车的整车经济性能至关重要。当前的能量管理策略其经济性能与工况适应性均有待提高,因此本文从提升能量管理策略的自适应性出发,结合全功率燃料电池汽车特点,开发了结合工况预测的自适应等效氢耗最小策略和基于改进的双延迟深度确定性策略梯度的能量管理算法。本文的主要内容有:
首先,对当前燃料电池混合动力汽车的四种构型进行了优缺点分析,最终选取燃料电池和动力电池为主要能量源的全功率型燃料电池汽车构型。然后对燃料电池系统的工作原理和具体结构进行了分析,搭建了燃料电池系统简化模型并进行了验证。分析并搭建了燃料电池混合动力汽车中驾驶员、驱动电机、动力电池以及整车纵向动力学模型,完成了燃料电池混合动力汽车仿真模型的搭建,为后续的章节奠定了仿真平台基础。
其次,开展了基于数据驱动的车速预测研究。针对当前研究中常用的马尔科夫车速预测和基于BP神经网络的车速预测方法进行了原理分析和仿真验证,证明了基于神经网络的车速预测方法的精度要优于马尔科夫车速预测。在此基础上,通过对数据集进行交错划分并对隐藏层神经元数量进行优化,提升了BP神经网络的预测性能,最后为了验证所搭建的神经网络车速预测模型的泛化性能,选取了两段随机驾驶工况进行车速预测,结果表明在两段随机工况中,改进的BP神经网络的性能均要优于改进前的网络,并且为了进行预测效果的对比,本文还搭建了RBF神经网络和LSTM神经网络,结果证明了本文中改进的BP神经网络预测模型的有效性。
第三,重点研究了基于优化的能量管理策略。首先对全局最优的动态规划算法进行了原理分析和仿真验证;后续对自适应等效氢耗最小策略进行了原理分析,并对实际应用中两种等效因子的调整形式进行了分析,最终选取了连续形式的等效因子,并针对等效因子中的参数进行了敏感度分析,确定了其参数的大小;另外,为了增加算法的工况适应性,提出了一种结合车速预测的等效因子参数自适应调整方法,为了验证其性能,在组合的标准工况和随机工况上对提出的算法进行验证,结果表明结合预测的方法在不同工况上的经济性均优于未结合预测的能量管理方法。
最后,进行了基于深度强化学习的自适应能量管理策略的开发。首先对强化学习的基本概念、原理进行了分析,在对不同的强化学习方法进行对比之后,选取了双延迟深度确定性策略梯度算法(TD3)作为搭建能量管理策略的基础,同时为了改进深度强化学习模型在训练过程中的稳定性,在双延迟深度确定性策略梯度算法的基础上增加了行为克隆技术(TD3+BC)。为了进行对比,本文也同时选取了相关研究中常用的深度确定性策略梯度算法(DDPG)作为对比,然后基于两种算法分别搭建了能量管理策略。为了验证搭建算法的性能,在组合的标准工况和随机工况上分别进行了仿真测试,结果表明,TD3+BC算法在训练的收敛速度和稳定性上均优于DDPG算法,且基于TD3+BC能量管理策略在两种工况上的性能均要优于基于DDPG的能量管理策略,展示了本文算法的经济性和工况适应性。