本技术涉及一种权重自进化的智能汽车个性化换道决策系统,包括:驾驶风格量化模块、换道决策模块、换道性能基线评估模块;驾驶风格量化模块给出驾驶风格量化结果,输出至换道决策模块,换道决策模块计算SV和PV的收益函数及PV的收益函数各项权重并做换道决策判断,换道性能基线评估模块结合数据驱动的换道决策子模块输出的决策结果,评估当前更优的决策结果,输出评估结果至权重自学习子模块及基线自评估器,权重自学习子模块动态调整PV的收益函数各项权重,基线自评估器根据评估结果决定当前权重自进化过程是否终结。本发明具备自主学习能力,大幅提高了换道决策系统的工况适应性与灵活性,能够在各类复杂多变的行驶工况中取得良好的性能表现。
背景技术
随着汽车智能化水平不断提高,配备高等级自动驾驶系统的智能汽车的产销量不断增加。高等级的自动驾驶系统应当具备感知复杂交通态势的能力,并在与周围车的交互中做出正确的行为决策,在降低碰撞风险的同时,提高交通通行效率。换道行为是微观交通流的核心组成部分,是典型的车间交互行为。在换道交互过程中,自车能否正确理解周围车的意图,并做出正确决策,是当前智能汽车技术领域的重大技术挑战。
为了表征不同驾驶人驾驶行为的个性化差异,结合基于驾驶行为的驾驶风格分类算法的智能汽车个性化换道决策系统被建立。目前,智能汽车个性化换道决策系统通常包括数据驱动的换道决策与基于机理规则的换道决策两大类。数据驱动的换道决策通常利用学习类方法,将自车及周围车的运动学参数等特征作为学习算法的传入,利用神经网络等方法拟合出传入特征与自车行为意图间的内在映射关系;基于机理规则的换道决策通常利用人工设置的规则及常识的认知建立驾驶人的驾驶行为与驾驶人意图的映射关系。然而,数据驱动的和基于机理规则的智能汽车换道行为决策系统尚存在以下技术问题:
1.当前基于驾驶行为的驾驶风格分类算法仅可作定性分析,难以作定量分析。目前所构建的驾驶风格分类算法仅将驾驶人的驾驶风格分为谨慎型、一般型、激进型三类。事实上,驾驶人的驾驶风格存在个体差异,且易受所处交通环境的影响。准确评估驾驶风格对于正确判断驾驶人的行驶意图从而做出正确决策尤为重要,但是,现有的驾驶风格分类算法难以提供驾驶风格的量化指标。
2.数据驱动的换道决策系统建立车辆行驶过程中周围车及自车的运动学变量与自车换道决策间的多维映射关系,其本质是通过在海量数据中学习隐含的交互逻辑,从而建立传入参数与输出结果的内生关系。由于数据驱动的方法属于黑盒类算法,算法的可解释性差,因而难以对各系统参数与换道决策期间交通车间的交互关系做出显式表达,这导致对系统的调参存在现实困难,进一步导致系统输出不稳定甚至存在安全隐患。
3.基于机理规则的换道决策系统利用对驾驶人驾驶行为的观察,建立车辆运动学信息与车辆行驶意图间具备实际含义的函数映射关系,综合考虑自车运动学约束及行车安全性,依据人工设定的决策规则进行换道决策。然而,现实交通环境复杂多变,人工规则难以覆盖各类行驶工况,这造成了基于机理规则的换道决策系统泛用性差的问题。与此同时,基于机理规则的换道决策系统中的参数通常保持固定,这使得系统难以具备自主学习的能力,进一步限制了基于机理规则的换道决策系统的性能。
实现思路