本技术介绍了一种地震响应数据增强技术,利用非线性核函数和进化策略对建筑地震响应数据进行多维正态分布建模和采样,以扩充小样本数据,提高数据集的多样性和代表性。
背景技术
随着城市化进程的推进,我国城市建筑群的规模不断扩大、功能耦合愈发紧密、结构形式日趋复杂。这导致了我国城市建筑群具有较高的地震灾害暴露风险。一旦发生地震,建筑群的破坏可能引发严重的人员伤亡和经济损失后果。因此,对城市建筑群的震损预测尤为重要。根据美国太平洋地震研究中心出版的FEM基于非线性核函数与进化策略的地震响应样本扩充方法P-58报告,目前在地震工程框架下有三种震损预测方法,即基于强度的预测、基于情景的预测与基于时间的预测。其中,基于强度的预测方法为基础,其余二者在其上扩展。该方法需要指定拟考虑的地震强度,并相继计算出该强度下的结构地震响应、破坏和损失等各项性能指标。
为计算上述性能指标,需要对城市建筑群开展结构建模及动力时程分析。但考虑到城市尺度上的建筑数量众多,若对每一栋建筑都按照传统方法开展力学建模和动力分析显然是不可行的。所幸,机器学习技术为解决以上问题提供了潜在的解决之法。该技术只需对城市中的部分建筑开展动力时程分析来收集训练数据,进而以地震动强度参数和建筑特征参数作为输入特征,以结构的工程需求参数作为输出标签,通过训练机器学习模型即可实现对城市中所有建筑的地震响应预测。由于该技术仅需对城市中的部分建筑开展力学建模和响应计算,便能实现对全体建筑的地震响应预测,因此大幅降低了城市建筑群震损预测的计算成本。
然而,为收集足量的结构响应数据来保证机器学习模型的充分训练,需要大量(几百或几千)地震动输入与非线性时程分析,计算耗时巨大。在工程实践中,为节约计算资源,通常仅开展有限次数的非线性时程分析。这使得在城市建筑群响应预测任务中,仅能基于小样本来训练机器学习模型,从而大幅增加了任务的建模难度。然而针对上述问题,当前尚缺少一套适用于工程实践的城市建筑群地震响应数据集的样本扩充方法。该方法应能在小样本的建筑地震响应数据基础上,通过数据扩充技术获取足量的训练样本,从而训练出能有效预测全体建筑群地震响应的机器学习模型。针对这一技术空白,本发明拟通过建立并采样地震响应数据的高维联合正态分布模型,以扩充小样本建筑地震响应数据集。在此基础上,由于建筑地震响应数据具有复杂的非线性特征关联,若在建立数据集的联合分布模型时仍采用传统的建模方法,即使用线性核函数来计算分布模型的协方差矩阵,则会导致模型失真,无法准确反映原始数据分布,从而影响数据扩充的精度。因此,有必要在建立地震响应数据的联合分布模型时引入非线性核函数,以精准捕捉响应数据的非线性特征。此外,在利用非线性核函数来建立上述联合分布模型时,通常采用数据驱动的方法,利用最大边际似然优化法来确定核函数超参数的最佳值。然而,由于边际似然函数对于非线性核函数超参数的非凸特性,优化过程往往陷入局部最优,无法达到全局最优解,从而影响了数据扩充算法的稳定性。
因此,如何合理引入非线性核函数以实现准确且稳定的样本扩充,同样是基于机器学习的建筑群地震响应预测面临的关键技术难题。
实现思路