提升模型效能:深度探索贝叶斯优化策略

贝叶斯优化

贝叶斯优化-火星ggbo

首先,贝叶斯优化能做什么?给我的感觉是无所不能,自然其效果也可能不尽如人意。贝叶斯优化,可以执行回归任务(尽管总感觉这只是一个辅助功能),但主要用途是解决“优化问题”。

贝叶斯优化旨在解决以下类型的问题:

注:使用"argmin"与实质上并无差异,实际上[1]中使用的便是"argmin"。

通常,我们并不清楚,因此,这类问题难以采用传统的梯度上升("argmin"对应梯度下降)方法来解决。贝叶斯优化采用概率代理模型来应对这些问题。所谓的决策,通常称为决策空间。药物配方是一种决策,神经网络卷积核大小等也可以视为一种决策。而且,这种决策与最终输出的关系(即)往往难以知晓。这正是贝叶斯优化的强大之处。

上述两幅图分别来自[2]和[1],由于一些符号的差异,以下除特别指明外,均采用[2]中的符号。

贝叶斯优化,在每次迭代中,首先在代理模型的“先验”基础上,通过最大化采集函数(该函数通常是对评估点分布及提升的一种权衡)。新的评估点作为输入传入系统,获得新的输出,以此来更新和概率代理模型。

其中

上述图示展示了贝叶斯优化的一种简单演示。黑色虚线表示目标函数,而黑色实线表示我们拟合的曲线(图中是通过对概率代理模型求均值获得的)。蓝紫色区域是。下方的绿色曲线则是每次迭代的,可以看出,每次迭代的评估点都是最大值所对应的。

接下来,我们分别讨论概率代理模型和采集函数。

概率代理模型,顾名思义,就是用来代理的概率模型。

参数模型,即可由参数来决定。如果我们给定的先验分布。那么,通过贝叶斯公式,我们可以获得的后验分布:

现在问题来了,我们还不知道和啊。是一个似然分布,通常通过来计算,当然,我们得知道。至于,比较难计算,但在这里仅扮演系数的作用,所以用核方法就能解决。事实上,我们常常选择共轭先验分布作为的先验分布。

这里给出一个例子:实验室有K种药,我们需要通过药物实验来找出哪种药的效果最好。假设,药作用在某个病人身上只有成功治愈和失败两种可能,且不能通过一种药的效果来判断另一种药的疗效。这种类型的问题似乎被称为A/B测试,常用于新闻推荐等。

我们用表示药物,表示第种药物成功治愈病患的可能性,而表示病人的治疗情况(0失败,1治愈)。函数就是某种复杂的映射。让参数,。那么我们选择的概率代理模型是。

我们选择分布作为的先验分布,因为这是其共轭先验分布。

定义:

其中表示次评估中,选中药物且治疗失败的数目,则反之。只有成立为1否则为0。

那么,的后验概率为:

上述推导见附录。

从上述推导也能发现,超参数表示的治愈数和失败数。下图是以为先验的一个例子。

汤普森采样-wiki

那么在的基础上,如果找呢。以下采用的是汤普森采样(或后验采样):

,即从的后验分布中采样得到。

该模型的好处是:

下面是该模型的算法:

上述模型在应对组合类型时显得力不从心。例如,我们在从个元素中寻求一种搭配,每个元素有两种状态,那么总共就有种组合,如果为每种组合都设立一个,显然不切实际。更何况,先前模型的假设(无法从一种组合推断另一种组合的有效性)显得站不住脚。因为,不同组合往往有微妙的相关性。

采用线性模型,能较好地解决这一问题。

我们把每一种策略设为,并且概率代理模型为,现在成了权重向量。这只是代理模型的一部分,因为并没有体现“概率”的部分。

组合的观测值为,服从正态分布。很自然地,我们同样选择共轭先验分布作为的先验分布: normal_inverse_gamma-wiki

分布有4个超参数,而的后验分布(的条件下)满足:

其中的第行为。

推导见附录。

关于的选择,同样可以采用汤普森采样:

其中

线性模型有很多扩展:

其中,,常常为:

这里,,,均为超参数,至于这些超参数如何更新,我不大清楚。

非参数模型并非指没有参数,而是指参数(数量)不定。

我们先来看如何将先前的线性模型转换成非参数模型。

我们假设是固定的,且,即服从均值为,协方差矩阵为的多维正态分布。那么,,我们可以积分掉从而获得的一个边际分布:

推导见附录。

就像先前已经提到过的,我们可以引入,

将资料(设计)矩阵映射到,如此一来,相应的边际分布也需发生变化:

注意到,事实上,我们不需要特别指明,而只需通过kernel.

是新的位置,而是相应的预测,二者都可以是向量。

分子部分是一个联合的高斯分布。到此,我们实际上完成了一个简易的高斯过程,下面正式介绍高斯过程。

高斯过程-wiki

高斯过程-火星十一郎

高斯过程,其核心是均值函数(在贝叶斯优化中,我们常常选择其为0)和协方差函数,而观测值。通过高斯过程得到的序列,以及观测值都服从联合正态分布:

Kernel method- wiki

Matern covariance function- wiki

文献[1]给出的形式如下(实际上是的情况):

其中,,为平滑参数,为尺度参数,为第二类变形贝塞尔函数。

同时给出了几种常用的Matern协方差函数。

文献[2]给出的是另外一种表示方式:

其中,,是一个对角矩阵,其对角线元素为。

这些参数可以这么理解:

上面的一些参数,会在下面给出一些更新的方法。

log边际似然函数可以表示为:

似然边限函数可以表述为:

由图示可见,等式右侧被划分为三个部分,它们各自具有独特的内涵:

一个显而易见的思路是,对上述似然函数实施最大似然估算,进而获得估计值。

每次高斯过程的复杂度大约在某个级别,这主要是由计算矩阵逆运算所引起的。通过Cholesky分解,可以降低至。

因此,产生了一些算法,旨在克服这一难题。

SPGP从n个输入中挑选m个伪输入来替代,以达到降秩的目的。同时,这m个伪输入的位置也作为参数(尽管我不清楚如何更新它们)。其优点自然是,

可以将复杂度降低至。

然而,参数相对较多,容易产生“过拟合”现象。

根据Bochner定理,任何稳定的kernel都有一个正定的傅里叶谱表示:

随后,通过蒙特卡洛方法,抽取m个样本频率,来近似估算上述积分。从而获得近似的协方差函数,当数据集较小时,SSGP同样容易产生“过拟合”现象。

随机森林- Poll的笔记

随机森林可以作为高斯过程的一种替代。缺点是,数据缺失的地方,估计并不准确(边际更是常数)。另外,由于随机森林不连续,也就不可微,因此无法采用梯度下降(或上升)的方法来更新参数。另外令人困惑的是,随机森林的参数,即便我们给了一个先验分布,其后验分布如何求得呢?

首先,我们有一个效用函数,顾名思义,效用函数,是反映评估和对应的函数值(在条件下)的一个指标。论文[1]并没有引入这个效用函数,论文[2]引入这个概念可能是为了更好地解释。

一种选择采集函数的方法是期望效用:

其实挺奇怪的,因为对期望也就罢了,这个采集函数还对也求了期望,我的理解是,这样更加“模糊”,如果选择极大似然等方式产出的“精准”的,或许不能很好地让评估点足够分散,而陷入局部最优。而且,这样似乎就没有必要去估计参数,尽管代价是求期望。

从下面的一些算法中我们可以看到,往往没有这一步骤。

最后再次强调,采集函数的设计,通常是对exploration和exploitation的一种权衡。即,我们希望新的评估点既要和原来的那些数据点远一些(对未知区域的探索),又能够让能够提升(对当前区域的开发探索)。

PI的采集函数的设计思想很简单,就是我们要寻找一个评估点,这个点使得较已知的最大的(如果一开始是argmin就是最小的),令其为。往往,。

采集函数为:

注意,这里的是标准正态分布的概率函数。

这个采集函数里的效用函数是:

其中为指示函数。

当就是的最小值时,PI的效果非常好。

PI的一个“缺点”是,只关心提升的概率,而不关心提升的幅度,而,EI就涵盖了这两个方面。

通常,其提升函数由下式表示:

而相应的的采集函数是:

其中是标准正态分布的概率密度函数。式子通过积分变量替换可以推导得。

实际上就是效用函数。

采集函数为:

这个采集函数可以这样理解,对于任意一个,它有一个均值,有一个标准差(体现浮动范围和程度),我们认为比较可靠的界限,我们认为,有较大可能达到的值。所以最大化采集函数,就是最大化我们的这一种希望。

论文[2]中说的选择往往是Chernoff-Hoeffding界。听起来很神秘,但是,UCB现在似乎非常流行。另外,有一套理论,能够引导和规划超参数,使得能够达到最优。

不同之前的策略,基于信息的策略,依赖于全局最优解的后验分布。该分布,隐含在函数的后验分布里(不同的

代理模型介绍大全

代理模型在优化设计中的重要性不容忽视,它通过简化复杂计算,提高效率。本文将深入介绍代理模型的起源、定义、类型、构建方法以及可信度模型的区别。

起源于航空航天领域的多学科设计优化,代理模型应对了大量设计变量和状态变量、复杂耦合关系带来的挑战。它是一种近似数学模型,如飞行器优化设计中的重要工具,尤其在难以用直观函数表达的目标函数处理上大显身手。

代理模型的类型丰富多样,如多项式响应面、Kriging模型、神经网络等。以Kriging模型为例,它是通过回归模型与随机模型的结合,形成一个基于样本点和空间相关性的预测模型。

构建代理模型需要通过试验设计采集样本点,如经典的全因子设计或现代的拉丁超立方、均匀设计。然后进行数值分析,形成数据集,训练模型参数,常见的方法有最大似然估计和交叉验证。

代理模型根据可信度可分为高、低和变可信度。高可信度模型基于高精度数据,但成本高昂;低可信度模型成本低但精度有限。变可信度模型巧妙地结合两者,通过更多低可信度样本和少量高可信度样本,平衡了精度和成本,成为工程设计中的实用选择。

以上所转载内容均来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2020@163.com,本人将予以删除。
THE END
分享
二维码
< <上一篇
下一篇>>