华电北风吹
天津大学认知计算与应用重点实验室 日期:2015/12/11高斯判别分析属于生成模型,模型终于学习一个特征-类别的联合概率。
0 多维正态分布
确定一个多维正态分布仅仅须要知道分布的均值向量μ∈Rn×1和一个协方差矩阵Σ∈Rn×n. 其概率密度函数例如以下: p(x;μ,Σ)=1(2π)n/2|Σ|1/2exp(−12(x−μ)TΣ−1(x−μ))(0)一、高斯判别分析
适用范围:输入特征是连续 模型表述: y∼Bernoulli(ϕ)(1-1) x|y=0∼N(μ0,Σ)() x|y=1∼N(μ1,Σ)() 结合公式0能够将公式1-1写为: p(y)=ϕy(1−ϕ)1−y(1-2) p(x|y=0)=1(2π)n/2|Σ|1/2exp(−12(x−μ0)TΣ−1(x−μ0))() p(x|y=1)=1(2π)n/2|Σ|1/2exp(−12(x−μ1)TΣ−1(x−μ1))() 能够看到对于二分类高斯判别分析。模型的參数是ϕ,μ0,μ1,Σ。注意到这里的两个n维正态分布公用了一个协方差矩阵。 对于m个输入样本,有 p(x(i),y(i);ϕ,μ0,μ1,Σ)=p(y(i);ϕ)p(x(i)|y(i);μ,Σ)(1-3) easy得到对数似然函数例如以下 l(ϕ,μ0,μ1,Σ)=log∏mi=1p(x(i),y(i);ϕ,μ0,μ1,Σ)(1-4) 求解似然函数最大化得到高斯判别分析的模型參数解形式例如以下: ϕ=1m∑mi=11{ y(i)=1}(1-5) μ0=∑mi=11{ y(i)=0}x(i)∑mi=11{ y(i)=0}() μ1=∑mi=11{ y(i)=1}x(i)∑mi=11{ y(i)=1}() Σ=1m∑mi=1(x(i)−μy(i))(x(i)−μy(i))T()二、高斯判别分析与逻辑回归
能够easy写出高斯判别分析的预測函数。因为是生成模型。模型存在两种输出p(y=1|x。ϕ,μ0,μ1,Σ)和p(y=0|x;ϕ,μ0,μ1,Σ)。在这里重点关注第一个。 p(y=1|x。ϕ,μ0,μ1,Σ)=p(y=1|x)p(y=1|x)+p(y=0|x)(2-1) 经过变换,分解组合等变换操作能够得到例如以下形式: p(y=1|x。ϕ,μ0,μ1,Σ)=11+e−θTx(2-2) 注:分子分母同除以分子,消除同类项。系数转化为指数上的指数,矩阵展开相减消除等简单操作就可以得到。 尽管能够得到相似的格式。可是高斯判别分析与逻辑回归仍然存在非常大差别: 1、模型性质:高斯判别分析属于生成模型。逻辑回归属于判别模型 2、p(y=1|x)和p(y=0|x)在逻辑回归中和为1。在高斯判别分析中不存在这个性质。 3、模型如果:高斯判别分析如果样本特征在每一个类别下分别服从于各异的高维正态分布。逻辑回归是类别标签满足伯努利分布如果下的广义线性模型。