摘要
朴素贝叶斯方法是基于贝叶斯定理与条件假设的分类方法
[1] 特征条件独立假设,求输入/出的联合概率分布d
[2] 利用贝叶斯定理求出最大后验概率
[x] Edit By Porter, 积水成渊,蛟龙生焉。
贝叶斯公式
p(c∣x)=P(x)p(x∣c)P(c)
朴素贝叶斯基本方法(X,Y 独立同分布)
训练数据集T:
T=(x1,y1),(x2,y2),...,(xN,yN),
由$$P(x,y)$$独立同分布产生.
P(Y=ck∣X=x)=∑kP(X=x∣Y=ck)P(Y=ck)P(X=x∣Y=ck)P(Y=ck)
公式概念
P(X,Y)$$ 是独立同分布产生的联合概率分布。 - 先验概率分布 $$P(Y=c_{k}),k=1,2,3,...,k
P(X=x∣Y=ck)=P(X1=x1,X2=x2,...XN=xN∣Y=ck),k=1,2,3,...,k
P(Y=ck∣X=x)
朴素贝叶斯的表达式
由于朴素二字的前提是独立特征分布概率,所以条件独立假设为(条件概率)为:
P(X=x∣Y=ck)=P(X1=x1,X2=x2,...,Xn=xn∣Y=ck)
=j=1∏nP(Xj=xj∣Y=ck)
朴素贝叶斯实际上是学习到生成数据的机制,所以属于生成学习模型
朴素贝叶斯分类器
于是朴素贝叶斯分类器可表示为:
y=f(x)=argmaxck∑kP(Y=ck)∏jP(Xj=xj∣Y=ck)P(Y=ck)∏jP(Xj=xj∣y=ck)
由于上式分母对$$c_{k}$$,都是相同的,所以分类器的输出y又可以是:
y=f(x)=argmaxckP(Y=ck)j∏P(Xj=xj∣y=ck)
贝叶斯估计
条件概率贝叶斯估计
P(Xj=ajl∣Y=ck)=∑i=1NI(yi=ck)+Sjλ∑i=1NI(xij=ajl,yi=ck)+λ,j=1,2,...,n;l=1,2,..,Sj;k=1,2,...,K
先验概率的贝叶斯估计
P(Y=ck)=N+kλ∑Ni=1I(yi=ck)+lambda,k=1,2,...,K
参考
参考文档来源2:李航-朴素贝叶斯