- 写在前面的话
- 数学原理
- 准备流程
- 贝叶斯分类器
- Laplace校准
- 商品标题分类
- 自提问解答
- 分类器总结
0. 写在前面的话
当我在写这篇文章的时候是在第二遍学习朴素贝叶斯分类算法了,后面或许还会有更多实践才能深刻的理解。
朴素贝叶斯是一种构建分类器的方法,其样本的每个特征之间都是互相独立的,这样我们可以通过多个特征对应的分类确定样本的所属分类的概率。
1. 数学原理
若一个样本有n个特征,分别用x1,x2,...xn
表示,将其划分到yk的可能性
$$ P(yk|x1,x2,…xn)=P(yk)P(x1|yk) P(x2|yk)…P(xn|yk) $$