浅谈自然语言处理基础（上）-赢咖4注册

aihot 2020-11-12 11:20:41 OpenCV | 查看评论

　　第三步就是依照已有的条件概率代入进行计算了。

　　构造贝叶斯网络是一项复杂的任务，涉及表示、推断和学习三个方面内容。

　　首先是表示，贝叶斯网络的表示代价很高，即便在上例中随机变量仅有两种取值的简单情况下，一个联合概率分布也需要提供2^n种不同取值下的概率。

　　然后是推断，由于贝叶斯网络是变量及其关系的完整模型，因此可以回答关于变量的询问，比如，当观察到某些变量（证据变量）时，推断另一些变量子集的变化。常用的精确推理方法包括变量消除法和团树法。

　　最后是学习，贝叶斯网络的学习有两种，一种是参数学习，另一种是结构学习。参数学习的目的是确定变量之间相互关联的量化关系，即依存强度估计。结构学习是寻找变量之间的图关系。

　　贝叶斯网络是一种不定性因果关联模型，能够在已知有限的、不完整、不确定信息的条件下进行学习和推理，因此广泛应用于故障诊断和维修决策等领域。在自然语言处理中也被应用于汉语自动分词和词义消歧等任务。

　　其实贝叶斯网络与我们在《浅谈深度学习基础》中讲过的人工神经网络非常相似。他们的共同点如下：

它们都是有向图，每一个节点只取决于前一级节点，而与更前面的节点无关，也就是说遵从马尔可夫假设。贝叶斯网络其实就是马尔可夫链的拓展。
它们的训练方式相似。
对于很多模式分类问题，这两种方法在效果上相似，也就是说很多用人工神经网络解决的问题，也能用贝叶斯网络解决，反之亦然，但是效率可能不同。如果将它们都看做是统计模型，那么这两种模型的准确性也是类似的。
它们的训练计算量都特别大。

　　它们也有很多不同之处：

人工神经网络在结构上是完全标准化的，而贝叶斯网络更灵活。
在人工神经网络中，虽然神经元的激活函数可以为非线性函数，但是各个输入变量只能先进行线性组合，最后对前面组合出来的结果进行非线性变换，因此用计算机实现起来比较容易。而贝叶斯网络，变量可以组合成任意的函数，毫无限制，在获得灵活性的同时，也增加了复杂性。
贝叶斯网络更容易考虑上下文的相关性，因此可以解码一个输入的序列，比如将一段语音识别成文字，或者将一个英语句子翻译成中文，而普通的人工神经网络的输出相对孤立，它可以识别一个个字，但是很难处理一个序列（RNN就是为了解决这个问题而设计的）。