的理论基础在年前后由等人建立随后由的和的等人应用到语音识别中和等人进步推动了的应用和发展。有算法成熟效率高易于训练等优点自世纪年代开始被广泛应用于语音识别手写字识别和天气预报等多个领必 手机号码数据 要域目前仍然是语音识别中的主流技术。 基于-的声学模型尽管具有拟合任意复杂分布的能力但它也有个严重的缺陷即对非线性数据建模效率低下。
因此很久以前相关研究人
员提出采用人工神经网络代替建模状态后验概率。但是由于当时计算着关 垃圾邮件网关如何识别威胁 键角能力有限很难训练两层以上的神经网络模型所以其带来的性能改善非常微弱。世纪以来机器学习算法和计算机硬件的发展使得训练多 隐层的神经网络成为可能。实践表明在各种大型数据集上都取得了远超过的识别性能。因此-替代-成为目前主流的声学建模框架。
端到端模型传统语音识别系
统的声学建模般通过发音单元声学模型词典等信息源建立从声学观察序据公司 最後的資料庫 发展需求列到单词之间的联系。每部分都需要单独的学习训练步骤较为烦琐。端到端(–,结构使用个模型把这三个信息源囊括在起实现从观察序列到文字的直接转换。最新的些进展甚至把语言模型的信息也囊括进来取得了更好的性能。自年以来端到端模型日益成为语音识别的研究热点。