基于扩展 N 元文法模型的快速语言模型预测算法

本文刊于: 《自动化学报》 年第期

关键词:
语音识别 语言模型预测 N元文法模型 解码

基于扩展 N 元文法模型的快速语言模型预测算法
摘要
     针对基于动态解码网络的大词汇量连续语音识别器, 本文提出了一种采用扩展 N 元文法模型进行快速语言模型(Language model, LM) 预测的方法. 扩展 N 元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法, 从而大大简化了解码器的实现, 极大地提升了语言模型预测的速度, 使得高阶语言模型预测成为可能. 扩展 N 元文法模型在解码之前离线生成, 生成过程利用了 N 元文法的稀疏性加速计算过程, 并采用了词尾节点前推和分数量化的方法压缩模型存储空间大小. 实验表明, 相比于采用动态规划在解码过程中实时计算语言模型预测分数的传统方法, 本文提出的方法在相同的字错误率下使得整个识别系统识别速率提升了 5 ~ 9 倍, 并且采用高阶语言模型预测可获得比低阶预测更优的解码速度与精度.

基金项目:
国家高技术研究发展计划(863计划)(2008AA040201)国家自然科学基金(90920302),国家科技支撑计划(2009BAH41B01),国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助

本文地址:www.fabiao.net/content-18-17021-1.html

上一篇:满足重构概率约束的更少贝努利观测
下一篇:基于最大互信息区域跟踪的人体行为检测算法

分享到: 分享基于扩展 N 元文法模型的快速语言模型预测算法到腾讯微博           收藏
发表网-基于扩展 N 元文法模型的快速语言模型预测算法-在线咨询