技術(shù)類型: 發(fā)明專利
交易方式: 完全轉(zhuǎn)讓
專利號(hào):CN201910888992.9
本發(fā)明公開了一種結(jié)合DenseNet和resBi?LSTM的中文句子級唇語識(shí)別方法,本發(fā)明將唇語識(shí)別拆分為拼音預(yù)測與語言翻譯兩個(gè)部分,降低了唇語識(shí)別的難度。
使用DenseNet提取視覺特征,充分利用淺層特征,有效緩解了梯度消失的問題,并且減少了網(wǎng)絡(luò)的參數(shù)。使用1×1卷積代替全連接實(shí)現(xiàn)特征降維的功能,保留了特征中的空間信息,在唇語識(shí)別技術(shù)研究中,空間信息起著重要作用。
使用resBi?LSTM進(jìn)行視覺特征的處理,最后得到結(jié)合了視覺特征和語義特征的復(fù)雜特征,減少了有效信息的損失,提高了唇語識(shí)別的準(zhǔn)確率。
主辦單位:營口市科學(xué)技術(shù)局 服務(wù)咨詢:0417-2833747
地址:遼寧省營口市站前區(qū)少年宮里學(xué)府園A4
遼公網(wǎng)安備 21080202000238號(hào)
技術(shù)支持:科易網(wǎng)