本文基于毫米級全方位無回轉半徑移動機器人課題。微系統(tǒng)配置示意圖如圖1所示。主要由主機Host(配有圖像采集卡)、兩個CCD攝像頭(其中一 個為顯微攝像頭)、微移動裝配平臺、微機器人本體和系統(tǒng)控制電路板等組成。計算機和攝像機組用于觀察微機器人的方位,控制系統(tǒng)控制微機器人的移動。
本文在系統(tǒng)控制電http://www.szmzhg.com/電感廠家路中嵌入式實現(xiàn)語音識別算法,通過語音控制微機器人。 微機器人控制系統(tǒng)的資源有限,控制方法比較復雜,并且需要有較高的實時性,因此本文采用的語音識別算法必須簡單、識別率高、占用系統(tǒng)資源少。 HMM(隱馬爾可夫模型)的適應性強、識別率高,是當前語音識別的主流算法。使用基于HMM非特定人的語音識別算法雖然借助模板匹配減小了識別所需的資源,但是前期的模板儲存工作需要大量的計算和存儲空間,因此移植到嵌入式系統(tǒng)還有一定的難度,所以很多嵌入式應用平臺的訓練部分仍在PC機上實現(xiàn)。 為了使訓練和識別都在嵌入式系統(tǒng)上實現(xiàn),本文給出了一種基于K均值分段HMM模型的實時學習語音識別算法,不僅解決了上述問題,而且做到了智能化,實現(xiàn)了真正意義上的自動語音識別。 1 增量K均值分段HMM的算法及實現(xiàn) 由于語音識別過程中非特定的因素較多,為了提高識別的準確率,針對本系統(tǒng)的特點,采用動態(tài)改變識別參數(shù)的方法提高系統(tǒng)的識別率。 訓練算法是HMM中運算量最大、最復雜的部分,訓練算法的輸出是即將存儲的模型。目前的語音識別系統(tǒng)大都使用貝斯曼參數(shù)的HMM模型,采取最大似然度算 法。這些算法通常是批處理函數(shù),所有的訓練數(shù)據要在識別之前訓練好并存儲。因此很多嵌入式系統(tǒng)因為資源有限不能達到高識別率和實時輸出。 本系統(tǒng)采用了自適應增量K均值分段算法。在每次輸入新的語句時都連續(xù)地計算而不對前面的數(shù)據進行存儲,這可以節(jié)約大量的時間和成本。輸入語句時由系統(tǒng)的識別結果判斷輸入語句的序號,并對此語句的參數(shù)動態(tài)地修改,真正做到了實時學習。 K均值分段算法是基于最佳狀態(tài)序列的理論,因此可以采用Viterbi算法得到最佳狀態(tài)序列,從而方便地在線修改系統(tǒng)參數(shù),使訓練的速度大大提高。 為了達到本系統(tǒng)所需要的功能,對通常的K均值算法作了一定的改進。在系統(tǒng)無人監(jiān)管的情況下,Viterbi解碼計算出最大相似度的語音模型,根據這個假 設計算分段K均值算法的輸入參數(shù),對此模型進行參數(shù)重估。首先按照HMM模型的狀態(tài)數(shù)進行等間隔分段,每個間隔的數(shù)據段作為某一狀態(tài)的訓練數(shù)據,計算模型 的初始參數(shù)λ=f(a,A,B)。采用Viterbi的最佳狀態(tài)序列搜索,得到當前最佳狀態(tài)序列參數(shù)和重估參數(shù)θ,其中概率密度函數(shù)P(X,S|θ)代替 了最大似然度算法中的P(X,θ),在不同的馬爾科夫狀態(tài)和重估之間跳轉?;贙均值算法的參數(shù)重估流程如下: 大功率電感廠家 |大電流電感工廠