宏樂(lè)聲紋對(duì)比控件下載 最新軟件|熱門(mén)排行|軟件分類(lèi)|軟件專(zhuān)題|廠商大全

您的位置: 首頁(yè)多媒體類(lèi)音頻處理 → 宏樂(lè)語(yǔ)音識(shí)別控件 官方版

宏樂(lè)語(yǔ)音識(shí)別控件

官方版 宏樂(lè)語(yǔ)音識(shí)別控件 網(wǎng)友評(píng)分:8
  • 軟件大小:10.00M
  • 軟件語(yǔ)言:中文
  • 軟件類(lèi)型:國(guó)產(chǎn)軟件
  • 軟件類(lèi)別:免費(fèi)軟件 / 音頻處理
  • 更新時(shí)間:2017-06-29 15:29
  • 運(yùn)行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
  • 軟件等級(jí):4級(jí)
  • 軟件廠商:
  • 官方網(wǎng)站:暫無(wú)
好評(píng):50%頂一個(gè)
壞評(píng):50踩一個(gè)

同類(lèi)相關(guān)軟件

軟件介紹

宏樂(lè)聲紋對(duì)比控件是一款對(duì)比聲紋來(lái)識(shí)別聲音的音頻處理軟件。這是一款非常實(shí)用的軟件,可以用到生活中的方方面面。歡迎需要的用戶(hù)來(lái)綠色資源網(wǎng)下載使用。

宏樂(lè)聲紋對(duì)比軟件介紹

宏樂(lè)聲紋對(duì)比控件可以對(duì)比任意兩個(gè)聲音句子的紋理,并獲得兩個(gè)聲紋的近似度的百分值。讓軟件設(shè)計(jì)者根據(jù)識(shí)別的結(jié)果控制各種設(shè)備或操縱軟件執(zhí)行相應(yīng)的功能。

用戶(hù)可以將不同的特征文件與數(shù)據(jù)庫(kù)一一對(duì)應(yīng)保存,然后通過(guò)對(duì)比函數(shù)從數(shù)據(jù)庫(kù)取出不同的特征文件與當(dāng)前的錄音結(jié)果對(duì)比,從而知道當(dāng)前的聲紋與數(shù)據(jù)庫(kù)內(nèi)的哪一個(gè)聲紋最吻合。

我們還為掌上電腦,或?qū)W習(xí)機(jī)提供DLL評(píng)分插件。通過(guò)它,可以獲得學(xué)生跟讀老師句子的吻合程度。

該控件還附帶一個(gè)精美的可變色按鈕控件,利用它可以美化程序的界面。

宏樂(lè)語(yǔ)音識(shí)別控件功能

1.Rocord 〔錄制〕(true 或 false) true 開(kāi)始錄音(控件在句結(jié)束后自動(dòng)停止錄音并識(shí)別)。

2.Establish 〔設(shè)置〕(true) 將當(dāng)前的錄音特征設(shè)置為對(duì)比特征。

3.Percentage 〔評(píng)分〕 獲取當(dāng)前對(duì)比結(jié)果的分?jǐn)?shù)值(0 表示根本不吻合,有數(shù)值表示相似度的百分比。)

4.AutoRecord〔自動(dòng)錄音〕(true 或 false) true 則啟動(dòng)適時(shí)錄音,源源不斷的將錄音的內(nèi)容進(jìn)行對(duì)比分析。Falae 則關(guān)閉自動(dòng)錄音。

5.Comp 〔對(duì)比特征〕從V9.0版本起,這個(gè)指令不再對(duì)比bin格式特征文件名,而是對(duì)比當(dāng)前啟用庫(kù)的一個(gè)特征名稱(chēng)!可用44.UserLib(啟用庫(kù)名稱(chēng))函數(shù)來(lái)選擇庫(kù)。

6.EstablishVoiceFileNameToComp 〔設(shè)聲音文件為對(duì)比〕(WAV格式聲音文件路徑名稱(chēng)) 將一個(gè)任意格式的WAV文件分析后獲取的聲紋特征設(shè)置為對(duì)比內(nèi)容。(注意:用聲音文件來(lái)對(duì)比,如果還沒(méi)有聲音庫(kù),請(qǐng)用16位單聲道8000采樣的格式記錄聲音,這樣可以省略格式轉(zhuǎn)換的過(guò)程。)

7.CompVoiceFile 〔對(duì)比聲音文件〕(WAV格式聲音文件路徑名稱(chēng)) 將一個(gè)任意格式的WAV文件(而不是錄音內(nèi)容)來(lái)對(duì)比。(可直接拖放Wav文件到本控件測(cè)試)

8.Noise 〔測(cè)噪音〕(true) 這個(gè)函數(shù)一般不用,因?yàn)榭丶?huì)在錄音結(jié)果

9.Volume 〔音量〕 獲取當(dāng)前錄音結(jié)果的音量 (最大值為100)

10.Painting 〔繪圖〕(true 或 false) true 則繪圖,false 則不繪圖。

11.RecordCharacterFileName 〔錄音特征文件名〕(bin格式文件名) 獲取當(dāng)前錄音結(jié)果的特征文件名全稱(chēng)。(特征文件的長(zhǎng)度為2310字節(jié){如果選擇身份鑒別長(zhǎng)度為2320字節(jié)},可以將這個(gè)文件用不同的名稱(chēng)命名保存到數(shù)據(jù)庫(kù)中對(duì)應(yīng)某個(gè)聲音文件,便于單獨(dú)或批量對(duì)比。通常這個(gè)文件名是控件包路徑+"\總特征.bin")

12.CompCharacterFileName 〔對(duì)比特征文件名〕(bin格式文件名) 獲取對(duì)比特征文件名的全稱(chēng)。(通常這個(gè)文件名為控件包路徑+"\總對(duì)比特征.bin")

13.OpenF12 〔允許F12鍵錄音〕(true 或 false) true 則允許F12鍵代替鼠標(biāo)錄音。(按下F12開(kāi)始錄音,放開(kāi)F12結(jié)束錄音。結(jié)束錄音的同時(shí)分析聲紋的相似度)

14.DiscriminateBody 〔鑒別身份〕 (true 或 false) 選擇 true 則比較嚴(yán)格的校對(duì)個(gè)人的聲紋,選擇 false 則適合男女老幼的各種音色。

15.Reverse 〔反向〕(true 或 false) true 則反向,用于相位相反的麥克風(fēng)接口。

16.Play (播放錄音) (true) 播放現(xiàn)場(chǎng)錄音的(學(xué)生)聲音,或 CompVoiceFile 函數(shù)調(diào)入的聲音文件。

17.Play_Comp (播放對(duì)比) (true) 播放用于對(duì)比的(老師)聲音。

18.Re_Recognition 〔重新識(shí)別〕(true 或 false) true ,主要用于“反向”之后的不重錄音而直接識(shí)別。

19.OCX_Path 〔控件路徑〕(true 或 false) true ,讀取控件所在的路徑全稱(chēng)。

20.IsOver 事件,這個(gè)事件在分析完畢后自動(dòng)啟用。能調(diào)用OCX控件的用戶(hù)在設(shè)計(jì)時(shí)雙擊本控件可以看到IsOver事件,然后在這個(gè)事件中插入分析完成后響應(yīng)的代碼。

21.Max_Record_Timer(沒(méi)有響應(yīng)的最大秒數(shù)) (1~60) 人工錄音方式時(shí)啟動(dòng)錄音后如果一直沒(méi)有聲音數(shù)據(jù)提交,將在這個(gè)值到后無(wú)條件停止錄音提交數(shù)據(jù)進(jìn)行分析(默認(rèn)值是6秒)。

22.PeakValue (峰值校驗(yàn) ) (true 或 false) true 則校驗(yàn)峰值誤差(校驗(yàn)峰值誤差有時(shí)會(huì)因?yàn)榄h(huán)境噪音太大導(dǎo)致聲音串首尾定位不準(zhǔn)而評(píng)分失敗)。

23.ALC (自動(dòng)電平 ) (true 或 false) true 則啟用自動(dòng)電平控制,能在聲音較小時(shí)放大,聲音太大時(shí)衰減到比較合理的電平。

24.WordNoumber (字段數(shù)) () 一個(gè)數(shù)值,顯示詞句切割出的段數(shù)(個(gè)別詞會(huì)無(wú)法分割而連接在一起,所以這個(gè)值并不代表字?jǐn)?shù),可以理解為嘴唇開(kāi)合的次數(shù)),用于將數(shù)據(jù)庫(kù)分類(lèi),減少識(shí)別時(shí)搜索的范圍。[注意:使用它分類(lèi)要考慮有可能誤差正負(fù)1個(gè)值;比如獲得的字段數(shù)是3,應(yīng)該在2、3、4字段庫(kù)尋找特征文件]

25.Zero (允許零分 ) (true 或 false) true是默認(rèn)值,在不吻合的因素太多時(shí)評(píng)分的值為零,但在老師與學(xué)生聲紋誤差較大時(shí)會(huì)也可能導(dǎo)致錯(cuò)評(píng)為零分的現(xiàn)象,此時(shí)應(yīng)該禁用它。

26.Word_Max_Timer(t) t是提交詞匯的反應(yīng)秒數(shù)(停頓提交詞匯的時(shí)間),范圍必須在0.125秒~3秒之間。(默認(rèn)值是0.66秒)

27.Auto_Clips (自動(dòng)剪輯) (true 或 false) 默認(rèn)為true;對(duì)應(yīng)于控件的“自剪”復(fù)選框。true則錄音按鈕點(diǎn)擊開(kāi)始錄音,當(dāng)音量小到只有噪音時(shí)提交錄音結(jié)果并分析。false則錄音的開(kāi)始與結(jié)束是手工控制,按下錄音按鈕[或使用Rocord_Start(true)函數(shù)]開(kāi)始錄音,放開(kāi)錄音按鈕[或使用函數(shù)Rocord_End(true)]結(jié)束錄音并提交分析。

28.Rocord_Start (開(kāi)始錄音) (true) 在“自剪”復(fù)選框(自動(dòng)剪輯)不選時(shí),啟動(dòng)錄音。

29.Rocord_End (結(jié)束錄音) (true) 在“自剪”復(fù)選框(自動(dòng)剪輯)不選時(shí),結(jié)束錄音并分析。

30.Filters_Infrasound (濾除次聲波) (true 或 false) false是默認(rèn)值,濾除次聲波的功能已經(jīng)在句子剪裁器中使用,通常對(duì)比現(xiàn)成的WAV文件才使用它,濾除非語(yǔ)音成分的超低音部分,主要排除板載聲卡的零點(diǎn)電平漂移或口風(fēng)或風(fēng)扇等帶來(lái)的低頻噪音。

31.FrequencyFitsTogetherRate (頻率吻合率) 對(duì)應(yīng)最上方的版塊,頻率曲線吻合的百分值

32.PeakMatchingRate (峰值吻合率) 對(duì)應(yīng)中間的版塊,峰值曲線吻合的百分值。

33.FrequencyChartFitsTogetherRate (頻譜吻合率) 在身份鑒別狀態(tài)下,它顯示頻譜的吻合百分值。

34.ReasonDoesNotMatch (不吻合原因) 在評(píng)分失敗后給出原因,鼠標(biāo)點(diǎn)擊分?jǐn)?shù)可以看到這個(gè)提示。

35.CutRatio (切割比例) 頭尾切割與最大值的倍數(shù),值在10~50之間,這個(gè)值影響數(shù)據(jù)頭尾定位的切割(默認(rèn)值=25)

36.FrequencyComp(頻率鑒別選擇) 頻率鑒別選擇,它控制最上方的頻率變化曲線版塊是否參與分析, 可以用 FrequencyComp(True) 或 FrequencyComp(False) 指令控制它。

37.Save(保存特征) 保存特征,并給特征命名;可用 Save("") 啟動(dòng)輸入板;或直接命名一個(gè)特征,如Save("1234")。

38.CompAll(批量對(duì)比(特征庫(kù)的所有內(nèi)容)) 用當(dāng)前的錄音與對(duì)比特征庫(kù)內(nèi)所有內(nèi)容進(jìn)行對(duì)比,可用 CompAll("") 指令啟動(dòng)批量對(duì)比。

39.AutoCompAll(自動(dòng)批量對(duì)比) 分析完錄音后自動(dòng)啟動(dòng)批量對(duì)比,可用 AutoCompAll( true ) 啟用它 用AutoCompAll( false ) 禁用它。

40.MaxNumber(有分?jǐn)?shù)的結(jié)果個(gè)數(shù)) 有分?jǐn)?shù)的結(jié)果個(gè)數(shù),可用 MaxNumber(0) 讀取它。

41.Answerp(取第幾個(gè)答案) 取第幾個(gè)分?jǐn)?shù) ,可以用 AnswerP(1) 獲得最高分 用 AnswerP(2) 獲得第二高分,其他以此類(lèi)推。

42.AnswerT(取第幾個(gè)答案) 取第幾個(gè)特征結(jié)果名稱(chēng).

宏樂(lè)聲紋對(duì)比工具使用方法

測(cè)試的技巧主要是先調(diào)整好麥克風(fēng)的靈敏度,然后點(diǎn)擊“錄音”,發(fā)音停頓則結(jié)束錄音并評(píng)分。此時(shí)會(huì)看到一條亮青色的變化曲線;之后點(diǎn)擊“保存特征”,記錄到特征庫(kù)中,同時(shí)會(huì)看到亮青色的曲線變?yōu)榛疑?/p>

如果只是單獨(dú)對(duì)比兩個(gè)聲音特征請(qǐng)將“批量”復(fù)選框設(shè)為不選,然后在特征列表中選中要對(duì)比的內(nèi)容,這是會(huì)看到灰色的曲線對(duì)應(yīng)特征而變化,點(diǎn)擊“錄音”按鈕,錄入一個(gè)句子,則可看到評(píng)分的結(jié)果。

V9以上的版本默認(rèn)錄音結(jié)束后對(duì)比當(dāng)前特征庫(kù)的所有特征,并將對(duì)比結(jié)果從高分到低分順序排列。

這些過(guò)程完全可以用軟件通過(guò)相應(yīng)的函數(shù)來(lái)控制;具體請(qǐng)參閱函數(shù)說(shuō)明。

錄音時(shí)麥克風(fēng)不能正對(duì)準(zhǔn)口中央,你會(huì)發(fā)現(xiàn)用于語(yǔ)音識(shí)別的耳麥麥克風(fēng)都是偏離嘴巴的。同時(shí)不易遠(yuǎn)距離錄音,當(dāng)有效的聲音與環(huán)境噪音達(dá)不到5倍以上,識(shí)別將不理想;最重要的是如何獲得連續(xù)的頻率曲線,如果破碎,要分析原因。對(duì)于一個(gè)詞組或句子來(lái)說(shuō),曲線斷續(xù)是正常的,因?yàn)橐恍┱Z(yǔ)音成分沒(méi)有頻率特征,比如聲母T、F等,對(duì)應(yīng)它的部分是一個(gè)缺口,這里指的破碎是指對(duì)應(yīng)一個(gè)字中的曲線是否連續(xù)。

峰值曲線的切割是自動(dòng)的,但要注意錄音時(shí)是否有干擾的噪音,請(qǐng)留意曲線的頭尾是否正常切割,再將它保存到特征庫(kù)中。

特征庫(kù)是需要長(zhǎng)期訓(xùn)練的,合理的方法是設(shè)為對(duì)比以后,重錄一次,看看分?jǐn)?shù)是否足夠高,不高的要重錄。

(如果特征曲線總是出不來(lái),請(qǐng)嘗試“反向”功能,通常在面板插入的麥克風(fēng)插孔需要“反向”)

為了提高識(shí)別率,不同時(shí)出現(xiàn)的特征庫(kù)要盡可能的分類(lèi)。假設(shè)正在操控一個(gè)窗體,而窗體上只有幾個(gè)按鈕,這種情況下應(yīng)該為該窗體單獨(dú)建立一個(gè)小特征庫(kù),庫(kù)內(nèi)只有相應(yīng)的幾個(gè)按鈕的特征,這樣識(shí)別起來(lái)就會(huì)很準(zhǔn)。

當(dāng)庫(kù)內(nèi)特征較多時(shí),不可避免會(huì)出現(xiàn)識(shí)別結(jié)果不止一個(gè)或需要的結(jié)果不排在第一位的現(xiàn)象,這時(shí)應(yīng)該類(lèi)似拼音輸入法,讓同音字或詞組有個(gè)選擇的機(jī)會(huì)。

軟件截圖

下載地址 電腦版

用戶(hù)評(píng)論

熱門(mén)評(píng)論

最新評(píng)論

發(fā)表評(píng)論 查看所有評(píng)論(0)

昵稱(chēng):
請(qǐng)不要評(píng)論無(wú)意義或臟話,我們所有評(píng)論會(huì)有人工審核.
字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過(guò)審核才能顯示)