Linux下科大訊飛語音識別全面總結
時間(jian):2018-05-14作者:華清遠見
首先我(wo)們需要的(de)(de)就是Linux下(xia)的(de)(de)SDK的(de)(de)下(xia)載(zai)包,首先在(zai)科(ke)大訊(xun)飛的(de)(de)官網//www.xfyun.cn/注(zhu)冊,選擇我(wo)們的(de)(de)語(yu)音識別的(de)(de)功能(neng)相應的(de)(de)Linux SDK下(xia)載(zai),對應的(de)(de)生成Linux_iat1166_tts_online1166_5ad417ef.zip 的(de)(de)壓(ya)縮(suo)包,然后解壓(ya)縮(suo)如下(xia):
bin目錄(lu)下面是我們的(de)(de)(de)生成的(de)(de)(de)可執(zhi)行(xing)的(de)(de)(de)文(wen)件; doc目錄是我們的api函(han)數接口(kou)的參考的文檔; include目錄下面(mian)是我們的(de)(de)編譯后的(de)(de)可(ke)執行(xing)文件用到的(de)(de)頭文件; libs是我們的程序(xu)用到(dao)的庫; samples目錄下面是簡單的語音合(he)成、語音識別、語音轉文字的demo; 切(qie)換到我們(men)的(de)samples下面的(de)iat_record_sample的(de)語音識別的(de)demo,source 32bit_make.sh,在(zai)我們(men)的(de)bin目(mu)錄下生成(cheng)可(ke)執行文件(jian)iat_record_sample
但是執行時出現error while loading shared libraries: libmsc.so的錯誤
uame -a 或者uname -p查看我(wo)們的ubuntu虛擬機是(shi)32位還是(shi)64位的
再對應的(de)將我們的(de)libs目錄下(xia)(xia)的(de)庫(ku)拷貝到/usr/libs下(xia)(xia)面
再運行我們的bin下面的生成的iat_record_sample可執行文件(jian) 但是我們(men)demo只可以實現一次識(shi)別我們(men)語音(yin),故修改(gai)我們(men)的代碼讓(rang)其可以一直等待輸入, 并且每次等待輸入(ru)的(de)時間(jian)為10s鐘,然(ran)后可以(yi)(yi)看到(dao)我(wo)們(men)(men)從本地的(de)麥中發音,可以(yi)(yi)實(shi)現我(wo)們(men)(men)的(de)語音轉換為對應的(de)文本
我們(men)的(de)main函數的(de)login_params必(bi)須與(yu)我們(men)自己申請的(de)SDK的(de)appid相同,不然云端在線時(shi)SDK與(yu)appid不一致無法使用(yong)語音的(de)功能
為(wei)了實現一直輸(shu)入,在我(wo)們(men)的while(1)中調(diao)用(yong)demo_mic,其(qi)中demo_mic的sr_init、sr_start_listening、sr_stop_listening實現我(wo)們(men)的語音的文件的起(qi)始和結束
sr_start_listening函數(shu)中的create_record、open_record、start_record、stop_record、close_record相關函數(shu)實現我們的錄音對象的創建、打開、停止、關閉
相關資訊
發表評論
|
全國咨詢電話:400-611-6270,雙(shuang)休(xiu)日及節假日請致(zhi)電值班手機(ji):15010390966
在(zai)線咨詢: 曹老師(shi)QQ(3337544669), 徐老師(shi)QQ(1462495461), 劉老師(shi) QQ(3108687497)
企業培訓洽談專線(xian):010-82600901,院校合作洽談專線(xian):010-82600350,在線(xian)咨詢(xun):QQ(248856300)
Copyright 2004-2018 華清遠見教育(yu)科技集團 版權所(suo)有(you) ,京(jing)ICP備(bei)16055225號,京(jing)公海(hai)網(wang)安備(bei)11010802025203號