本人從研究生開始學(xué)習(xí)語音頻信號處理到工作中實際的工程實踐 , 至今已經(jīng)七年多了 , 這跟 ” 七年之癢 ” 真的沒有關(guān)系 , 主要是一方面最近比較空閑 , 有時間做些總結(jié)和規(guī)劃 , 另一方面也是為準(zhǔn)備從事這個職業(yè)或者正在從事這個職業(yè)的新手們提供一點參考 , 當(dāng)然一家之言 , 歡迎大家交流討論 , 尤其希望那些資深人士不吝指點 。
1 、涉及的方向
1 )語音、音頻編解碼算法
已經(jīng)成熟地商業(yè)化、產(chǎn)品化,壓縮碼率和音質(zhì)總是一對冤家,只有一些特殊的存儲和通信應(yīng)用會要求低碼率,更多的是追求高品質(zhì)的音質(zhì),例如高清音質(zhì)。
2 )語音識別算法
做過一年半,初步了解識別率受多種因素影響,技術(shù)本身還需要在抗干擾等方面進一步發(fā)展,目前只有一些特殊場合的應(yīng)用產(chǎn)品化,作為人機交互的大規(guī)模應(yīng)用還有一段路要走。
3 )語音合成算法
這個沒有接觸核心技術(shù),不妄加評論,反正據(jù)說科大訊飛在這個方向非常強。
4 )語音增強算法
這個沒有接觸核心技術(shù),感覺回聲消除、降噪處理等還是很有用處。
5 )語音信號分析
主要一些特殊應(yīng)用需求,如智能玩具、軍工等。
6 )音頻特征提取和檢索
音樂哼唱和音樂檢索,以及音頻的特殊應(yīng)用。
7 )音效處理算法
在 MP3 上非常普遍的音效處理算法,當(dāng)然也有立體聲環(huán)繞和多聲道處理算法。
2 、涉及的行業(yè)
這個行業(yè)需要這個職業(yè)的一般,尤其是做多媒體芯片的,往往需要為芯片提供高品質(zhì)的音視頻算法 。 在低功耗、資源少的情況下保證音視頻的最佳化應(yīng)用。
2 )計算機軟硬件
這個行業(yè)里,可以做標(biāo)準(zhǔn)算法的研發(fā),也可以做應(yīng)用程序,或者是第三方軟件開發(fā)。
3 )通信行業(yè)
這個行業(yè)應(yīng)該不多,一般音頻編解碼屬于信源編碼,而通信行業(yè)涉及的技術(shù)比較多,從天線的發(fā)送接收,基帶芯片的解碼,語音編解碼,上下信道的控制等系統(tǒng)。
3 、涉及的職業(yè)
1 )做標(biāo)準(zhǔn)、第三方算法研發(fā)
做音頻算法的國際標(biāo)準(zhǔn),如 ITU G.7xx 、寬帶語音編碼,或者第三方語音算法的研發(fā),如語音識別、語音合成等。往往這樣的職位需要碩士以上學(xué)歷,對數(shù)字信號處理理論要求較高。
2 )做移植、優(yōu)化
在芯片公司為產(chǎn)品做音頻算法的移植和優(yōu)化,需要對芯片指令和算法本身有較強的理解。做嵌入式產(chǎn)品,就意味著在低成本、低功耗、資源少的情況下要具有足夠的耐心去一點點優(yōu)化算法,我曾經(jīng)對 AMR-NB 中的碼書搜索部分、 LSF 矢量量化部分進行至少 5 遍的代碼優(yōu)化,漸漸將所用的指令數(shù)減到最小化。每一遍過后都覺得沒有再優(yōu)化的地方了,然后靜下心再分析算法原理、分析代碼執(zhí)行和指令特點,就有了新的發(fā)現(xiàn)。以至于后來流傳著“優(yōu)化無極限”,當(dāng)然優(yōu)化工作很可能是用較少的時間就優(yōu)化了總量的 80% ,但剩下的 20% 需要付出更多的時間,全憑項目的需求來權(quán)衡了,積累一定的經(jīng)驗很重要。
3 )做產(chǎn)品應(yīng)用
做一般多媒體軟件的應(yīng)用開發(fā),涉及語音頻本身的理論較少,更多的是計算機技術(shù)。
4 、優(yōu)缺點
做語音頻算法職業(yè)的缺點是 ” 少 ”, 相關(guān)的公司少,專業(yè)對口的職業(yè)少,做這個職業(yè)的人也少 , 發(fā)展機會少一點,當(dāng)然這個“少”也是不同時期,不同職業(yè)之間的相對比較而言的。優(yōu)點自然是競爭壓力相對小些,工作相對穩(wěn)定。
5 、三點總結(jié)
我一路走來,犯了許多錯誤,但是塞翁失馬,焉知非福?
1) 雜而不專
“專”是指專注在一個方向上的技術(shù)和業(yè)務(wù)積累。
我剛開始的時候,一段時間看看語音頻編解碼,一段時間看看靜態(tài)圖像處理技術(shù),一邊研究計算機網(wǎng)絡(luò)技術(shù),一邊了解一下視頻壓縮算法,今天搞搞寫寫 Window 程序,明天去焊焊電路。典型的學(xué)的雜,但是哪個都淺嘗輒止,最后想想哪個都拿不出手,感覺就是樣樣行,樣樣都很膚淺。
2) 專而不精
“精”是指在一個方向上達到精通的水平(技術(shù)方面)和高效的業(yè)務(wù)能力(項目管理方面)。
工作了一段時間,比較清楚自己的興趣和特長,于是靜下心盡量把范圍縮小,主要集中在語音頻編解碼上,但是有時還要根據(jù)實際項目需求去做其它方向的。另外,如果項目時程緊張的話,技術(shù)方面如果不經(jīng)過深加工,積累的經(jīng)驗還是很少。我目前正處于這個階段,需要堅實的理論基礎(chǔ)以便深入算法(算法層面)和不斷的總結(jié)項目經(jīng)驗教訓(xùn)(工程實現(xiàn)方面)來提高自己。
3) 精而不廣
“廣”是指見識要廣,具有行業(yè)思維、市場化的眼光。
身處在這個賴以謀生的行業(yè),自然要關(guān)心一下它的動態(tài)發(fā)展,我們在技術(shù)上要深挖一口井,但眼界上卻不要做一個井底之蛙!
最后,談一下工作態(tài)度,我自認(rèn)為資質(zhì)平庸,還是踏踏實實做事,認(rèn)認(rèn)真真做人。不要盲目和別人攀比,產(chǎn)生不良的心態(tài),影響日常的工作和生活。對于那些比我強的人,我是這樣看的:客觀上,他們一定有我們不具有的能力,這里的能力是指綜合評價得到的,包括智商(學(xué)習(xí)能力、技術(shù)深度廣度、創(chuàng)新思維等)、情商(人脈關(guān)系、成長環(huán)境、習(xí)慣等);主觀上,每個人都有自己的人生軌跡,苦辣酸甜只有自己知道,平衡好自己生活的各個方面才是最好的。
-
算法工程師
+關(guān)注
關(guān)注
2文章
30瀏覽量
6078
發(fā)布評論請先 登錄
相關(guān)推薦
評論