談起OCR(光學(xué)字符識(shí)別,Optical Character Recognition)應(yīng)用,很多人并不陌生,其最常見的應(yīng)用場景就是實(shí)現(xiàn)“圖片轉(zhuǎn)換成文字”,并廣泛應(yīng)用于如掃描名片并加入通訊錄、拍攝英文菜單并將其翻譯成中文等需求之中。經(jīng)歷長期的發(fā)展之后,OCR應(yīng)用的準(zhǔn)確率、速度都有了顯著提升,實(shí)用性也越來越高。
雖然當(dāng)前的OCR應(yīng)用已經(jīng)能夠應(yīng)對(duì)大多數(shù)消費(fèi)類的場景,但是在商業(yè)化應(yīng)用場景中,OCR 的識(shí)別效率仍存在廣泛的提速需求。在AI技術(shù)引領(lǐng)的下一代測試中,北京云測信息技術(shù)有限公司*(以下簡稱:Testin云測)發(fā)布全新AI測試產(chǎn)品iTestin,全面提升測試產(chǎn)品的易用性和自動(dòng)化效率,在提升腳本編寫效率一倍的同時(shí),將腳本的維護(hù)成本降低了一倍。其使用了 OCR 深度學(xué)習(xí)方案來支持控件定位的輸入,OCR 識(shí)別速度越快,就越有助于自動(dòng)化速度測試的提升。為此,Testin云測基于英特爾? 至強(qiáng)? 可擴(kuò)展處理器、英特爾? OpenVINO? 工具套件對(duì) OCR 深度學(xué)習(xí)方案進(jìn)行優(yōu)化,將AI測試中的OCR識(shí)別時(shí)間從2秒降低到0.3秒左右,實(shí)現(xiàn)了6倍的性能提升,且不影響測試的效果和結(jié)果。
當(dāng)AI測試遇上OCR,開啟下一代測試
要開發(fā)出一款軟件應(yīng)用并將其投入到實(shí)際運(yùn)營中,并不是很多人想象中的那樣,找一些程序員寫一些代碼就能簡單完成的事情,而是涉及到一套完整、復(fù)雜的流程。很多開發(fā)者甚至認(rèn)為,測試是開發(fā)過程中最繁瑣的環(huán)節(jié)之一。在軟件完成初步開發(fā)之后,開發(fā)人員需要測試其功能是否可用、在不同型號(hào)的設(shè)備(如基于安卓系統(tǒng)的設(shè)備與基于iOS系統(tǒng)的設(shè)備)上有什么應(yīng)用問題。此外,不同的軟件在各區(qū)域?qū)嶋H網(wǎng)絡(luò)環(huán)境中的表現(xiàn)也可能會(huì)有差異,這些都需要進(jìn)行詳盡的測試。
為了幫助開發(fā)者對(duì)軟件進(jìn)行測試,Testin云測全球首創(chuàng)了云測試的模式,并在此基礎(chǔ)上,推出了融合AI技術(shù)的下一代測試產(chǎn)品iTestin。開發(fā)者可以將軟件上傳到該平臺(tái)進(jìn)行自動(dòng)化測試,Testin云測會(huì)詳盡列出測試環(huán)節(jié)中的所有參數(shù),并會(huì)提供自動(dòng)輸出錯(cuò)誤、報(bào)警等測試日志服務(wù),出具專業(yè)化測試報(bào)告,以幫助開發(fā)者快速定位可能出現(xiàn)的問題,對(duì)軟件進(jìn)行持續(xù)優(yōu)化。
在AI測試過程中,Testin云測發(fā)現(xiàn),自動(dòng)化框架本身提供的控件輸入不穩(wěn)定。因此,Testin云測的AI測試方案傾向于使用更穩(wěn)定的手機(jī)截屏,做為控件定位的輸入,這就要求使用 OCR 技術(shù)來定位和解析屏幕截圖中的文本。由于 OCR 的效率與準(zhǔn)確度會(huì)對(duì)測試的效果與結(jié)果帶來不可忽視的影響,而模板匹配、特征提取等傳統(tǒng) OCR 方案又暴露出對(duì)于圖像清晰度要求高、抗背景干擾能力較差等缺陷,所以Testin云測決定使用深度學(xué)習(xí)方案來提升文本推理能力。
為了提升 OCR 深度學(xué)習(xí)的效率,Testin云測與英特爾進(jìn)行了深度合作,從軟件加速以及硬件兩個(gè)角度對(duì)于 OCR 方案進(jìn)行優(yōu)化。
至強(qiáng)+ OpenVINO? 將 OCR 效率提升6倍
在很多情況下,OCR 深度學(xué)習(xí)方案使用的都是 GPU,通過其強(qiáng)大的并行計(jì)算能力來提升文本推理能力。但是,GPU 方案也存在很多缺陷。特別是在較小規(guī)模、私有云用戶的深度學(xué)習(xí)應(yīng)用中,搭建專用于 OCR 深度學(xué)習(xí)的 GPU 平臺(tái)需要客戶同時(shí)升級(jí)硬件平臺(tái),這樣不僅耗費(fèi)時(shí)間成本,而且也會(huì)帶來相應(yīng)的硬件升級(jí)成本,更多用戶希望在現(xiàn)有的基礎(chǔ)設(shè)施平臺(tái)上運(yùn)行深度學(xué)習(xí)負(fù)載。而且,在大量推理負(fù)載中,基于 CPU 的推理性能并不弱于 GPU 平臺(tái),這也成為Testin云測進(jìn)行方案驗(yàn)證的重要?jiǎng)恿Α?/p>
在基礎(chǔ)設(shè)施平臺(tái)的搭建上,Testin云測最終選擇了英特爾? 至強(qiáng)? 金牌 6140處理器,該處理器是英特爾? 至強(qiáng)? 可擴(kuò)展處理器家族產(chǎn)品,不僅擁有強(qiáng)大的通用計(jì)算能力,還集成了增強(qiáng)單指令多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)、英特爾? AVX-512等創(chuàng)新技術(shù),實(shí)現(xiàn)了對(duì)于通用計(jì)算能力和并行計(jì)算能力的兼顧,為深度學(xué)習(xí)訓(xùn)練提供了卓越的性能基礎(chǔ)。相比上一代產(chǎn)品,英特爾? 至強(qiáng)? 可擴(kuò)展處理器針對(duì)深度學(xué)習(xí)訓(xùn)練和推理可提供高達(dá)2.2倍的性能。結(jié)合可加快交付人工智能服務(wù)的軟件優(yōu)化,相比3年前未經(jīng)優(yōu)化的服務(wù)器系統(tǒng),全新的處理器可實(shí)現(xiàn)113倍的深度學(xué)習(xí)性能提升。
在軟件與算法層面上,Testin云測對(duì)深度學(xué)習(xí)框架、加速方案也進(jìn)行探索和選擇。為了加速 OCR 方案,Testin云測在初期使用的深度學(xué)習(xí)框架是Google* 開發(fā)的 TensorFlow*,TensorFlow將深度學(xué)習(xí)復(fù)雜的計(jì)算過程抽象成數(shù)據(jù)流圖,在深度學(xué)習(xí)中有著廣泛的應(yīng)用。但是,Testin云測發(fā)現(xiàn),無論是公開版本的 TensorFlow,還是優(yōu)化版本的 TensorFlow,在速度上都無法滿足需求。因此,Testin云測希望能夠找到一種全新的加速方案。
在英特爾的建議下,Testin云測嘗試使用英特爾? OpenVINO? 工具套件分發(fā)版來進(jìn)行加速。該工具套件支持開發(fā)人員使用行業(yè)標(biāo)準(zhǔn)人工智能框架、標(biāo)準(zhǔn)或自定義層,將深度學(xué)習(xí)推理輕松集成到應(yīng)用中,開發(fā)人員只需編寫一次代碼,即可將其快速、無縫地部署在當(dāng)前和未來的英特爾硬件上,從而消除應(yīng)用重復(fù)開發(fā)問題。該工具套件基于卷積神經(jīng)網(wǎng)絡(luò) (CNN),可在英特爾硬件中擴(kuò)展工作負(fù)載。
OpenVINO? 的采用帶來了立竿見影的效果,Testin云測針對(duì)公共 TensorFlow 與英特爾? OpenVINO? 實(shí)現(xiàn)的推理吞吐量進(jìn)行了測試,并發(fā)現(xiàn),基于公共 TensorFlow 的解決方案的推理吞吐量為 23.26 (FPS) ,基于英特爾? OpenVINO? 的解決方案的推理吞吐量為 151.29 (FPS) ,后者比前者的吞吐量提升650%左右(對(duì)比結(jié)果如圖1),而且基本沒有精度損失。
此外,Testin云測還基于第二代英特爾? 至強(qiáng)? 可擴(kuò)展處理器進(jìn)行了測試,該處理器集成了英特爾? 深度學(xué)習(xí)加速(英特爾? Deep Learning Boost)技術(shù)、DL Boost(VNNI)技術(shù),以加速數(shù)據(jù)中心、企業(yè)和智能邊緣計(jì)算環(huán)境中的人工智能推理工作負(fù)載。特別是在搭配支持低精度的INT8加速的 OpenVINO? 新版本之后,有望將推理速度在提升3倍左右。
以AI賦能測試服務(wù)
目前,Testin云測的業(yè)務(wù)范疇,不僅包括測試服務(wù),還包括安全、推廣,以及AI數(shù)據(jù)標(biāo)注等服務(wù)。通過開發(fā)基于人工智能 (AI)、深度學(xué)習(xí)技術(shù)的數(shù)據(jù)標(biāo)注、OCR 識(shí)別等相關(guān)AI測試工具,Testin云測可以幫助企業(yè)客戶完成自動(dòng)化應(yīng)用測試,大幅降低勞動(dòng)密集度。
通過將 AI 與自動(dòng)化測試解決方案結(jié)合,能夠有助于自動(dòng)化、全路徑探索應(yīng)用的各種顯在或是潛在問題,提取特征訓(xùn)練進(jìn)行業(yè)務(wù)功能的識(shí)別,并智能生成測試報(bào)告。AI 的加入還有助于實(shí)現(xiàn)對(duì)功能模塊的自動(dòng)探索,并實(shí)現(xiàn)執(zhí)行過程的可視化,使得測試環(huán)節(jié)定位更加迅速準(zhǔn)確。對(duì)于用戶來說,自動(dòng)化的測試管理和測試用例創(chuàng)建能夠顯著降低測試時(shí)間與資源的浪費(fèi),加快應(yīng)用上市進(jìn)程。
Testin云測的測試實(shí)例證明,英特爾? 至強(qiáng)? 可擴(kuò)展處理器+英特爾? OpenVINO? 的融合解決方案有助于在具體應(yīng)用場景中加快推理的速度。而且,該解決方案還展現(xiàn)了其它自動(dòng)化測試場景的應(yīng)用潛力,為用戶搭建基礎(chǔ)平臺(tái)提供了重要的方案選擇。
-
AI
+關(guān)注
關(guān)注
87文章
29438瀏覽量
267764 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5442瀏覽量
120803
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論