0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Vitis AI Library體驗之OCR識別

發(fā)燒電子愛好者 ? 來源:發(fā)燒電子愛好者 ? 作者:發(fā)燒電子愛好者 ? 2023-10-17 08:23 ? 次閱讀

OCR (Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進一步編輯加工的技術(shù)。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也因此而產(chǎn)生。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。

一、Vitis AI Library

Vitis AI Library是一組高層次庫和 API,專為利用 DPU 高效執(zhí)行 AI 推斷而構(gòu)建。它是基于 Vitis AI運行時利用 Vitis運行時統(tǒng)一 API 來構(gòu)建的,能夠為 XRT 提供完整支持。

Vitis AI Library 通過封裝諸多高效且高質(zhì)量的神經(jīng)網(wǎng)絡,提供易用且統(tǒng)一的接口。由此可簡化深度學習神經(jīng)網(wǎng)絡的使用,對于不具備深度學習或 FPGA 知識的用戶也是如此。Vitis AI Library 使開發(fā)者能夠?qū)W⒂陂_發(fā)自己的應用,而不是底層硬件。

VALq.png

二、實現(xiàn)

相較于Vitis AI Runtime,Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡接口,直接拿來用即可。

OCR識別基于Vitis AI Library 的ocr_pt模型,OCR識別的代碼如下:

#include 

#include 
#include 
#include 
#include 
#include 
#include 
#include 

#include "./process_result.hpp"

int main(int argc, char* argv[]) {
  std::string model = argv[1];
  return vitis::ai::main_for_jpeg_demo(
      argc, argv,
      [model] {
        return vitis::ai::OCR::create(model);
      },
      process_result, 2);
}

主要使用Vitis AI Library 的OCR功能(lvitis_ai_library-ocr),具體文字實現(xiàn)的代碼:

#include 

#include 
#include 
#include 
#include 
#include 

#include "vitis/ai/ocr.hpp"

using namespace cv;
using namespace std;

Scalar colors[] = { Scalar(255, 0, 0), Scalar(0, 255, 0), Scalar(255, 255, 0), Scalar(0, 0, 255) };

static cv::Mat process_result( cv::Mat &img,
           const vitis::ai::OCRResult &result, bool is_jpeg) {

   for(unsigned int i=0; i

代碼中可以看出,直接使用了openCV的功能。

三、編譯&運行

build.sh文件內(nèi)容如下:

result=0 && pkg-config --list-all | grep opencv4 && result=1
if [ $result -eq 1 ]; then
        OPENCV_FLAGS=$(pkg-config --cflags --libs-only-L opencv4)
else
        OPENCV_FLAGS=$(pkg-config --cflags --libs-only-L opencv)
fi

CXX=${CXX:-g++}
for file in $(ls *.cpp); do
        filename=${file%.*}
        $CXX -std=c++17 -O2 -I. -o ${filename} ${file} -lvitis_ai_library-ocr -lvitis_ai_library-dpu_task -lvitis_ai_library-xnnpp -lvitis_ai_library-model_config -lvitis_ai_library-math -lvart-util -lxir -pthread -ljson-c -lglog ${OPENCV_FLAGS} -lopencv_core -lopencv_videoio -lopencv_imgproc -lopencv_imgcodecs -lopencv_highgui
done

執(zhí)行sh build.sh生成可執(zhí)行文件。待測試的圖片如下:

執(zhí)行OCR識別后的結(jié)果如下:

OCR.png

總體情況識別速度很快,內(nèi)容識別無誤,不知道啥情況中間的“OF”不見了。
可以看出,Vitis AI Library 使開發(fā)者能夠?qū)W⒂陂_發(fā)自己的應用,而不是底層硬件,快速部署AI相關(guān)應用。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4724

    瀏覽量

    100311
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29368

    瀏覽量

    267647
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    142

    瀏覽量

    16293
  • Vitis
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    7359
收藏 人收藏

    評論

    相關(guān)推薦

    AI開發(fā)平臺Vitis AI 2.5讓AI加速體驗更上一層樓 Vitis AI新功能概述

    Vitis AI 2.5 的模型庫增加了廣受歡迎的NLP及更多 CNN 模型,例如 Bert-base,Vision Transformer、端到端 OCR, 以及應用于 SLAM 場景的SuperPoint 與 HFNet
    發(fā)表于 07-14 17:40 ?3.7w次閱讀

    Vitis AI Model Zone軟件平臺具備哪些功能?

    Vitis AI Model Zone軟件平臺具備哪些功能?Vitis AI Model Zone軟件平臺的應用范圍包括哪些?
    發(fā)表于 07-09 06:44

    【KV260視覺入門套件試用體驗】部署vitis-ai環(huán)境以及測試demo

    /ug1354-xilinx-ai-sdk/%E4%B8%8B%E8%BD%BD-Vitis-AI-Library 在安裝->設置目標->步驟1:安裝開發(fā)板鏡像 開始下載鏡像 進入到
    發(fā)表于 08-27 23:35

    【KV260視覺入門套件試用體驗】Vitis AI 初次體驗

    連接到處理器系統(tǒng) (PS)。DPU 可由用戶配置且包含多個參數(shù),用戶可通過指定這些參數(shù)來對 PL 資源進行最優(yōu)化,或者也可以自定義啟用的功能。 Vitis AI Library 是一組高層次庫和 API
    發(fā)表于 09-10 13:15

    【KV260視覺入門套件試用體驗】五、VITis AI (人臉檢測和人體檢測)

    一、DPU 鏡像環(huán)境配置 官方鏡像已經(jīng)安裝好了可以在安裝相關(guān)配置,示例來源Vitis AI Library用戶指南3.0版本,首先需要安裝DPU鏡像。 1.1、克隆Vitis
    發(fā)表于 09-26 16:22

    【KV260視覺入門套件試用體驗】六、VITis AI車牌檢測&車牌識別

    。下圖顯示了車牌檢測的結(jié)果。 將圖片中的車牌進行了框選,同事標準位置。 4.2、車牌識別 cd ~/Vitis-AI/examples/vai_library/samples/platenum
    發(fā)表于 09-26 16:28

    【KV260視覺入門套件試用體驗】七、VITis AI字符和文本檢測(OCR&Textmountain)

    4.1、字符檢測 使用命令運行代碼程序。 cd ~/Vitis-AI/examples/vai_library/samples/ocr ./test_jpeg_ocr
    發(fā)表于 09-26 16:31

    【KV260視覺入門套件試用體驗】基于Vitis AI的ADAS目標識別

    /vitis_ai_library/models -r 四、ADAS目標識別體驗 (一)目標識別 接上HDMI顯示器、鍵盤&鼠標,在KV260上執(zhí)行(如果在SSH或串口上執(zhí)行會提示cv
    發(fā)表于 09-27 23:21

    【KV260視覺入門套件試用體驗】Vitis-AI加速的YOLOX視頻目標檢測示例體驗和原理解析

    會對關(guān)鍵源碼進行解析。 一、Vitis AI Library簡介 上一篇帖子中,我們了解了Vitis統(tǒng)一軟件平臺和Vitis
    發(fā)表于 10-06 23:32

    【KV260視覺入門套件試用體驗】Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型

    FFT運算(Vivado) 四、硬件加速—使用PL加速矩陣乘法運算(Vitis HLS) 五、Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型 六、
    發(fā)表于 10-14 15:34

    【KV260視覺入門套件試用體驗】Vitis AI Library體驗OCR識別

    Vitis AI Runtime,Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡接口,直接拿來用即可。
    發(fā)表于 10-16 23:25

    使用數(shù)字識別AI實現(xiàn)OCR的資料合集

    本文檔的主要內(nèi)容詳細介紹的是使用數(shù)字識別AI實現(xiàn)OCR的資料合集。
    發(fā)表于 07-17 08:00 ?20次下載
    使用數(shù)字<b class='flag-5'>識別</b>和<b class='flag-5'>AI</b>實現(xiàn)<b class='flag-5'>OCR</b>的資料合集

    OCR識別技術(shù)

    在爬蟲對驗證碼進行破解時,經(jīng)常需要對圖片中的文字內(nèi)容進行識別,這時就需要用到OCR技術(shù)了,那么 OCR識別技術(shù)是如何實現(xiàn)對文字內(nèi)容“即拍即得”的呢?
    的頭像 發(fā)表于 03-12 09:07 ?4718次閱讀

    如何使用Vitis AI Library來安裝、使用和開發(fā)應用

    Vitis AI Library 是一組高層次庫和 API,專為利用深度學習處理單元 (DPU) 來高效執(zhí)行 AI 推斷而構(gòu)建。
    的頭像 發(fā)表于 10-10 10:26 ?1910次閱讀

    使用Vitis-AI進行車牌識別

    電子發(fā)燒友網(wǎng)站提供《使用Vitis-AI進行車牌識別.zip》資料免費下載
    發(fā)表于 06-27 09:49 ?2次下載
    使用<b class='flag-5'>Vitis-AI</b>進行車牌<b class='flag-5'>識別</b>