電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>單片機>基于模板匹配的OCR盲人導(dǎo)讀儀器(STM32+OV5640)

基于模板匹配的OCR盲人導(dǎo)讀儀器(STM32+OV5640)

2017-12-11 | docx | 2145KB | 次下載 | 1積分

資料介紹

基于模板匹配的OCR盲人導(dǎo)讀儀器(STM32F407+OV5640)

  摘 要

  本論文詳細(xì)介紹了一款低成本便攜式的OCR文字識別 ,TTS語音播報系統(tǒng)的實現(xiàn)方案。本次研發(fā)的盲人導(dǎo)讀儀系統(tǒng),核心的軟硬模塊子子系統(tǒng)包括:500萬高清攝像頭JPEG圖像采集子系統(tǒng),大功率NRF2401圖像傳輸子系統(tǒng),MFC上位機圖像解碼子系統(tǒng),OCR模式識別子系統(tǒng), TTS文本語音子系統(tǒng)。本文將對設(shè)計的各個子系統(tǒng)詳細(xì)闡述。

  關(guān)鍵詞:模式識別OCR; TTS語音播報系統(tǒng); OV5640五百萬像素采集系統(tǒng);

  OCR blind reading meter based on template matching

  This paper introduces in detail a low-cost portable OCR character recognition, the implementation scheme of TTS speech broadcasting system. The research and development of the blind reading meter system, the core of hard and soft module a subsystem including: 5 million hd camera JPEG image acquisition subsystem, high-power NRF2401 image transmission subsystem, MFC PC image decoding subsystem, OCR pattern recognition subsystem, TTS text-to-speech subsystem. This article will be to the design of each subsystem in detail

  Key words: OCR pattern recognition; TTS speech broadcasting system; OV5640 mega pixels acquisition system。

  1緒論

  書籍是人類進(jìn)步的階梯,視覺障礙的弱勢群體如果想要閱讀一些文獻(xiàn)資料,傳統(tǒng)的方法要依賴盲文,憑借手觸覺去感知文字,由于盲文的發(fā)行量相對較少,加上他笨重,體積大,致使收到很大限制。隨著計算機的領(lǐng)域的飛速發(fā)展,OCR (Optical Character Recognition,光學(xué)字符識別) ,TTS(Text To Speech,從文本到語音),OV5640(高清攝像頭)日益成熟,這些新興技術(shù),將為視覺殘障人士帶來福音,將視覺文字變成聽覺語音,自此弱勢的殘障人士可以打破視覺閱讀障礙,享受文本書籍的知識殿堂。

  1.1課題的背景與意義

  我國的印刷體漢字識別是從70年代開始研究,大致可以分為如下3個階段:

  第一階段:20世紀(jì)70年代末期到20時期,主要是算法和方案探索。

  第二階段:20世紀(jì)90年代,中文OCR技術(shù)從實驗室走向市場。

  第三階段:21世紀(jì)初至今,主要是印刷體漢字識別技術(shù)和系統(tǒng)性能的提高,包括漢英混排識別率的提高和穩(wěn)健性的增強。

  1.2 OCR的研究現(xiàn)狀及研究意義

  現(xiàn)有的文字技術(shù)一般采用光學(xué)的方式將文本圖像信息采集到計算機中,因此該技術(shù)被稱為光學(xué)字符識別(Optical Character Recognition, OCR)技術(shù),經(jīng)過將近一個研究,OCR已經(jīng)成為現(xiàn)如今模式是被領(lǐng)域里最活躍的研究方向之一。它綜合了人工智能,計算機圖像,數(shù)字圖像處理等多方面的內(nèi)容,并在計算機領(lǐng)域及其相關(guān)領(lǐng)域得到了廣泛的應(yīng)用。近些年來,我國的中文印刷體文檔識別發(fā)展十分

  隨著社會的發(fā)展,科學(xué)文化的進(jìn)步,越來越多的視覺障礙人式(包括先天性行殘疾人士,或者因意外事故及其傷病視力下降乃至失去視覺的殘疾人士)更加渴望閱讀這個時代最前沿的書籍期刊,鑒于盲文的厚重,不便于攜帶,印刷量小,延遲性高等缺點,市場上主流的OCR識別器售價相對較高,一種低成本,高識別率的OCR盲人導(dǎo)讀儀的研發(fā)有相當(dāng)大的現(xiàn)實意義,其核心算法也有著極其廣泛的社會應(yīng)用:

  1.使用OCR進(jìn)行印刷體版文稿的自動識別錄入,這類產(chǎn)品的缺點是對于表格,插圖,公式需要手工進(jìn)行干預(yù)。

  2圖形,圖像,公式,文本,中英文交疊等混版復(fù)雜版面進(jìn)行自動切分的印刷識別系統(tǒng)的算法研究提供解決思路。

  3郵件自動分揀系統(tǒng),郵件的自動分揀系統(tǒng)東是郵政系統(tǒng)提高心寒分揀速度和質(zhì)量的極為有效手段之一國內(nèi)外已經(jīng)普遍使用,其核心算法是書寫體的識別。

  4 手寫體表格數(shù)據(jù)自動錄入系統(tǒng),應(yīng)用于政府,保險,醫(yī)療等個行業(yè)的申報表,調(diào)查表等表格數(shù)據(jù)的處理與錄入【1】。 。

  1.3研究的主要內(nèi)容和預(yù)期目標(biāo)

  該系統(tǒng)致力于實現(xiàn)一種低成本,便攜式,易操作,高識別率的簡易OCR中文識別系統(tǒng)。根據(jù)基于模板匹配的OCR的自身特點,以及現(xiàn)階段研究水平,調(diào)研了中文OCR在各個行業(yè)的應(yīng)用市場,如下對基于模板匹配的盲人導(dǎo)讀儀的各個系統(tǒng)和實現(xiàn)原理及算法進(jìn)行簡要講解。

  1.3.1 核心子系統(tǒng)解決方案概述

  1. 基于OV5640 500萬像素的自動對焦的高清攝像頭模組,實現(xiàn)JPEG,BMP高清圖像采集存儲。

  2. 基于大功率NRF2401的無線傳圖子系統(tǒng),可以實現(xiàn)一點對多點,單點對單點實時圖像采集傳輸。

  3基于VS2010 MFC上位機算法處理子系統(tǒng),SerialPort串口接收模塊,Cimage類進(jìn)行數(shù)據(jù)流圖像解碼編碼,微軟公司開源MicroSoft Image documentOCR控件作為核心算法將采集解碼得到圖片文字解碼出來,顯示到Edit文本框,將文字編碼串口發(fā)送科科大訊飛模塊。

  4基于科大訊飛模組XFS5512CE文字語音轉(zhuǎn)碼解碼芯片將OCR識別的文字進(jìn)行語音播報,實現(xiàn)文本到語音的轉(zhuǎn)換。

  1.3.2 預(yù)期目標(biāo)

  1. STM32F103RBT6能正常驅(qū)動500萬OV5640高清模組,實現(xiàn)圖形采集

  2. NRF2401能實現(xiàn)無線傳圖,文字解碼信息發(fā)送

  3.MFC數(shù)據(jù)流解碼JPEG,OCR文字識別,OCR解碼發(fā)送

  4.下位機驅(qū)動科大訊飛模塊,實現(xiàn)文字解碼發(fā)送。

  2基于模板匹配中文OCR語音導(dǎo)讀儀工作原理

  2.1 OCR工作原理

  與普通印刷體文檔是被相比,中文印刷體文檔識別在對文檔所包含的文字字符識別過程中。一個完整的中文印刷體文檔識別系統(tǒng)應(yīng)包括如下諸多模塊:

  文檔圖像預(yù)處理。該部分完成對原始文檔圖像預(yù)處理,使得原始文檔圖像能夠達(dá)到識別的要求。

  文檔圖像版面分析,該部分實現(xiàn)文檔圖像中文本,表格和圖像等不同區(qū)域的分離,并在識別出每個區(qū)域的類別后交由不同的處理模塊進(jìn)行進(jìn)一步的分析和處理。

  文檔圖像中的多字符識別,該部分處理通過文檔版面分析得到的文本區(qū)域,包括漢字識別和公式識別的模塊。漢字識別模塊負(fù)責(zé)包括中文字符在內(nèi)的所有字符的識別。

  文檔圖像中圖形圖像暫存模塊。該部分負(fù)責(zé)處理通過文檔版面分析得帶的圖像圖像區(qū)域。

  版面分析過程中,分析得到的文字區(qū)域,圖像區(qū)域和表格區(qū)域?qū)⒈环謩e切割成單獨的圖像,其中文字圖像區(qū)域?qū)⑺椭劣∷Ⅲw漢字識別模塊進(jìn)行處理。與其他的數(shù)字圖像模式識別應(yīng)用類似,印刷體的漢字識別的基本過程包括圖像預(yù)處理。圖像分割,圖像分割,特征提取,圖像分類等過程。圖像的預(yù)處理通過圖像增強,文字字符切割等步驟形成單個漢字字符圖像,圖像分割則在單個漢字圖像中提起漢字輪廓,特征提取則是是依據(jù)漢字輪廓提取代表的各個漢字模式的本質(zhì)的表達(dá)形式,即各種特性,形成漢字模板庫(可以理解為字典)并存儲在計算機中。識別時,圖像分類過程將漢字的模式特性和漢字的模板庫元素逐一匹配,在用一定的匹配準(zhǔn)則進(jìn)行判別。最后在模板庫中找出最接近的位置漢字的模板元素,該模版元素的漢字就是識別的結(jié)果。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1TC358743XBG評估板參考手冊
  2. 1.36 MB  |  330次下載  |  免費
  3. 2開關(guān)電源基礎(chǔ)知識
  4. 5.73 MB  |  6次下載  |  免費
  5. 3100W短波放大電路圖
  6. 0.05 MB  |  4次下載  |  3 積分
  7. 4嵌入式linux-聊天程序設(shè)計
  8. 0.60 MB  |  3次下載  |  免費
  9. 5基于FPGA的光纖通信系統(tǒng)的設(shè)計與實現(xiàn)
  10. 0.61 MB  |  2次下載  |  免費
  11. 651單片機窗簾控制器仿真程序
  12. 1.93 MB  |  2次下載  |  免費
  13. 751單片機大棚環(huán)境控制器仿真程序
  14. 1.10 MB  |  2次下載  |  免費
  15. 8基于51單片機的RGB調(diào)色燈程序仿真
  16. 0.86 MB  |  2次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33564次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6653次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537796次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191185次下載  |  免費
  13. 7十天學(xué)會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費