0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓文本識別更加智能,數(shù)據(jù)堂獲取這些OCR轉(zhuǎn)寫數(shù)據(jù)

火花 ? 來源:大眾新聞 ? 作者:火花 ? 2020-09-17 11:34 ? 次閱讀

近年來,學(xué)生黨們擁有了一款新的學(xué)習(xí)神器——拍照搜題。當(dāng)遇到不會做的題目時,只需要對著題目拍照,手機中就會出現(xiàn)這道題目的詳細(xì)解答思路和答案。“拍照搜題”背后的黑科技就是光學(xué)字符識別技術(shù),即OCR。OCR是指電子設(shè)備,例如掃描儀或相機檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別的方法將形狀翻譯成計算機文字的過程。

OCR的應(yīng)用領(lǐng)域十分廣泛。最早為我們熟知的“哪里不會點哪里”的點讀機就應(yīng)用了OCR。點讀機的點讀筆中裝有一個掃描文字的攝像頭,當(dāng)點讀筆接觸到書本后,便可將文字內(nèi)容識別和提取。作為常用的一款辦公軟件,掃描全能王可以實現(xiàn)“圖片轉(zhuǎn)文字”的功能。軟件可以識別各種文件類型中的文字信息,這是非常典型的OCR技術(shù)的應(yīng)用。

目前,文本識別分為以下幾類:

· 通用文字識別:一般是指如PDF等不規(guī)則文檔類的識別。

·卡證識別:包括身份證、銀行卡、營業(yè)執(zhí)照、名片、護照、港澳通行證、戶口本、駕駛證、行駛證等等。

· 票據(jù)識別:包括增值稅發(fā)票、定額發(fā)票、火車票、出租車票、行程單、保單、銀行單據(jù)等等。

· 其他:如車牌、車輛合格證、印章檢測等等。

隨著分類的不斷拓展,OCR技術(shù)的應(yīng)用場景也越來越廣泛,以下是幾個應(yīng)用較為成熟的領(lǐng)域:

· 遠(yuǎn)程身份認(rèn)證:結(jié)合OCR和人臉識別技術(shù),實現(xiàn)用戶證件信息的自動錄入,并完成用戶身份驗證。應(yīng)用于金融保險、社保、O2O等行業(yè),有效控制業(yè)務(wù)風(fēng)險。

· 內(nèi)容審核與監(jiān)管:自動識別圖片、視頻中的文字內(nèi)容,及時發(fā)現(xiàn)涉黃、涉暴、政治敏感、惡意廣告等不合規(guī)內(nèi)容,規(guī)避業(yè)務(wù)風(fēng)險,大幅節(jié)約人工審核成本。

· 紙質(zhì)文檔票據(jù)電子化:通過OCR實現(xiàn)紙質(zhì)文檔資料、票據(jù)、表格的自動識別和錄入,減少人工錄入成本,提高輸入效率。

針對上述的場景,基于深度學(xué)習(xí)的技術(shù)而言,訓(xùn)練數(shù)據(jù)的數(shù)量很大程度上影響了技術(shù)效果。數(shù)據(jù)堂作為深耕于AI數(shù)據(jù)領(lǐng)域近10年的人工智能數(shù)據(jù)服務(wù)提供商,一直致力于為全球人工智能企業(yè)提供專業(yè)的數(shù)據(jù)服務(wù)。依托自身的數(shù)據(jù)優(yōu)勢以及豐富的數(shù)據(jù)處理經(jīng)驗,數(shù)據(jù)堂推出了系列OCR標(biāo)注及轉(zhuǎn)寫數(shù)據(jù),為相關(guān)技術(shù)應(yīng)更廣泛的落地提供助力。

數(shù)據(jù)涵蓋8種語言、多種場景、不同拍攝角度、不同拍攝距離、不同光照條件。在標(biāo)注方面,標(biāo)注行級文本的四邊形框,行級文本轉(zhuǎn)寫。四邊形框頂點偏差不超過五個像素為正確檢測,檢測框精度不低于95%,文本轉(zhuǎn)寫精度不低于95%,該數(shù)據(jù)可用于多國語言O(shè)CR任務(wù)。

數(shù)據(jù)涵蓋12種語言(6種亞洲語、6種歐洲語),包括商店牌匾、站牌、海報、車票、路標(biāo)、漫畫、井蓋畫、提示語、警示語、包裝說明、菜單、建筑物標(biāo)志等多種自然場景。在標(biāo)注方面,標(biāo)注行級文本的四邊形框,行級文本轉(zhuǎn)寫,四邊形框頂點偏差不超過五個像素為正確檢測,檢測框精度不低于97%,文本轉(zhuǎn)寫精度不低于97%。

數(shù)據(jù)包括自然場景圖片2,056張,互聯(lián)網(wǎng)圖像1,103張,文本圖像347張。在標(biāo)注方面,行級內(nèi)容用行級四邊形框標(biāo)注、行級內(nèi)容轉(zhuǎn)寫;豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫。數(shù)據(jù)可用于多場景下的印地語識別、印地語拍照翻譯等任務(wù)。

數(shù)據(jù)包括自然場景圖片258張,互聯(lián)網(wǎng)圖像2,553張,文本圖像2,184張。在標(biāo)注方面,行級內(nèi)容用行級四邊形框標(biāo)注、行級內(nèi)容轉(zhuǎn)寫;豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫。數(shù)據(jù)可用于多種場景下的越南語識別、越南語拍照翻譯等任務(wù)。

相比物體檢測識別,OCR由于包含傾斜文本框、低分辨率文字和文本版面多樣化的情況,因此OCR數(shù)據(jù)標(biāo)注具有特殊性,標(biāo)注成本更高。數(shù)據(jù)堂的數(shù)加加Pro標(biāo)注平臺支持私有化部署,能夠幫助企業(yè)快速、安全的對人工智能數(shù)據(jù)進行標(biāo)注,為企業(yè)提供更專業(yè)、更安全的數(shù)據(jù)基礎(chǔ)設(shè)施。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能識別
    +關(guān)注

    關(guān)注

    0

    文章

    195

    瀏覽量

    18098
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    142

    瀏覽量

    16298
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)線芯片-數(shù)據(jù)智能控制芯片EN16F

    低功耗功能。 數(shù)據(jù)智能控制芯片的基礎(chǔ)功能包括數(shù)據(jù)傳輸管理、電源管理、設(shè)備識別和用戶接口控制。隨著技術(shù)的不斷進步,這些芯片已經(jīng)實現(xiàn)了從基礎(chǔ)
    發(fā)表于 09-27 11:04

    光學(xué)字符識別是什么的一種技術(shù)

    光學(xué)字符識別(Optical Character Recognition,簡稱OCR)是一種將文本資料轉(zhuǎn)換為計算機可編輯和可搜索的數(shù)據(jù)格式的技術(shù)。這項技術(shù)廣泛應(yīng)用于文檔掃描、
    的頭像 發(fā)表于 09-10 15:48 ?345次閱讀

    光學(xué)識別技術(shù)的工作原理是什么?

    光學(xué)識別技術(shù)(Optical Character Recognition,簡稱OCR)是一種將圖像中的文字信息轉(zhuǎn)換成可編輯和可搜索的文本數(shù)據(jù)的技術(shù)。它廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、自動
    的頭像 發(fā)表于 09-10 15:46 ?368次閱讀

    光學(xué)識別字符是自動識別技術(shù)嗎

    輯和可搜索的數(shù)據(jù)。OCR技術(shù)廣泛應(yīng)用于數(shù)據(jù)錄入、文檔管理、自動化處理等領(lǐng)域。 1. OCR技術(shù)的歷史 OCR技術(shù)的發(fā)展可以追溯到20世紀(jì)50
    的頭像 發(fā)表于 09-10 15:43 ?292次閱讀

    明治案例 | PE編織袋【大視野】【OCR識別

    OCR識別技術(shù)OCR識別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進的圖像處理技術(shù),自動、高效地識別并轉(zhuǎn)換圖像中的文字信息為可編輯的
    的頭像 發(fā)表于 08-13 08:25 ?353次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】

    訊維智能語音轉(zhuǎn)寫系統(tǒng)確保企業(yè)數(shù)據(jù)的安全性

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫系統(tǒng)
    的頭像 發(fā)表于 08-02 15:53 ?481次閱讀

    智能手機充電頭OCR精準(zhǔn)識別

    文本是人類最重要的信息來源之一,自然場景中充滿了形形色色的文字符號。光學(xué)字符識別(OCR)相信大家都不陌生。而工業(yè)場景的圖像文字識別更加復(fù)雜
    的頭像 發(fā)表于 06-11 08:24 ?366次閱讀
    <b class='flag-5'>智能</b>手機充電頭<b class='flag-5'>OCR</b>精準(zhǔn)<b class='flag-5'>識別</b>

    車內(nèi)語音識別數(shù)據(jù)智能駕駛中的價值與應(yīng)用

    化和個性化提供了有力支持。本文將詳細(xì)介紹車內(nèi)語音識別數(shù)據(jù)智能駕駛中的價值、應(yīng)用以及面臨的挑戰(zhàn)和未來的發(fā)展趨勢。 二、車內(nèi)語音識別數(shù)據(jù)的價值 提高駕駛安全性:通過語音控制車輛功能,駕駛員可以
    的頭像 發(fā)表于 02-19 11:47 ?498次閱讀

    車內(nèi)語音識別數(shù)據(jù)智能駕駛中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,車內(nèi)語音識別數(shù)據(jù)智能駕駛中的應(yīng)用越來越廣泛。車內(nèi)語音識別技術(shù)為駕駛員提供了更加便捷和安全的駕駛體驗,
    的頭像 發(fā)表于 01-26 18:14 ?1041次閱讀

    語音數(shù)據(jù)集在智能語音搜索中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著互聯(lián)網(wǎng)的普及和移動設(shè)備的興起,智能語音搜索已經(jīng)成為人們獲取信息的重要方式之一。智能語音搜索通過語音交互的方式,為用戶提供更加便捷、高效的信息查詢服務(wù)。語音
    的頭像 發(fā)表于 01-18 15:09 ?489次閱讀

    感知智能:連接虛擬與現(xiàn)實的橋梁

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)感知智能是指通過各種傳感器獲取信息的能力,它涵蓋了視覺、聽覺、觸覺等感知能力,能夠計算機模仿人類的感知過程,實現(xiàn)更加精確和高效的
    的頭像 發(fā)表于 01-04 00:09 ?1822次閱讀

    vlookup過來的數(shù)據(jù)怎么變成文本

    VLOOKUP是一個非常有用的Excel函數(shù),用于查找并提取特定值或數(shù)據(jù)。在VLOOKUP函數(shù)中,通常返回的數(shù)據(jù)類型是數(shù)值或日期,但有時我們可能希望將這些數(shù)據(jù)轉(zhuǎn)換為
    的頭像 發(fā)表于 12-01 10:18 ?2.8w次閱讀

    車內(nèi)語音識別數(shù)據(jù):駕駛體驗升級與智能出行的未來

    車內(nèi)語音識別數(shù)據(jù)是指在汽車內(nèi)部通過語音識別技術(shù)對駕駛員和乘客的語音指令進行處理和響應(yīng)的數(shù)據(jù)。隨著智能科技的蓬勃發(fā)展,車內(nèi)語音識別數(shù)據(jù)正成為現(xiàn)
    的頭像 發(fā)表于 11-08 17:01 ?367次閱讀

    OCR如何自動識別圖片文字

    OCR 是光學(xué)字符識別(英語:Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,
    的頭像 發(fā)表于 10-31 16:45 ?703次閱讀
    <b class='flag-5'>OCR</b>如何自動<b class='flag-5'>識別</b>圖片文字

    easyocr:超級簡單且強大的OCR文本識別工具

    今天給大家介紹一個超級簡單且強大的OCR文本識別工具: easyocr . 這個模塊支持70多種語言的即用型OCR,包括中文,日文,韓文和泰文等。 下面是這個模塊的實戰(zhàn)教程。 1.準(zhǔn)備
    的頭像 發(fā)表于 10-30 09:30 ?2588次閱讀
    easyocr:超級簡單且強大的<b class='flag-5'>OCR</b><b class='flag-5'>文本</b><b class='flag-5'>識別</b>工具