0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺、計算機圖像學和圖像處理詳解

新機器視覺 ? 來源:大前端視野 ? 2023-12-21 16:15 ? 次閱讀

計算機視覺:Computer Vision

一門讓計算機從圖像中提取有用信息并加以分析的科學。這些信息后續(xù)可以用于輔助一些決策或者任務,比如醫(yī)學圖像分析、工程測量、自動駕駛機器人學等等。

計算機圖像學:Computer Graphics

通過使用數(shù)學模型和計算機算法來生成圖像。

圖像處理:Image Process

0415afac-9762-11ee-8b88-92fbcf53809c.png

圖像數(shù)字化:

空間采樣、量化、與連通性策略是將圖像做數(shù)字化表達過程中涉及到的重要概念。

量化:將每個像素點在色彩通道內(nèi)的亮度按照區(qū)間從連續(xù)分布轉化為離散分布的過程。

四連通與八連通:像素點計算領域的劃分標準。

四連通:像素四條邊相連的區(qū)域

八連通:比四連通多四個角。

距離:

歐式距離 (Euclidean) - 兩點之間的直線距離

0429e486-9762-11ee-8b88-92fbcf53809c.png

曼哈頓距離 (City Block) - 沿著方格線行走的兩點間距(即僅水平和豎直四個方向移動)

043e40c0-9762-11ee-8b88-92fbcf53809c.png

切比雪夫距離距離 (Chess Board) - 沿著方格線及對角行走的兩點間距(即水平、豎直、以及對角八個方向移動)

0448dada-9762-11ee-8b88-92fbcf53809c.png

一張圖片中往往有前景(foreground)和背景(background):

確定前景和背景的連通性策略,通常有:

背景四連通、前景八連通

背景八連通、前景四連通

一般有遞歸算法、順序標記法。

遞歸算法消耗性能大:遍歷圖像中所有的像素點,遇到未標記區(qū)域編號的點即遞歸用當前的區(qū)域編號標記與之相連的所有像素點。

順序標記法:運用與像素區(qū)域連通性問題

圖像數(shù)據(jù)的收集和處理:

借助語義化分割對 UI 圖像進行處理,得到輪廓、結構、上下文等特征。

借助超級像素的方法來降低特征的數(shù)量,合并像素達到降低干擾因素的效果。

采用 OpenCV 進行測量、計算,然后用規(guī)則嘗試提取有用的特征數(shù)據(jù),結果并不理想,它更加擅長測量和計算:需要大量的閾值約束才能達到比較好的效果:

機器視覺的模型和算法來解決。這邊介紹 2 個模型:

MaskRCNN

2017年,Kaiming He等人提出了Mask R-CNN,是一種目標檢測和實例分割的算法

045f65a2-9762-11ee-8b88-92fbcf53809c.png

Mask R-CNN(Mask Region-based Convolutional Neural Network)是一種用于目標檢測和實例分割的深度學習模型,它是 Faster R-CNN 的擴展,同時可以生成目標的二進制掩碼(mask),因此可以實現(xiàn)精確的實例分割。

1、骨干網(wǎng)絡:Mask R-CNN通常使用骨干網(wǎng)絡(如 ResNet)來提取圖像特征。這些特征用于目標檢測和分割任務。

2、區(qū)域建議網(wǎng)絡(RPN):RPN 用于生成候選區(qū)域,它是 Faster R-CNN 中的組件,用于確定可能包含目標的圖像區(qū)域。

3、目標檢測:Mask R-CNN 使用區(qū)域建議來檢測圖像中的目標對象,通常通過分類和回歸來確定每個目標的位置和類別。

4、實例分割:除了目標檢測,Mask R-CNN 還生成每個檢測到的目標的精確二進制掩碼。這允許對目標進行精確的像素級分割。

5、多任務學習:Mask R-CNN 采用多任務學習的方法,通過同時訓練目標檢測和實例分割任務,從而提高模型的性能。

6、ROI Pooling / ROI Align:用于從特征圖中提取每個候選區(qū)域的特征,以供后續(xù)任務使用。

7、損失函數(shù):Mask R-CNN 使用多個損失函數(shù),包括分類損失、回歸損失和分割損失,來訓練模型。

Yolo V3

2016年,Joseph Redmon等人提出的 YOLO 是一種單階段的目標檢測算法,突破性地實現(xiàn)了實時目標檢測。

實例分割(instance segmentation)是機器視覺研究中比較重要、復雜和具有挑戰(zhàn)性的領域之一。在機器人,自動駕駛,監(jiān)視等領域均有應用。

來源:大前端視野

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    210

    文章

    27989

    瀏覽量

    205536
  • 圖像處理
    +關注

    關注

    27

    文章

    1272

    瀏覽量

    56496
  • 計算機
    +關注

    關注

    19

    文章

    7289

    瀏覽量

    87516

原文標題:計算機視覺、計算機圖像學、圖像處理等你會不會?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    計算機圖形圖像處理最新應用分析

    計算機圖形圖像處理最新應用分析 圖形圖像處理是研究計算機除了圖形圖像的原理、方法和技術的科學。它是計算機
    發(fā)表于 09-23 14:56

    機器視覺計算機視覺的關系簡述

    計算機視覺是一門獨立的學科,有著30年左右的歷史,集圖像處理、模式識別、人工智能技術為一體,著重服務于一幅或多幅圖像
    發(fā)表于 05-13 14:57

    圖像處理計算機視覺相關的書籍有哪些

    圖像處理計算機視覺相關的書籍
    發(fā)表于 05-20 13:58

    用于計算機視覺訓練的圖像數(shù)據(jù)集介紹

    用于計算機視覺訓練的圖像數(shù)據(jù)集
    發(fā)表于 02-26 07:35

    基于OpenCV的計算機視覺技術實現(xiàn)

    基于OpenCV的計算機視覺技術實現(xiàn)OpencV是用來實現(xiàn)計算機視覺相關技術的開放源碼工作庫,是計算機
    發(fā)表于 11-23 21:06 ?0次下載
    基于OpenCV的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術實現(xiàn)

    計算機圖形學總覽:圖像圖像的概念辨析

    計算機圖形學和計算機視覺是同一過程的兩個方向。計算機圖形學將抽象的語義信息轉化成圖形,計算機視覺
    的頭像 發(fā)表于 08-21 09:10 ?6501次閱讀

    基于計算機視覺的自動搜索圖像語義分割架構

    計算機視覺中,這適用于圖像分類和密集圖像預測。
    的頭像 發(fā)表于 01-17 17:31 ?3277次閱讀
    基于<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的自動搜索<b class='flag-5'>圖像</b>語義分割架構

    基于計算機圖像處理方法

    圖像是由像素點組成的矩陣,矩陣的每個點記錄著圖像的RGB值。數(shù)字圖像處理即根據(jù)用戶需求,使用計算機技術對
    的頭像 發(fā)表于 03-13 16:32 ?4690次閱讀

    計算機視覺什么_計算機視覺好找工作嗎

    學習計算機視覺需要具備的知識儲備有:圖像處理的知識。圖像處理大致包括的內(nèi)容:光學成像基礎、顏色、
    的頭像 發(fā)表于 07-30 16:57 ?6050次閱讀

    基于計算機視覺的多維圖像智能

    利用攝像機和其他數(shù)據(jù)源,計算機視覺可以收集有關公司運營最重要方面的重要信息,這些信息包括構成流程主干的人員、產(chǎn)品、資產(chǎn)和文檔的組合。當企業(yè)收集數(shù)字圖像并應用深度學習算法,通過對機器眼睛“所見”的反應來準確識別和分類對象時,
    的頭像 發(fā)表于 08-04 10:39 ?2914次閱讀

    用于計算機視覺訓練的圖像數(shù)據(jù)集

    ? 計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺的目標是使人類
    的頭像 發(fā)表于 12-31 09:33 ?2287次閱讀

    用于計算機視覺訓練的圖像數(shù)據(jù)集

    計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺的目標是使人類
    的頭像 發(fā)表于 02-12 16:13 ?1339次閱讀

    機器學習和計算機視覺的前20個圖像數(shù)據(jù)集

    計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺的目標是使人類
    發(fā)表于 01-28 07:40 ?5次下載
    機器學習和<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的前20個<b class='flag-5'>圖像</b>數(shù)據(jù)集

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優(yōu)缺點。這些算法在圖像
    的頭像 發(fā)表于 02-19 13:26 ?1127次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    計算機視覺圖像處理的區(qū)別和聯(lián)系

    計算機視覺圖像處理是兩個密切相關但又有明顯區(qū)別的領域。 1. 基本概念 1.1 計算機視覺
    的頭像 發(fā)表于 07-09 09:16 ?947次閱讀