0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何輸入3D網(wǎng)格物體(原始三角形和頂點),得到分類概率的輸出

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-06-24 09:58 ? 次閱讀

2017 年 3 月,當時我的老板說自動識別 3D 物體幾乎是不可能的,但大家一致反對。

因此,今天我要解決的問題是:如何輸入 3D 網(wǎng)格物體(原始三角形和頂點),得到分類概率的輸出。

我找到了如下幾種解決方案:

對物體進行縮放并將其分割成體素。將體素給到神經(jīng)網(wǎng)絡中。

計算大量描述符,將其放入分類器。

從多側(cè)進行物體投射,嘗試用單獨的分類器進行識別,然后將其放到元分類器中。

在這里我想詳細講述一下一種相對簡單有效的方法,即 DeepPano 方法。

▌數(shù)據(jù)準備

如今,圖像數(shù)據(jù)集包含大量樣本。但就 3D 模型數(shù)據(jù)集而言,并非如此。3D模型數(shù)據(jù)集中沒有成千上萬的圖像,因此 3D 模型識別沒有得到深入研究,3D模型數(shù)據(jù)集也不均衡。大多數(shù)數(shù)據(jù)集包含有未進行方向?qū)R的物體。

ModelNet10 是一個相對清晰的 3D 物體數(shù)據(jù)集。3D 物體在數(shù)據(jù)集中被存儲為包含點線面的.off文件。 .off文件格式不支持顯示布料、紋理以及其他材質(zhì)。

這里是物體種類與樣本數(shù)量:

樣本總數(shù)約為 5000。當然這個數(shù)據(jù)集也非常不均衡。

首先要做的是選擇分類器類型。由于如圖像、語音等重要數(shù)據(jù)的技術解決方案都是基于神經(jīng)網(wǎng)絡(或在 Kaggle 比賽中經(jīng)常使用的奇特組件),因此訓練神經(jīng)網(wǎng)絡是合乎邏輯的。神經(jīng)網(wǎng)絡對數(shù)據(jù)集的均衡性很敏感。所以第二步需要做的是使數(shù)據(jù)集更均衡。

我決定使用從 3dWarehouse 中得到的模型獲取更多數(shù)據(jù)并創(chuàng)建擴展數(shù)據(jù)集。這些模型是以.skp文件格式存儲的,因此必須進行轉(zhuǎn)換。我使用SketchUp C Api創(chuàng)建了.skp - >.off轉(zhuǎn)換器來進行轉(zhuǎn)換。

下一步是數(shù)據(jù)清理,完全相同的圖像已被刪除??梢赃@樣分配:

這樣數(shù)據(jù)集看起來就比較均衡了。除馬桶外,幾乎每個物體類別都包含有近 1000 個樣本。其他物體類型之間的不均衡可通過分類權重進行修正。

▌數(shù)據(jù)預處理

在之前的步驟中,我們已經(jīng)做了幾件重要的事情。

闡述問題。

下載我們將要使用的基本數(shù)據(jù)集(ModelNet10)。

從最初的 10 類物體中選出了7類。

通過創(chuàng)建.skp - > .off 轉(zhuǎn)換器來轉(zhuǎn)換 3d warehouse.中的模型,數(shù)據(jù)集變得更加均衡。

現(xiàn)在開始深入了解數(shù)據(jù)預處理。

在預處理過程中,數(shù)據(jù)預處理的最終結果是要用一種新的圖像來表示 3D 網(wǎng)格物體。我們將使用圓柱投影來創(chuàng)建圖像。

3D網(wǎng)格物體

此物體的轉(zhuǎn)換結果

首先,我們需要讀入 3D 網(wǎng)格物體并進行存儲。這可以通過功能強大的 trimesh 庫來完成。它不僅提供讀/寫功能,而且有大量其他有用的功能,如網(wǎng)格變換,光線追蹤等。

第二步是計算圓柱投影。圓柱投影是什么呢?假設一個立方體位于 XoY 平面的中心,且原點有一條垂直軸。

注意:如果物體的主軸不垂直,則需要在進行物體識別前應用方向?qū)R算法。這是一個完全不同的領域,因此在這里不對此主題進行探討。

立方體和主軸

現(xiàn)在假設有一個包裹立方體的最小圓柱體。

現(xiàn)在將圓柱體的側(cè)面切割成 M×N 的網(wǎng)格。

現(xiàn)在將每個網(wǎng)格節(jié)點垂直投影到主軸上并獲取一組投影點。投影點集合由P表示。投影線集合由 S 表示。

綠色是主軸,紅色是網(wǎng)格,黃色是幾何投影線。

現(xiàn)在將 S 集合中的每段與網(wǎng)格體,即該立方體相交。你將從每條射線獲得一個交點。將該點分配給相應的網(wǎng)格節(jié)點。

其實這是一個特例。一般情況下,S 中的一個投影線可以有多個交點,或者根本沒有交點。下面就是一個例子。

因此,通常這個過程的結果是在每個單元中都有一個 M×N 矩陣,其中可能具有交點數(shù)組,也可能是空的。對于立方體,每個單元格將包含具有單個元素的數(shù)組。

下一步是從每個單元格的交點中選取離對應的 M 中的點距離最遠的點,并將它們之間的距離寫入 M×N 矩陣 R。矩陣(或圖像)R 稱為全景圖。

我們?yōu)槭裁匆x取最遠的點?最遠的點通常集中于物體的外表面。我們將其用全景圖表示,可用于識別模塊。當然,有人可能會說:“圓環(huán)和高度相同的圓柱體會呈現(xiàn)出完全相同的全景圖”或者“中心有一個球形孔的立方體和沒有孔的立方體會呈現(xiàn)出完全相同的全景圖”,這是正確的。

以全景圖來呈現(xiàn) 3D 物體并不完美,但如果是用體素來呈現(xiàn)則沒有這樣的缺點。幸運的是,像椅子、床、汽車或飛機這些真實存在的物體由于其復雜性,很少有相同的全景圖。

最后一步是通過將單元格的值縮放到[0,1]區(qū)間,對R矩陣進行歸一化。如果單元格沒有交點,則該單元格的值為零。

現(xiàn)在我們可以將矩陣 R 視為灰度圖像。這里是所描述過程的 Python 代碼和全景圖計算的一個例子。

混凝土床(左上)、椅子(右上)和馬桶(中)的全景圖。

我們總結一下到目前為止已經(jīng)完成的步驟。

現(xiàn)在我們已經(jīng)將 3D 網(wǎng)格物體表示為灰度圖像。

3D 物體必須正確對齊。如果沒有正確對齊,那么我們首先需要使用方向?qū)R算法。

兩個不同的物體有可能具有相同的全景圖,但這種可能性很小。

現(xiàn)在我們準備創(chuàng)建卷積神經(jīng)網(wǎng)絡并解決識別問題。

▌開始識別!

我們在上一步中做了一件非常重要的事情,即找到一種合適的方法將 3D 物體轉(zhuǎn)換成圖像,我們可以將其提供給神經(jīng)網(wǎng)絡(NN)。

步驟如下所示:

我們之前已經(jīng)完成了第 1 步,所以現(xiàn)在我們開始第 2 步和第 3 步。

讓我們從模型創(chuàng)建開始。

你可以在架構中看到 RWMP 層。根據(jù)DeepPano論文,RWMP層的作用在于, 在 3D 物體圍繞主軸旋轉(zhuǎn)的情況下,保持識別精度不變。從技術上講,RWMP 只是一個行式的 MaxPooling。

模型準備就緒并編譯完成后,讀取數(shù)據(jù),然后將其刷新,并通過圖像尺寸調(diào)節(jié)創(chuàng)建 ImageDataGenerator。請注意,數(shù)據(jù)預先按照 70:15:15 的比例進行了訓練、驗證和測試。由于圖像是合成的,并且代表了 3D 物體,因此數(shù)據(jù)無法進行擴增,因為:

由于圖像是灰度的,所以不能進行顏色增強。

由于 RWMP 的存在,不能進行水平翻轉(zhuǎn)。

垂直翻轉(zhuǎn)意味著將物體顛倒。

由于圖像的合成性質(zhì),無法使用ZCA白化。

隨機旋轉(zhuǎn)會損失寶貴的物體邊角信息,我無法確定這會對3D物體轉(zhuǎn)換產(chǎn)生什么影響。

所以我想不出任何可以應用在這里的數(shù)據(jù)擴增方法。

現(xiàn)在開始訓練模型。

讓我們看看結果。

訓練絕對準確度和驗證絕對準確度

正如你所看到的,該模型驗證的準確度達到了92%,訓練的準確度達到了95%,所以沒有過度擬合。該模型數(shù)據(jù)集測試的整體準確度度為 0.895。

分類報告:

測試數(shù)據(jù)集的混淆矩陣

我們也可以自行排列這個模型。

來自上面的代碼片段

結果看起來不錯,一切都進行得都很順利,只是有些桌子被錯誤地識別為梳妝臺了。我不確定為什么會發(fā)生這種情況。這可能是未來需要改進的步驟之一。

讓我們列出可能需要改進的地方。

識別時要考慮材料、紋理和幾何尺寸等因素,否則會形成致無序模型。

提高數(shù)據(jù)集的均衡性或至少使用分類權重。生成模型(例如VAE)可使數(shù)據(jù)集更均衡。

添加更多的物體類別。

基于全景圖和不同的表示形式創(chuàng)建元模型,例如體素。這可能很昂貴。

目前為止,所有步驟介紹完畢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:一文教會你三維網(wǎng)格物體識別

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    三角形和星形電機參數(shù)怎么確定?

    請教一下 三角形和星形電機怎么確定,通過測量 ------- 線電阻=2*相電阻 星形 線電阻=2/3*相電阻 三角形 這個說法對嗎
    發(fā)表于 03-07 06:57

    三角形網(wǎng)格球面參數(shù)化研究

    三角形網(wǎng)格映射到單位球面上,接著利用球面均值迭代調(diào)整調(diào)和能量,使其向最小化方法演化,最后通過坐標轉(zhuǎn)換計算得到三角形網(wǎng)格的球面參數(shù)。實驗證明改
    發(fā)表于 04-24 09:55

    三角形柵格矩形徑向線螺旋陣列天線的設計與實驗研究

    三角形柵格矩形徑向線螺旋陣列天線的設計與實驗研究:介紹了三角形柵格矩形徑向線螺旋陣列天線的工作原理,設計并數(shù)值模擬了中心頻率為4.0 GHz的三角形柵格矩形徑
    發(fā)表于 10-27 10:27 ?24次下載

    相負載三角形連接

    實驗  相負載三角形連接 一、實驗目的:1.熟悉相負載作三角形連接的方法。2.驗證負載作
    發(fā)表于 09-24 14:09 ?3w次閱讀
    <b class='flag-5'>三</b>相負載<b class='flag-5'>三角形</b>連接

    三角形

    三角形目前的多分辨率算法(LOD)大多采用三角形作為最小的渲染圖元,綜合該算法的主要思想,使用一種更加復雜的圖元:以“宏三角形”為最小
    發(fā)表于 03-02 11:17 ?1007次閱讀
    宏<b class='flag-5'>三角形</b>

    相負載的三角形連接方法

    相負載的三角形連接方法 將相負載Zuv、Zvw、Zwu接成三角形后與電源相連,如圖3.10所示,就構成三角形連接的
    發(fā)表于 04-15 09:01 ?1.5w次閱讀
    <b class='flag-5'>三</b>相負載的<b class='flag-5'>三角形</b>連接方法

    C語言教程之輸出一個三角形

    C語言教程之輸出一個三角形,很好的GD32資料,快來學習吧。
    發(fā)表于 04-21 17:55 ?0次下載

    C語言教程之利用#輸出三角形

    C語言教程之利用#輸出三角形,很好的C語言資料,快來學習吧。
    發(fā)表于 04-22 11:06 ?0次下載

    基于貪心優(yōu)化策略的三角形排布算法

    改進的代價函數(shù)選擇代價度量最小的頂點作為活動頂點;然后繪制(即輸出)其所有未繪制的鄰接三角形,并將相鄰頂點壓入緩存,算法迭代執(zhí)行直到所有
    發(fā)表于 12-15 14:09 ?0次下載

    星形/三角形的變換法介紹

    星形-三角形變換法與三角形-星形變換法原則上是等效的。為了簡化計算,可以把星形連接的電路變換成等效三角形,也可以把三角形連接的電路變換為等效星形。即電路等效化簡后,對電路未進行變換的部
    的頭像 發(fā)表于 05-15 17:37 ?3.1w次閱讀
    星形/<b class='flag-5'>三角形</b>的變換法介紹

    Shell腳本之打印一個正三角形

    需求:打印一個正三角形,要求用戶輸入一個數(shù)字n,然后打印邊長為n個*字符的正三角形。
    的頭像 發(fā)表于 10-24 09:13 ?1738次閱讀

    三角形接法的作用

    三角形接法的作用 三角形接法是將各相電源或負載依次首尾相連,并將每個相連的點引出,作為相電的個相線。因接線形狀似三角形,所以這種接法叫做
    發(fā)表于 04-03 14:23 ?2620次閱讀

    三角形繞組的兩種連線方式介紹

    三角形繞組中,有兩種常見的連線方式,分別是星型連接和三角形連接。
    的頭像 發(fā)表于 11-21 16:59 ?1589次閱讀
    <b class='flag-5'>三角形</b>繞組的兩種連線方式介紹

    變壓器“三角形接線”和“星形接線”接法詳解

    變壓器“三角形接線”和“星形接線”接法詳解? 變壓器的三角形接線和星形接線是常見的兩種接法,它們在不同的應用場景中具有不同的優(yōu)勢和特點。 一、三角形接線 三角形接線也被稱為Delta接
    的頭像 發(fā)表于 02-18 18:17 ?1.1w次閱讀

    三角形連接和星形連接的基本概念和特點

    和星形連接的基本概念 三角形連接 三角形連接,又稱為Δ連接,是指將電機的個繞組首尾相接,形成一個閉合的三角形。在三角形連接中,每個繞組承受
    的頭像 發(fā)表于 07-17 10:35 ?1282次閱讀