0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCU軟件基準(zhǔn)測試實用技巧:編譯器優(yōu)化能力評測指引

li5236 ? 來源:IAR Systems ? 作者:IAR Systems ? 2022-03-29 15:42 ? 次閱讀

MCU開發(fā)和應(yīng)用中,工程師都需要進行MCU的能力測試,通用的做法是用Benchmark(基準(zhǔn))程序來測試。然而,在做基準(zhǔn)測試時,編譯器的優(yōu)化能力也在測試結(jié)果中有較為明顯的影響,同一套硬件平臺,選用不同的編譯器和不同的優(yōu)化選項,可能得出的結(jié)果相差較大。

為了最大程度釋放MCU的性能,在基準(zhǔn)測試中取得最理想的結(jié)果,往往需要工程師不僅對自身的硬件比較了解,更需要深入了解編譯器的優(yōu)化原理,并靈活應(yīng)用,才能在基準(zhǔn)測試中發(fā)揮出MCU的全部性能。IAR Systems作為全球知名嵌入式工具廠商,其編譯器在優(yōu)化能力上有獨特的優(yōu)勢,MCU配合IAR的編譯器往往能夠得出較好的基準(zhǔn)測試結(jié)果。

本文以已在MCU領(lǐng)域內(nèi)廣泛使用的IAR Embedded Workbench開發(fā)工具套件為例,來分享MCU軟件基準(zhǔn)測試應(yīng)該注意的項目和以下技巧,從而幫助讀者能夠去生成業(yè)內(nèi)最高效和最完備的代碼。利用以下項目和設(shè)置,工程師可以精準(zhǔn)調(diào)整優(yōu)化等級,最大限度地進行測試和提升所開發(fā)和應(yīng)用代碼的性能。

poYBAGJCuFuAbhGVAADZAWuUulQ949.png

選擇代碼尺寸還是執(zhí)行速度

利用IAR Embedded Workbench等開發(fā)工具套件,工程師可以對整個工程范圍或?qū)蝹€文件設(shè)定優(yōu)化級別和類型。在源代碼中,甚至可以對單個函數(shù)使用 #pragma optimize 指令來完成此操作。

優(yōu)化的目的是減少代碼尺寸和提高執(zhí)行速度。如果只能滿足其中一個目標(biāo),編譯器會根據(jù)用戶指定的設(shè)置進行優(yōu)先處理。因此,在實際的軟件基準(zhǔn)測試中,工程師可以嘗試各種設(shè)置來獲得最佳效果。舉個例子,由于函數(shù)內(nèi)聯(lián)更側(cè)重于執(zhí)行速度的優(yōu)化,相較于采用通用代碼尺寸優(yōu)化設(shè)置,采用函數(shù)內(nèi)聯(lián)與通用代碼執(zhí)行速度優(yōu)化設(shè)置將獲得更小的程序代碼。

pYYBAGJCuFuAB1K_AADejuqRXu0400.png

選擇小型內(nèi)存模型

為了能夠充分地發(fā)揮MCU器件的性能和減少應(yīng)用中的問題,軟件開發(fā)必須充分考慮MCU器件的內(nèi)存等資源限制,因此需要為目標(biāo)器件和項目選擇盡可能小的內(nèi)存模型。小型內(nèi)存模型的優(yōu)點包括:

· 更小尺寸的地址

· 更小尺寸的指令

· 更小尺寸的指針

· 效率更高

· 代碼更少

諸如IAR Embedded Workbench這樣的成熟的開發(fā)工具套件也集成了相關(guān)評估功能,可以對內(nèi)存模型進行多方面評估,從而幫助工程師去測試軟件的規(guī)模和優(yōu)化設(shè)計。

選擇合適的運行時庫

默認情況下,運行時庫是以最高代碼尺寸優(yōu)化級別進行編譯的。如果您想要對速度進行優(yōu)化,請考慮重新編譯生成這些庫??梢酝ㄟ^配置選項來設(shè)置某些標(biāo)準(zhǔn)庫功能(如語言環(huán)境、文件描述符和多字節(jié))最適合的級別。

根據(jù)具體需求,在庫選項中選擇 scanf 輸入和 printf 的格式。默認選項并非最小格式。

poYBAGJCuFuAPyqLAAExte1Juaw740.png

pYYBAGJCuFuAZipbAACjCF3a-w8595.png

使用正確的數(shù)據(jù)類型

數(shù)據(jù)類型與代碼尺寸或者執(zhí)行速度息息相關(guān),因此需要利用開發(fā)工具來對數(shù)據(jù)類型進行觀察和分析,以便找到適合硬件資源的類型。在IAR Embedded Workbench開發(fā)工具套件中,開發(fā)人員可以從以下幾個方面著手進行測試和優(yōu)化:

· 選擇最適合您應(yīng)用程序的的數(shù)據(jù)類型尺寸

· 盡量使用無符號字符型,這樣就能執(zhí)行位操作而不是算術(shù)操作

poYBAGJCuFyALLTJAAAb1fU56_I713.png

檢查目標(biāo)特定選項

檢查能提高性能的目標(biāo)特定選項,這在日常的MCU設(shè)計和應(yīng)用開發(fā)中往往需要工程師具有相當(dāng)?shù)慕?jīng)驗,但是通過使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件則可以快速而完善地完成必要的性能檢查:

· 高效的尋址模式——可實現(xiàn)高效的內(nèi)存訪問

· 使用特定的寄存器來處理常量/變量——代碼在寄存器上的操作效率比在內(nèi)存上更高

· 偶對齊函數(shù)入口——偶對齊指令可以提高速度

· 字節(jié)對齊對象——更小的存儲空間需求,但可能生成更大的代碼尺寸

使用基準(zhǔn)測試相關(guān)代碼

所有的MCU開發(fā)工具都應(yīng)該提供基準(zhǔn)測試相關(guān)代碼,但是成熟的通用開發(fā)工具的代碼庫都是這些提供商在相關(guān)領(lǐng)域經(jīng)驗的濃縮,因此更為全面和高效。其中的重要經(jīng)驗包括:

· 嵌入式系統(tǒng)的基準(zhǔn)測試應(yīng)該針對嵌入式程序的特點來設(shè)計。

· 實際的應(yīng)用程序通常也適用于基準(zhǔn)測試,但需要確保代碼的可執(zhí)行性。鏈接器會刪除未引用的代碼和變量,但并非所有的鏈接器都具備這種功能。

· 確保測試代碼不受測試工具(測試相關(guān)函數(shù))的影響。以下示例其實是對 printf() (測試相關(guān)函數(shù))進行了基準(zhǔn)測試。

pYYBAGJCuFyAUBB2AAA2GYGYZw8139.png

· 比較鏈接后生成的代碼。一款編譯器可能會采用內(nèi)聯(lián)代碼,而另一款編譯器可能會調(diào)用庫。

· 充分了解用于執(zhí)行基準(zhǔn)測試的應(yīng)用代碼!

總結(jié)

通過使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件,發(fā)揮其在幾十年全球性應(yīng)用中行匯聚和迭代出的知識,MCU設(shè)計和應(yīng)用開發(fā)工程師可以快速完成上述這些必要的性能測試,同時也可以進一步有針對性地發(fā)揮MCU的性能,從而實現(xiàn)目標(biāo)器件最優(yōu)化的、軟硬件合一的功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    16812

    瀏覽量

    349427
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1608

    瀏覽量

    48979
收藏 人收藏

    評論

    相關(guān)推薦

    Keil編譯器優(yōu)化方法

    我們都知道,代碼是可以通過編譯器優(yōu)化的,有的時候,為了提高運行速度或者減少代碼尺寸,會開啟優(yōu)化選項。
    的頭像 發(fā)表于 10-23 16:35 ?105次閱讀
    Keil<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>方法

    AI編譯器技術(shù)剖析

    隨著人工智能技術(shù)的飛速發(fā)展,AI編譯器作為一種新興的編譯技術(shù)逐漸進入人們的視野。AI編譯器不僅具備傳統(tǒng)編譯器的功能,如將高級語言編寫的源代碼轉(zhuǎn)換為機器可執(zhí)行的代碼,還融入了人工智能技術(shù)
    的頭像 發(fā)表于 07-17 18:28 ?1343次閱讀

    人工智能編譯器與傳統(tǒng)編譯器的區(qū)別

    人工智能編譯器(AI編譯器)與傳統(tǒng)編譯器在多個方面存在顯著的差異。這些差異主要體現(xiàn)在設(shè)計目標(biāo)、功能特性、優(yōu)化策略、適用范圍以及技術(shù)復(fù)雜性等方面。以下是對兩者區(qū)別的詳細探討,旨在全面解析
    的頭像 發(fā)表于 07-17 18:19 ?1486次閱讀

    Meta發(fā)布基于Code Llama的LLM編譯器

    近日,科技巨頭Meta在其X平臺上正式宣布推出了一款革命性的LLM編譯器,這一模型家族基于Meta Code Llama構(gòu)建,并融合了先進的代碼優(yōu)化編譯器功能。LLM編譯器的推出,標(biāo)
    的頭像 發(fā)表于 06-29 17:54 ?1385次閱讀

    芯來科技與華東師范大學(xué)SOLE實驗室合作推動LLVM/CLANG編譯器優(yōu)化

    行深入的LLVM/CLANG編譯器優(yōu)化以及程序性能優(yōu)化和調(diào)優(yōu)。 我們不僅優(yōu)化了LLVM編譯器的多個關(guān)鍵環(huán)節(jié),提升了代碼生成效率和執(zhí)行性能,還
    的頭像 發(fā)表于 06-12 09:09 ?528次閱讀
    芯來科技與華東師范大學(xué)SOLE實驗室合作推動LLVM/CLANG<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>

    SEGGER編譯器優(yōu)化和安全技術(shù)介紹 支持最新C和C++語言

    SEGGER編譯器是專門為ARM和RISC-V微控制設(shè)計的優(yōu)化C/C++編譯器。它建立在強大的Clang前端上,支持最新的C和C++語言功能。 除其他外,其主要功能包括: 1)?尺寸
    的頭像 發(fā)表于 06-04 15:31 ?1285次閱讀
    SEGGER<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>和安全技術(shù)介紹 支持最新C和C++語言

    KEIL怎么禁止某個函數(shù)/某段代碼被編譯器優(yōu)化?

    有沒有大佬知道,KEIL怎么禁止某個函數(shù)/某段代碼 被編譯器優(yōu)化?
    發(fā)表于 04-10 08:17

    英特爾宣布DPC++編譯器優(yōu)化無效,2600項基準(zhǔn)測試成績丟失

    根據(jù)公告,該編譯器有選擇性地運用了與SPEC代碼及數(shù)據(jù)集的先驗知識有關(guān)的轉(zhuǎn)換,僅致力于提升523.xalancbmk_r/623.xalancbmk_s基準(zhǔn)性能,而這種優(yōu)化形式的適用范圍相對狹窄。
    的頭像 發(fā)表于 02-19 13:53 ?478次閱讀

    RT-Thread Studio怎么為單個c文件打開編譯器優(yōu)化?

    RT-Thread Studio怎么為單個c文件打開編譯器優(yōu)化
    發(fā)表于 02-19 06:45

    QT開發(fā)學(xué)習(xí)筆記1(安裝交叉編譯器

    QT安裝交叉編譯器
    的頭像 發(fā)表于 02-18 10:02 ?788次閱讀
    QT開發(fā)學(xué)習(xí)筆記1(安裝交叉<b class='flag-5'>編譯器</b>)

    Android編譯優(yōu)化之混淆配置

    為了使用java8及后續(xù)java新版本的特性,Google增加了一步編譯過程—脫糖(desugaring),但這一步會導(dǎo)致更長的編譯時間,這也是為什么Google會推出D8和R8編譯器優(yōu)化
    的頭像 發(fā)表于 12-21 09:21 ?1861次閱讀
    Android<b class='flag-5'>編譯</b><b class='flag-5'>優(yōu)化</b>之混淆配置

    Triton編譯器的原理和性能

    Triton是一種用于編寫高效自定義深度學(xué)習(xí)原語的語言和編譯器。Triton的目的是提供一個開源環(huán)境,以比CUDA更高的生產(chǎn)力編寫快速代碼,但也比其他現(xiàn)有DSL具有更大的靈活性。Triton已被采用
    的頭像 發(fā)表于 12-16 11:22 ?2523次閱讀
    Triton<b class='flag-5'>編譯器</b>的原理和性能

    TVM編譯器的整體架構(gòu)和基本方法

    。但是這其中也去思考了一下基于FPGA加速編譯器架構(gòu)。在FPGA深度學(xué)習(xí)加速中,編譯器除了需要自動化生成指令外,還要優(yōu)化指令的結(jié)構(gòu),來
    的頭像 發(fā)表于 11-30 09:36 ?2121次閱讀
    TVM<b class='flag-5'>編譯器</b>的整體架構(gòu)和基本方法

    編譯器優(yōu)化選項

    這一點,需要了解編譯器能力和限制;第三,要了解硬件的運行方式,針對硬件特性進行優(yōu)化。本文著重展開第二點和第三點。 簡單認識編譯器 要寫出高性能的代碼,首先需要對
    的頭像 發(fā)表于 11-24 15:37 ?810次閱讀
    <b class='flag-5'>編譯器</b>的<b class='flag-5'>優(yōu)化</b>選項

    CPU程序幾個優(yōu)化程序性能的手段詳解

    要寫出高性能的代碼,首先需要對編譯器有基礎(chǔ)的了解,原因在于現(xiàn)代編譯器有很強的優(yōu)化能力,但有些代碼編譯器不能進行
    的頭像 發(fā)表于 11-21 09:46 ?507次閱讀
    CPU程序幾個<b class='flag-5'>優(yōu)化</b>程序性能的手段詳解