Benchmark的目的是通過對所提供的基準測試,用于驗證和確定目標系統(tǒng)的性能規(guī)模和計算能力;測試內(nèi)存帶寬與性能指標;測試文件系統(tǒng)(I/O)性能指標;測試網(wǎng)絡帶寬與性能指標;測試高性能計算機整體性能指標等。
目前云平臺上已經(jīng)移植了三項Benchmark測試:Stream、UnixBench、CoreMark-PRO。更多測試項目和體系建設正在進行,并正在招聘實習生,歡迎參與(可加微信iYuta-R2進一步溝通了解)。本文先介紹已經(jīng)完成的三項測試的結果,如果您對結果有相關什么疑問和指正,也可以通過文末的聯(lián)系方式找到我們。
1.Stream
Stream 基準測試是一個簡單的綜合基準測試程序,用于測量可持續(xù)內(nèi)存帶寬(以 MB/s 為單位)以及簡單向量內(nèi)核的相應計算速率。測試結果如下【僅供參考】:更完整的測試詳見RVBoards公眾號文章:RISC-V公測平臺發(fā)布 · Stream帶寬完整測試 2. UnixBenchUnixBench的目的是提供類Unix系統(tǒng)性能的基本指標。由此,使用多個測試來測試系統(tǒng)性能的各個方面,然后將這些測試結果與基線系統(tǒng)的分數(shù)進行比較,產(chǎn)生指數(shù)值,該指數(shù)值通常比原始分數(shù)更容易處理。然后將整組索引值組合起來以形成系統(tǒng)的總體索引。其中包括一些非常簡單的圖形測試,用于測量系統(tǒng)的 2D 和 3D 圖形性能。測試結果如下【僅供參考】:
64 CPUs in system; running 1 parallel copy of tests
Dhrystone 2 using register variables 9401556.0 lps (10.0 s, 7 samples)
Double-Precision Whetstone 2875.1 MWIPS (10.0 s, 7 samples)
Execl Throughput 719.1 lps (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks 211569.9 KBps (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks 56404.6 KBps (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks 595552.5 KBps (30.0 s, 2 samples)
Pipe Throughput 306839.8 lps (10.0 s, 7 samples)
Pipe-based Context Switching 19074.8 lps (10.0 s, 7 samples)
Process Creation 1912.9 lps (30.0 s, 2 samples)
Shell Scripts (1 concurrent) 2549.0 lpm (60.0 s, 2 samples)
Shell Scripts (8 concurrent) 2104.7 lpm (60.0 s, 2 samples)
System Call Overhead 583954.0 lps (10.0 s, 7 samples)
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 9401556.0 805.6
Double-Precision Whetstone 55.0 2875.1 522.8
Execl Throughput 43.0 719.1 167.2
File Copy 1024 bufsize 2000 maxblocks 3960.0 211569.9 534.3
File Copy 256 bufsize 500 maxblocks 1655.0 56404.6 340.8
File Copy 4096 bufsize 8000 maxblocks 5800.0 595552.5 1026.8
Pipe Throughput 12440.0 306839.8 246.7
Pipe-based Context Switching 4000.0 19074.8 47.7
Process Creation 126.0 1912.9 151.8
Shell Scripts (1 concurrent) 42.4 2549.0 601.2
Shell Scripts (8 concurrent) 6.0 2104.7 3507.9
System Call Overhead 15000.0 583954.0 389.3
========
System Benchmarks Index Score 404.7
------------------------------------------------------------------------
Benchmark Run: Tue Jul 18 2023 09:45:31 - 10:14:27
64 CPUs in system; running 64 parallel copies of tests
Dhrystone 2 using register variables 599089659.4 lps (10.0 s, 7 samples)
Double-Precision Whetstone 183186.6 MWIPS (10.0 s, 7 samples)
Execl Throughput 13700.6 lps (29.5 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks 10622116.4 KBps (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks 3444789.4 KBps (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks 10962548.9 KBps (30.0 s, 2 samples)
Pipe Throughput 20175106.5 lps (10.0 s, 7 samples)
Pipe-based Context Switching 2975086.8 lps (10.0 s, 7 samples)
Process Creation 10684.1 lps (30.0 s, 2 samples)
Shell Scripts (1 concurrent) 59032.5 lpm (60.0 s, 2 samples)
Shell Scripts (8 concurrent) 7481.0 lpm (60.2 s, 2 samples)
System Call Overhead 37161452.1 lps (10.0 s, 7 samples)
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 599089659.4 51335.9
Double-Precision Whetstone 55.0 183186.6 33306.7
Execl Throughput 43.0 13700.6 3186.2
File Copy 1024 bufsize 2000 maxblocks 3960.0 10622116.4 26823.5
File Copy 256 bufsize 500 maxblocks 1655.0 3444789.4 20814.4
File Copy 4096 bufsize 8000 maxblocks 5800.0 10962548.9 18900.9
Pipe Throughput 12440.0 20175106.5 16217.9
Pipe-based Context Switching 4000.0 2975086.8 7437.7
Process Creation 126.0 10684.1 847.9
Shell Scripts (1 concurrent) 42.4 59032.5 13922.8
Shell Scripts (8 concurrent) 6.0 7481.0 12468.4
System Call Overhead 15000.0 37161452.1 24774.3
========
System Benchmarks Index Score 13089.1
3.CoreMark-PROCoreMark-PRO 是一款全面、先進的處理器基準測試,可與經(jīng)過市場驗證的行業(yè)標準 EEMBC CoreMark 基準測試配合使用并對其進行增強。CoreMark 強調(diào) CPU 管道,而 CoreMark-PRO 測試整個處理器,增加對多核技術、整數(shù)和浮點工作負載組合以及利用更大內(nèi)存子系統(tǒng)的數(shù)據(jù)集的全面支持。EEMBC CoreMark 和 CoreMark-PRO 共同提供了涵蓋從低端微控制器到高性能計算處理器的標準基準。EEMBC CoreMark-PRO 基準測試包含五種流行的整數(shù)工作負載和四種流行的浮點工作負載。
WORKLOAD RESULTS TABLE
MultiCore SingleCore
Workload Name (iter/s) (iter/s) Scaling
---------- ---------- ----------
384.62 85.47 4.50
core 36.32 0.59 61.56
1333.33 71.23 18.72
24.17 2.39 10.11
nnet_test 180.79 3.15 57.39
40.51 14.93 2.71
1838.24 186.53 9.85
1523.81 64.10 23.77
376.47 47.62 7.91
MARK RESULTS TABLE
Mark Name MultiCore SingleCore Scaling
---------- ---------- ----------
28467.36 2105.08 13.52
正文完
以上內(nèi)容會同步更新至《64核RISC-V高性能處理器公共測試云平臺·快速使用指南》中,歡迎各位開發(fā)者查閱。
快速使用指南鏈接:https://www.kdocs.cn/l/cmnYcyFIlVRx
歡迎關注我們,參與進來共建RISC-V軟件生態(tài)~加入我們的討論群后,可以向管理員申請免費的64核RISC-V服務器SUDO權限試用賬號。
1. 加入微信討論群:加iYuta-R2為好友后可拉入群。
2. 加入QQ討論群:906962594(RVBoards·Only RISC-V)掃描二維碼加群
?
-
RISC-V
+關注
關注
44文章
2178瀏覽量
45893 -
澎峰科技
+關注
關注
0文章
46瀏覽量
3150
原文標題:64核RSIC-V高性能處理器公共測試云平臺 · Benchmark體系建設一期
文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論