STM32F407/ hk32f030m 系统性能测试–dhrystone
创始人
2025-05-30 09:08:03
0

STM32F407/ hk32f030m 系统性能测试–dhrystone

一.MCU 基本情况

CPU测试主要是dhrystone,DMIPS(Dhrystone Million Instructions executed Per Second):Dhrystone是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。Dhrystone是一种整数运算测试程序。

1.1 STM32F4MCU基本资源

The STM32F4 family incorporates high-speed embedded memories and an extensive range of enhanced I/Os and peripherals connected to two APB buses, three AHB buses and a 32-bit multi-AHB bus matrix.- 64-Kbyte of CCM (core coupled memory) data RAM- LCD parallel interface, 8080/6800 modes- Timer with quadrature (incremental) encoder input- 5 V-tolerant I/Os- Parallel camera interface- True random number generator- RTC: subsecond accuracy, hardware calendar- 96-bit unique ID

具体型号是:STM32F407IGT6 ,主频168MHZ,M4内核

1.2 航顺 hk32f030m 基本资源

 CPU core
◦ ARM® Cortex®
-M0 core
◦ Maximum frequency: 32 MHz
◦ 24-bit SysTick timer
◦ Supports interrupt vector remapping (through configuring Flash registers)

具体型号是:hk32f030mF4P6 ,TSOP20封装,主频32MHZ,M0内核

二.dhrystone_test 资源占用

2.1 时间测量

systick ,单位1ms.

DWT:

The smaller Cortex-M processors such as Cortex-M0, Cortex-M0+ and Cortex-M23 do not include the DWT capabilities described here,

2.2 内存占用

由于完整版本的dhrystone占用超过10KB,而hk32f030m 只有2KB内存,裁减了部分代码后执行测试

2.2.1 hk32f030m 内存资源占用

dhrystone_test 资源占用:

不含 dhrystone_test :

Program Size: Code=3068 RO-data=264 RW-data=20 ZI-data=132

含 dhrystone_test :

Program Size: Code=3600 RO-data=264 RW-data=76 ZI-data=10444

==运行dhrystone_test RAM资源占用 :76+10444 - 20 -132=10368 B=10368/1024=10.125KB

Image component sizesCode (inc. data)   RO Data    RW Data    ZI Data      Debug   Object Name44         12          0          8          0       2574   bsp_dwt.o400        248          0         48      10200       3149   dhry_1.o234          0          0          0          0       1923   hk32f030m_gpio.o38         10          0          4          0       2774   hk32f030m_it.o364         36         40          0          0       2851   hk32f030m_rcc.o334         12          0          0          0       4221   hk32f030m_usart.o28          8        192          0        240        736   keil_startup_hk32f030m.o700        278          0          0          0     180215   main.o384         40          0          4          0       2819   system_hk32f030m.o404         36          0          0          0      10141   usart.o

2.3 循环次数

循环次数主要根据时间进行定取,要求测试时间大于2S

2.3.1 STM32F407IGT6 循环次数

640000

2.3.1 hk32f030m 循环次数

20000

三.测试结果

3.1 STM32F407IGT6 执行结果

Dhrystone Benchmark, Version 2.1 (Language: C)Program compiled without 'register' attributeExecution starts, 640000 runs through Dhrystone[16:36:48.080]收←◆e_time 3572 1
Execution endsFinal values of the variables used in the benchmark:Int_Glob:            5should be:   5
Bool_Glob:           1should be:   1
Ch_1_Glob:           Ashould be:   A
Ch_2_Glob:           Bshould be:   B
Arr_1_Glob[8]:       7should be:   7
Arr_2_Glob[8][7]:    640010should be:   Number_Of_Runs + 10
Ptr_Glob->Ptr_Comp:          536883992should be:   (implementation-dependent)Discr:             0should be:   0Enum_Comp:         2should be:   2Int_Comp:          17should be:   17Str_Comp:          DHRYSTONE PROGRAM, SOME STRINGshould be:   DHRYSTONE PROGRAM, SOME STRING
Next_Ptr_Glob->Ptr_Comp:          536883992should be:   (implementation-dependent), same as aboveDiscr:             0should be:   0Enum_Comp:         1should be:   1Int_Comp:          18should be:   18Str_Comp:          DHRYSTONE PROGRAM, SOME STRINGshould be:   DHRYSTONE PROGRAM, SOME STRING
Int_1_Loc:           5should be:   5
Int_2_Loc:           13should be:   13
Int_3_Loc:           7should be:   7
Enum_Loc:            1should be:   1
Str_1_Loc:           DHRYSTONE PROGRAM, 1'ST STRINGshould be:   DHRYSTONE PROGRAM, 1'ST STRING
Str_2_Loc:           DHRYSTONE PROGRAM, 2'ND STRINGshould be:   DHRYSTONE PROGRAM, 2'ND STRINGMicroseconds for one run through Dhrystone: 4 
Dhrystones per Second:                      213333 
VAX  MIPS rating:                           121 
DMIPS/MHz: 0.7227 

3.2 hk32f030m 执行结果

hrystone Benchmark, Version 2.1 (Language: C)Program compiled without 'register' attributeExecution starts, 20000 runs through Dhrystone[14:33:11.890]收←◆e_time 2170 21
dwt_e_time 0 0
Execution endsFinal values of the variables used in the benchmark:Int_Glob:            0should be:   5
Bool_Glob:           1should be:   1
Ch_1_Glob:           Ashould be:   A
Ch_2_Glob:           Bshould be:   B
Arr_1_Glob[8]:       0should be:   7should be:   Number_Of_Runs + 10
Ptr_Glob->Ptr_Comp:          536871216should be:   (implementation-dependent)Discr:             0should be:   0Enum_Comp:         2should be:   2Int_Comp:          12should be:   17Str_Comp:          DHRYSTONE PROGRAM, SOME STRINGshould be:   DHRYSTONE PROGRAM, SOME STRING
Next_Ptr_Glob->Ptr_Comp:          536871216should be:   (implementation-dependent), same as aboveDiscr:             0should be:   0Enum_Comp:         1should be:   1Int_Comp:          18should be:   18Str_Comp:          DHRYSTONE PROGRAM, SOME STRINGshould be:   DHRYSTONE PROGRAM, SOME STRING
Int_1_Loc:           10should be:   5
Int_2_Loc:           13should be:   13
Int_3_Loc:           7should be:   7
Enum_Loc:            1should be:   1
Str_1_Loc:           DHRYSTONE PROGRAM, 1'ST STRINGshould be:   DHRYSTONE PROGRAM, 1'ST STRING
Str_2_Loc:           DHRYSTONE PROGRAM, 2'ND STRINGshould be:   DHRYSTONE PROGRAM, 2'ND STRINGMicroseconds for one run through Dhrystone: 100 
Dhrystones per Second:                      10000 
VAX  MIPS rating:                           5 
DMIPS/MHz: 0.1779 

四.性能分析

4.0 M内核 参考数据

Cortex-M系列

Core Architecture bits DMIPS/MHz DSP
Cortex-M0 ARMv6M 32 0.9~0.99
Cortex-M3 ARMv6M 32 1.25~1.5
Cortex-M4 ARMv6M 32 1.25~1.52 8/16 SMID 单精度FPU
Cortex-M7 ARMv7-M 32 2.14/2.55/3.23 8/16 SMID 双精度FPU

4.1 CORTEX 内核参考数据

ARM processors DMIPS/MHz comparison

CoreArchitecturebitsDMIPS/MHzDMIPS/MHz*
ARM11v7-A321.25
Cortex-A7v7-A321.91.9
Cortex-A8v7-A322.02.0
Cortex-A9v7-A322.02.5
Cortex-A15v7-A324.03.4
Cortex-A17v7-A324.03.2
Cortex-A32v8-A322.32.3
Cortex-A35v8-A32/642.52.5
Cortex-A53v8-A32/642.32.3
Cortex-A55v8-A32/642.32.7
Cortex-A57v8.2-A32/644.64.1
Cortex-A72v8-A32/645.44.7
Cortex-A73v8-A32/647.04.8
Cortex-A75v8.2-A32/647.05.2
Cortex-A76v8-A32/64

4.2 M0 性能分析

ARM Cortex-M0 功能
ISA支持	Thumb® / Thumb-2 子集
流水线	3级
性能效率	1.99 CoreMarks/MHz - 0.90 至 0.99 DMIPS/MHz
中断	不可屏蔽的中断 (NMI) + 1 到 32 个物理中断
睡眠模式	集成的 WFI 和 WFE 指令和“退出时睡眠”功能
睡眠和深度睡眠信号
随 ARM 电源管理工具包提供的可选 Retention 模式
位操作	可以使用 Cortex-M System Design Kit实现位处理操作区
增强的指令	硬件单周期 (32x32) 乘法选项
调试	可选 JTAG 和Serial-Wire 调试端口。最多 4 个断点和 2 个观察点
Core	Architecture	bits	DMIPS/MHz
M0	v6-M	32	0.9~0.99
M0+	v6-M	32	1.08
M3	v6-M	32	1.25~1.5
M4	v6-M	32	1.25~1.52
M7	v-M	32	2.14/2.55/3.2

官方数据:M0 有 0.90 至 0.99 DMIPS/MHz,但实际上hk32f030m 只有0.1779 ,而且还是裁剪版本的测试,实际更低

4.3 M4 性能分析

官方数据:M4 1.25~1.52 DMIPS/MHz,但实际上STM32F407IGT6 只有0.7227.还是国际一线大厂设计的产品,与宣称的差距非常大。

五.参考

https://gitee.com/RT-Thread-Mirror/dhrystone

https://blog.stratifylabs.co/device/2019-05-20-Dhrystone-Benchmarking-on-MCUs/

https://www.cnblogs.com/cjchang/p/12187518.html

相关内容

热门资讯

(大数据开发随笔5)Scala... 泛型 泛型类 // 创建一个通用类,技能操作Int类型,又能操作Stri...
leetcode每日一题27 263. 丑数 按题意写 class Solution {public:bool isUgly(in...
从0开始学python -65 Python urllib-2 模拟头部信息 我们抓取网页一般需要对 headers(...
kafka-producer ... Kafka需要在吞吐量和延迟之间取得平衡,可通过下面两个参数控制。 batch.size 当多个消息...
tomcat 9 编码问题导致... tomcat编码设置问题 由于刚更换tomcat 9 ,没有修改配置文件,...
XShell安装配置教程及云服... 目录一、 XShell的作用二、 下载XShell1.访问XShell官网,填写姓名和...
批量下载文档有救了:Pytho... 人生苦短,我用python 最近毕业季要做毕业设计的同学真的特别多 需要大量文献、文档...
从数据中获得成功!学会如何使用... 在当今数字化的世界中,社交媒体已成为企业推广产品和服务的主要渠道之一。然而࿰...
tpm2-tools源码分析之... 接前一篇文章tpm2-tools源码分析之tpm2_getrandom.c(1...
LeetCode刷题——分支限... 目录[简单]101. 对称二叉树[简单]102. 二叉树的层序遍历[简单]111. 二叉树的最小深度...
JAVASE/封装、继承、多态 博客制作不易,欢迎各位点赞👍+收藏⭐+关注前言在学习面...
【Docker】Mysql主从... 文章目录安装mysql主从复制新建主服务器容器实例3307配置文件 `my.cnf`...
关于glibc的若干问题总结 今天在学习C的库函数memchr时,想看看其实现的源码,所以去网上下载了...
C++初阶——前言 目录 1. 什么是C++ 2. C++的发展史 3. C+&...
4496. 吃水果 Powered by:NEFU AB-IN Link 文章目录4496. 吃水果题意思路代码 449...
Unity3D网络游戏0.4 状态检测 Poll  不使用异步多线程技术,同步程序如何改善C/S架构呢?...
线性动态规划问题 文章目录1. 三角形中最小路径之和2. 最长递增子序列3. 最长公共子序列 1. 三角形中最小路径之...
万字长文带你吃透Spring是... 在Spring框架中,处理循环依赖一直是一个备受关注的话题。这是因为Spring源代码...
解决电脑com口被占用与修改C... 1 问题原因 1、由于反复试装不同版本的蓝牙驱动,造成COM5~COM1...
MATLAB 常用函数 文章目录1 优先级2 通用命令3 标点4 数据类型4.1 整数类型4.2 浮点数类型5 函数5.1 ...