• Streamline中基于统计的性能分析功能介绍

    章政
    章政
    原文参考 ARM性能分析器(Streamline) 7.0版开始支持基于SPE(统计性能分析扩展)的性能分析。SPE是Armv8.2-A架构中的一个可选扩展特性,它可以以很低的代价对处理器的流水线进行采样。Streamline可以从Arm Development Studio和Arm Mobile Stuido获取。 为什么需要SPE? Streamline前序版本只能通过硬件计数器和软中断中采样PC信息获取CPU的信息…
    • January 28, 2020
  • 让数值算法在Arm edge端跑的更快

    章政
    章政
    CMSIS DSP 库作为高度优化的嵌入式系统数字信号计算库一直以来深受广大开发者所喜爱,随着人工智能(Artificial Intelligence )逐步向Edge端扩展,Edge端的数字计算负载也越来越大,为了缓解计算的压力,各种框架也在Edge端采用CMSIS DSP库进行优化加速。科学计算环境和嵌入式开发环境有很大的区别,比如科学计算往往采用Python,SCIPy,Matlab,而这些环境一般是无法在低功耗嵌入式环境…
    • November 13, 2019
  • 使用Arm Mobile Studio加速Mali GPU分析

    章政
    章政
    Streamline性能分析器是一个基于采样的分析器,可以提供有关设备中存在的Arm CPU和Mali GPU的详细性能信息。最新版本的Streamline包含一组预定义模板,可用于方便选择要使用的数据源,并控制它们的显示方式。最新版本的Streamline包含在  Arm Mobile Studio  2019.0和  Arm Development Studio  2019.0中,它包含对Mali
    • May 31, 2019
  • 软件:加速器致胜的秘密

    章政
    章政
    随着arm生态系统的发展壮大,各种各样的应用场景层出不穷。为了更好地在特定场景下得到更好的性能,能耗比等指标,针对特定应用场景的加速器市场也在蓬勃发展,近年来火热的人工智能加速器(Artificial Intelligence Accelerator)就是一个典型例子。 一个高效的加速器,需要精心设计的硬件以及与之搭配的软件,两者缺一不可,否则用户体验会大打折扣,这也是为什么我们常常看到某些指标非常惊艳的加速器…
    • February 18, 2019
  • ARM编译器6.11的新功能

    章政
    章政
    在2018年10月底发布的arm Compiler 6.11实现了一个新的里程碑。 arm Compiler 6.11的主要亮点是: 在Cortex-M33上获得最佳CoreMark分数:3.96 CoreMarks / MHz。 支持最新的arm架构扩展。 在一些重要嵌入式工作负载上的性能改进。 增加对C ++ 14的支持。 arm新架构的早期支持 arm Compiler一直处于支持新架构和新内核的前沿…
    • January 21, 2019
  • 使用Streamline分析RTOS系统性能

    章政
    章政
    本文翻译自Analyzing the performance of RTOS-based systems using Streamline ============================================================= Streamline是DS-5中的性能分析工具, Streamline可以用来分析裸机系统,RTOS,Linux,Android和Tizen系统的性能…
    • July 31, 2018
  • 在持续集成系统中使用Arm Forge

    章政
    章政
    本文翻译自Continuous Integration with Arm Forge 为了提高软件,特别是有多人参与的大型软件,的整合性和质量,持续集成(CI)在软件工程中广泛使用。随着代码的增多,优化的深入,高性能计算(HPC)应用也可以通过Jenkins之类的的CI框架来确保软件符合精度和性能的需求。 CI工具其实就是管理项目的在一堆代码和依赖资源上进行并行构建,测试的机器人。他们可以和版本控制…
    • July 11, 2018
  • arm新运行时软件系统加速Cortex-M设备上功能安全应用开发

    章政
    章政
    这是一篇关于Keil RTX5在汽车安全及工业安全上进展的译文,原文来自大名鼎鼎的Mr. Keil ============= 我们非常高兴发布arm为安全关键系统相关应用高度优化的运行时软件组件,它可以运行在汽车,工业和医疗市场上广受好评的arm芯片上。新的功能安全运行时软件组件包含一个经过认证的实时操作系统(RTOS),Keil RTX5,手工优化的C库和大量文档帮助客户产品通过安全认证。结合…
    • April 13, 2018
  • CMSIS-NN尝鲜记

    章政
    章政
    随着物联网的流行,节点的低功耗,实时性智能需求也在不断增多。神经网络(Neural Network)作为一种热门的人工智能技术方向,网上已经非常丰富的介绍文档,我就不再赘述。传统的神经网络需要大量的计算资源去实现,相对于学习过程来说,推理所需要的资源相对较少,但仍然十分巨大。如何在性能相对较弱的微处理器上实现神经网络的快速推理过程?这需要对现有的神经网络模型进行大量的优化,CMSIS-NN就是在这个方向上的一个非常好的尝试…
    • February 6, 2018
  • GEM5 workshop on ASPLOS 2017

    章政
    章政

    ASPLOS 2017 website

    Date: Afternoon of 9th April, 2017

    Address: Westin Xi'an, 66 Ci En Road XiAn(西安市雁塔区慈恩路66号)

    Agenda

    Time
    Who
    What
    15min  

    Introduction

    • Overview / Agenda
    • What is gem5…
    • February 13, 2017
  • [翻译]使用Streamline指导缓存优化

    章政
    章政
    原文在这里简介缓存利用率低下对于性能负面影响很大,提高缓存利用率势在必行。不幸的是很难发现哪里缓存利用率低下,而且需要大量的开发时间。在本指南里,我将演示用Streamline指引缓存优化,发现利用率低下的地方。本文基于Juno,但是我使用的这些counter应该在所有Cortex-A系列处理器上都有,所以这也很容易复现。即使你没有这样的平台去测试,我在文中使用的方法也可以启示你用Streamline去指导缓存优化…
    • August 31, 2015
  • 玩转OP-TEE

    章政
    章政
    随着智能手机逐渐融入生活,手机上承载的业务也逐渐由开始的通讯娱乐扩展到人们的衣食住行,说到这些自然离不开钱。当手机厂商谈到钱的时候,用户第一个想到的问题就是安全,特别是在今天这个恶意病毒软件横行当道的年代。随着各种安全门,存款被盗事件在手机上爆发,国内的各大手机厂商,支付公司,出版商,银行也逐渐开始意识到手机安全问题,现在都开始在积极寻找手机安全解决方案。ARM在十几年前意识到安全问题对于移动产品的重要性…
    • August 26, 2015
  • ARM编译器6和其他编译器错误,警告,修复的比较

    章政
    章政
    ARM编译器6诞生有一段时间了,我们的编译器专家Stefano写了一篇ARM编译器6中相对于其他编译器的优点,原文在这里,下面是翻译Compiler的主要功能是将源代码转换为机器码,但在项目开发过程中,我们难免会遇到一些错误。一个好的编译器的一个重要指标就是产生清晰和准确的错误和警告信息。清晰的错误消息可以帮助我们迅速发现代码中的错误,而警告信息是编译器在代码中发现的潜在的问题,这些值得我们的调查…
    • March 23, 2015
  • 在 Mali GPU 上利用 DS-5 Streamline 优化复杂的 OpenCL™ 应用程序

    章政
    章政
    这是一篇英文翻译,原文见这里异构应用程序,也即同时在 CPU 和 GPU 等多个处理器上运行代码的应用程序,具有天生难以优化的内在特性。您不仅需要考虑代码的不同部分在不同处理器上执行的情况如何,还需要思考它们之间的交互效率。是否有哪个处理器在不必要地等待其他处理器?是否不必要地复制了大量的存储器数据?对 GPU 的利用程度是怎样?是否有瓶颈?了解所有这些的复杂程度让胆小者望而却步。显然,至少在部分程度上…
    • March 12, 2015
  • 使用DS-5从FVP中收集Trace数据

    章政
    章政
    此文为翻译,原文在这里DS-5 5.20中添加了一个新功能,从FVP(Fixed Virtual Platform)中获取指令Trace,这可以让你获取在模型上运行程序的Trace。DS-5中包含ARMv8(旗舰版) FVP,如果你想试试,可以下载DS-5旗舰版的30试用版。Trace有什么用?Trace是用来收集软件在处理器上执行的所有信息。在实际硬件上,Trace是对系统没有影响的,这意味着它不会让CPU变慢…
    • December 11, 2014
  • 利用FastModel加速芯片验证

    章政
    章政
    随着SOC核心数的增多,如何去验证复杂的SOC变的越来越困难,SOC验证所花费的时间也越来越多,如何去加速SOC的验证流程,缩短验证周期,加速产品上市速度,Cadence利用ARM的FastModel结合Emulator给出了一套混合的加速解决方案
    • November 27, 2014
  • Analyzing Cortex-A53 octa-core on Linux

    章政
    章政
    A blog for fast model based carbon solution https://www.semiwiki.com/forum/content/4039-analyzing-cortex-a53-octa-core-linux.html
    • November 20, 2014
  • [原创]DS-5 5.19连接Fast Model的新方法

    章政
    章政
    在我的前一篇Blog使用DS-5加速Fast Model开发中,我介绍了如何通过扫描的方式用DS-5手动连接Fast Model进行调试,在新的版本DS-5 5.19中导入Fast Model配置的方法更简单,下面给大家进行介绍。首先我们启动一个将要连接的arm v8模型打开DS-5,建立一个空工程来存储所有Fast Model配置的工程文件,这里取名为FastModelConfiguration…
    • August 5, 2014
  • ARM 64的开发板Juno来啦!

    章政
    章政
    最新的ARM 64的开发平台Juno已经发布,该平台支持Android(AOSP)http://releases.linaro.org/latest/android/juno-lskhttp://releases.linaro.org/latest/openembedded/juno-lsk同时该平台完整地支持了Trust Firmware的开发ARM-software/arm-trusted-firmware…
    • July 7, 2014
  • 在ARMv8模型中玩转Linux.pdf

    章政
    章政
    如何使用ARMV8模型去启动linux,以及调试里面的应用程序
    • June 10, 2014
  • 使用DS-5加速Fast Model开发

    章政
    章政
    在上篇文章中介绍如何利用Fast Model搭建自己的CPU后,很多朋友进行了尝试,生成了自己的CPU,并进行了一些简单的代码调试,但是大家很快发现,Model Debugger调试能力有限。今天就来说说如何利用功能强大的DS-5对自己搭建出来的Model进行开发调试,调试对象可以是操作系统,驱动,应用程序,凡是可以在CPU上执行的代码都可以在Model上用DS-5进行调试。特别是对于一些安全/虚拟化相关的应用和OS…
    • May 28, 2014
>