.
【相关文章:如何实现流媒体现场直播?】
摘要:xscale是一款具有高性能、低功耗特性的arm兼容嵌入式微处理器架构。xscale引入了多种硬件特性提高其处理能力,但也给应用程序的优化带来了困难。本文介绍xscale体系结构的特点,从开发工具选择、系统设计与编程开发等多个角度讨论对xscale应用程序进行优化的策略与技术。关键词:xscale 编译优化 优化策略arm 【扩展阅读:如何实现流媒体现场直播? ——基于M】
引言 【扩展信息:windows操作系统故障修复控制台的使】
作者:深圳冠日通信科技有限公司 张杰明
xscale体系结构是采用intel pentium技术实现的arm兼容的嵌入式微处理器架构,并对arm体系结构进行了增强,具有业界领先的高性能与低功耗特性被广泛应用于消费电子、无线通信、多媒体与网络交换等嵌入式应用领域。xscale引入了一系列高性能微处理器的设计技术,总体性能显著地超出同主频的arm微处理器。然而,由于受功耗、成本与体积等因素的制约,嵌入式微处理器的处理能力与桌面系统相比仍存在较大差距。通常需要对嵌入式应用程序进行性能优化,以满足嵌入式应用的性能需求。 业界对嵌入式系统的性能优化进行了很多研究与实践。文献为xscale优化编译器的设计提供了多种优化技术,也可用于一些应用程序的手工优化;文献从应用程序编程的角度讨论了arm嵌入式系统软件设计优化技术;文献讨论了提高c/c++嵌入式应用程序性能的一些技巧,其中多数技术可以由优化编译器中实现。 本文在总结xscale优化编译器设计与xscale嵌入式系统设计开发工作的基础上,从系统设计、开发工具选择、编译优化与编程开发等角度讨论与提出了xscale应用程序的优化策略与技术。 1 xscale体系结构 xscale微架构引入了pentium处理器工艺与系统结构技术,实现了pentium微处理器体系结构的一系列高性能技术,达到了高性能、低功耗与小体积等嵌入式系统要求的特性。 (1)超流水线 xscale的超流水线(superpipeline)技术,如图1所示,由整数处理(integer)、乘加(mac)与存储(memory)3条流水线组成。3条流水线的长度是6到9段,前4到5段共享,后面分支部分并行工作可有效提高处理器性能。 (2)高主频 采用pentium工艺技术,xscale主频可以超出普通arm微处理器主频数倍,在保持较低能量消耗的前提下,高达600mhz以上。如pxa27x的主频可高达724mhz。 (3)存储体系 xscale实现了一个高效的存储器体系结构,为其超流水线的高效运行提供数据资源。xscale存储体系功能主要包括32kb d-cache、32kb i-cache、2kb mini dcache、fill buffers、ending buffers以及4.8gb/s带宽的存储总线,使处理器可以高效访问存储器。 (4)分支预测 xscale实现了基于统计分析的分支预测功能部件,减少由于分支转移冲刷指令流水线的次数,也有效地提高了处理器的性能。 (3)指令集体系结构 针对arm数据处理能力的不足,xscale对arm的乘加逻辑进行了增强,增加了8条dsp指令。xscale处理器还可集成flash闪存与无线mmx逻辑功能。... 下一页