casio9750 cpu 关于除法的计算问题
就是我在写3d引擎的时候要在内层循环里计算一系列加减乘除,我希望能快一点。就是有一个原理:x/y=exp(ln(x)-lx(y))。
而exp,ln都是单变量函数,既然有40kb的空间那么完全可以用查表法搞定。
但是我想知道casio 9750gii的cpu的具体知识,即,下面哪个运算得快:
t=x/y;
还是
t=exptable-lntable];
不知道它汇编有哪些指令,每个指令又耗费多少时钟周期?
我查了一下,网上说有些单片机没有乘除法模块,只能加减处理
再说几句,那么它算sin又是怎么算的?用泰勒级数?还是查表再插值? 1# GWHBOB
查到的资料
SH3系列是低功耗型SH处理器,高性能RISC结构,在时钟133 MHz时,性能可以达到173 MIPS。在2.25 V工作时,功耗为400 mW。SH3的SH7709,其消耗功率每瓦运行的指令数达到315 MIPS,能源利用效率很高。它内部集成了32位乘法器、4路8 KB CHACHE、存储器管理单元MMU、一些通用内部控制模块和外部接口模块。
日立单片机有各种各样的系列,其中4位的H400系列主要用于低档家电;8位的H8/300L、H8/300主要用于中高档家电,如录像机、无绳电话以及计算机键盘、汽车刹车控制;而16位的H8/300H、H8S/2000、H8/500等主要用于工程控制、蜂窝电话、CD驱动器、打印机等。本文仅对高档32位的SH系列作一些分析。
SH系列是32位高档的、RISC型单片机系列,到现在为止,已经推出了6种类型的单片机系列:基本型的SH1,改进型的SH2,低功耗的SH3,增强型的SH4,以及和DSP结合的SH2-DSP和SH3-DSP。
SH系列的CPU采用RISC结构,也就是采用硬连线的控制器,以及简化的指令系统,在流水线技术的支持下,减少执行指令的平均周期数,以提高系统的整体性能。SH系列的CPU指令格式是固定的,只一个字长,绝大多数指令是单周期完成的,即使是复杂的乘加指令也仅需2个时钟周期。为了克服内存访问的瓶颈,SH的CPU简化寻址方式,采用Load/Store(装载/存储)结构,并且在片内设置高速缓存Cache,以减少访问内存的时间。
SH系列的CPU内部有16个32位通用寄存器,用于数据处理、地址计算、堆栈指针;3个32位控制寄存器,即状态寄存器SR、全局寄存器GBR、向量基址寄存器VBR,分别用于处理器状态的控制和片内功能电路及程序的寻址;4个32位系统寄存器,即乘加寄存器MAC(用于乘法后累加的指令MAC,存放运算结果)、过程寄存器PR(存放断点地址,以便返回)和程序计数器PC。
1、SH1片内有16位硬件乘法器,并有4~8KB的RAM、16~64KB的ROM,还有DRAM接口与片外的DRAM相连。在时钟20MHz时,其性能可达26MIPS。
2、SH2在SH1的基础上性能有所改进,片内的ROM、RAM移到了片外,而增加了高速缓存Cache,以提高其性能,乘法器、除法器为32位,还增加了用户断点控制器UBC。用户利用UBC可以编程设置地址或数据断点进行调试,在开发时把它作为简单的调试工具。它的性能可达到52MIPS。
3、SH3系列是低功耗、高性能的RISC结构,在时钟133MHz时,性能可以达到173MIPS。在2.25V工作时,功耗仅为400mW。SH3的SH7709,其消耗功率每瓦运行的指令数达到315MIPS,能源利用效率很高。图2是SH3的结构框图。它比SH2增加了存储管理部件MMU,这种以前高性能计算机中才具备的存储管理部件,有效地提高了整个系统的性能。
4、SH4是增强型的单片机系统,它的功能更多、更强,在时钟167MHz时,性能达到300MIPS,而能源利用率更是达到每瓦1000MIPS,在世界上是最高效的一种单片机。
5、SH-DSP是单片机发展的新一代的产品,它综合了RISC结构处理器和DSP的优点,形成了高性能、低功耗、便携式的新产品,以适应机器人、系统控制、图形图像、声音、通信等新的更高性能的需要。例如它的乘加指令执行仅需1个时钟周期,大大方便了它在信号处理中的应用。
据报道,1999年底,SH系列累计生产达1.18亿片。SH系列投入市场后,用量最多的是工业,占总量的36%,第二位是办公自动化,占总量的26%;第三位是消费领域;再其次的是通信领域。此外,汽车导航、定位、控制系统,也是SH系列不小的一个市场。在美国,SH系列占有很大的市场份额。
图3是一个利用SH3-DSP的芯片SH7727构成PDA的框图,SH7727通过它的接口电路和ROM、RAM、键盘、液晶显示器等相连,就构成了一个小巧的PDA系统。
看看这个
http://www.doc88.com/p-19330714206.html 个人认为显然指数对数三角函数都是taylor级数算的,所以显然直接除快(口胡可能 手机抽风发了2楼。。已自炸 3# rphero
牺牲精度用列表法 那么lz你可以写个测试性的程序重复计算几千几万次的然后取平均看哪个快啊 SuperH_RISC_Engine_Family_C_C++_编译器封装应用笔记.pdf
在百度上搜索一下,这本电子书应该有些用处,太大了,10多兆不好上传
页:
[1]