原因如下
并行处理、流水线、多核处理器。这些都允许一次完成多件事情,而不是连续进行。即使步骤预计有两个分支的逻辑处理下一个步骤,在情况下,甚至在最终决定选择哪个分支之前。
将并行处理卸载到GPU。
更宽的x2数据I/O和内存传输总线可以在相同的时钟速率下传输两倍的数据,x4或x8宽度甚至更好。
大型多级高速缓存存储器加快了从高速缓存访问外部存储器的速度,而不是去寻找访问速度较慢的主RAM。
更紧密的集成减少了信号传播的时间,因此可以使用更高的时钟。