知名百科  > 所属分类  >  商业百科    科技百科    百科词条   

中央处理器

中央处理器,英文名:Central Processing Unit(简称:CPU)它是超大规模集成电路,是一台计算机的运算核心和控制核心。主要包括运算器(ALU,算术 和逻辑 单位)和控制器(铜,控制 单元)两大部件。此外,它还包括几个寄存器和高速缓冲存储器以及实现它们之间关系的数据、控制和状态总线。它与内存和输入相关联/输出设备统称为电子计算机的三大核心部件。它的主要功能是解释计算机指令和处理计算机软件中的数据。电脑的性能很大程度上是由CPU的性能决定的,而CPU的性能主要体现在它运行程序的速度上。

中央处理器中央处理器

目录

简介定义 编辑本段

中央处理器(CPU),是电子计算机的主要设备之一,也是计算机中的核心配件。它的主要功能是解释计算机指令和处理计算机软件中的数据。CPU是计算机中的核心部件,负责读取解码和执行指令。中央处理器主要包括两部分,即控制器、算术单元,它还包括高速缓冲存储器和实现它们之间关系的数据、控制的总线。电子计算机的三个核心部件是中央处理器、内部存储器、输入/输出设备。中央处理器的功能主要是处理指令、执行操作、控制时间、处理数据。

在计算机体系结构中,CPU 是计算机的所有硬件资源(如存储器、输入输出单元)进行控制调配、一种执行一般操作的核心硬件部件。CPU 是计算机的计算和控制核心。计算机系统中所有软件层的操作最终都会通过指令集映射到CPU的操作上。

物理结构 编辑本段

cpu

CPU 包括一个算术逻辑单元、寄存器单元和控制单元等

逻辑部件

英文逻辑组件;运算逻辑部件。您可以执行定点或浮点算术运算、还可以执行移位操作和逻辑操作地址操作和转换。

寄存器

包括寄存器的寄存器单元、特殊寄存器和控制寄存器。通用寄存器可分为定点数和浮点数,用于存储指令执行过程中临时存储的寄存器操作数(或最终)的操作结果。通用寄存器是中央处理器的重要组成部分之一。

控制部件

英文控制单元;控制单元主要负责解码指令,并为每个指令要执行的每个操作发出控制信号。

其结构有两种:一种是以微存储器为核心的微程序控制方式;一种是基于逻辑硬接线结构的控制模式。

微存储器保存微码,每个微码对应一个最基本的微操作,也称为微指令;每条指令由不同的微码序列组成,这些微码序列构成一个微程序。指令解码后,中央处理器发出一定时序的控制信号,以一个微周期为节拍,按照给定的顺序执行这些微码确定的若干微操作,从而完成一条指令的执行。简单指令是由(3~5)一个微操作,复杂的指令是由几十个甚至上百个微操作组成的。

主要功能 编辑本段

处理指令

英文处理 指令;这是指控制程序中指令的执行顺序。程序中的指令之间有严格的顺序,必须严格按照程序中规定的顺序执行,以保证计算机系统的正确性。

执行操作

英文执行 和 操作;指令的功能通常由计算机中的组件执行的一系列操作来实现。根据指令的功能,CPU会产生相应的操作控制信号并发送给相应的部件,从而控制这些部件按照指令的要求动作。

控制时间

英文控件 时间;时间控制是各种操作的计时。在一条指令的执行过程中,应该严格控制在什么时间做什么。只有这样,计算机才能有条不紊地工作。

处理数据

即对数据进行算术和逻辑运算,或其他信息处理。

它的主要功能是解释计算机指令,处理计算机软件中的数据并执行指令。在微型计算机中,又称微处理器,计算机的所有操作都由CPU控制,CPU的性能指标直接决定了微型计算机系统的性能指标。CPU有以下四个基本功能:数据通信,资源共享,分布式处理,提供系统可靠性。操作原理基本可以分为四个阶段:提取(Fetch)解码(Decode)执行(Execute)和写回(写回)

工作过程 编辑本段

CPU从内存或缓存中获取指令,将它们放入指令寄存器,并对指令进行解码。它将一条指令分解成一系列微操作,然后发出各种控制命令执行微操作系列,从而完成一条指令的执行。指令是计算机指定运算类型和操作数的基本命令。指令由一个或多个字节组成,包括操作码字段、与操作数地址有关的一个或多个字段,以及一些表示机器状态的状态字和特征代码。有些指令还直接包含操作数本身。

提取

第一阶段是从内存或高速缓存中获取和检索指令(是一个数值或一系列数值)由程序计数器(程序 计数器)指定内存的位置。程序计数器保存用于识别程序位置的数值。换句话说,程序计数器记录了CPU在程序中的踪迹。

解码

解码线路

解码线路

CPU根据从存储器中提取的指令确定其执行行为。在解码阶段,指令被分解成有意义的片段。根据CPU的指令集体系结构(ISA)定义如何将值解释为指令。部分指令值是操作码(Opcode),指示要执行的操作。其他值通常为指令提供必要的信息,如加法(添加)运算的运算目标。

执行

在提取和解码阶段之后,它立即进入执行阶段。在这个阶段,它被连接到能够执行所需操作的各种CPU组件。

例如,需要加法运算和算术逻辑单元(算术逻辑单元)将连接到一组输入和一组输出。输入提供要相加的值,输出将包含求和的结果。ALU包含电路系统,使得输出端很容易完成简单的普通运算和逻辑运算(例如加法和位运算)如果加法运算产生的结果太大,CPU无法处理,则可能会在标志寄存器中设置运算溢出(算术 溢出)标志。

写回

在最后一个阶段,写回,执行阶段的结果只是以某种格式写回。运算结果通常被写入CPU的内部寄存器,以便后续指令快速访问。在其他情况下,可以将运算结果写入速度较慢但容量较大成本较低的主存储器。一些类型的指令操作程序计数器而不直接产生结果。这些一般称作“跳转”Jumps)并在程序中引入循环行为、条件性执行(透过条件跳转)和函式。许多指令会改变标志寄存器的状态位。这些标志可以用来影响程序行为,因为它们经常显示各种操作结果。例如,以一个“比较”该指令判断两个值的大小,并根据比较结果在标志寄存器上设置一个值。该标志可用于通过后续跳转指令确定程序趋势。执行完指令写回结果后,程序计数器值会增加,重复整个过程,在下一个指令周期正常取下一条顺序指令。

性能参数 编辑本段

电脑的性能很大程度上是由CPU的性能决定的,而CPU的性能主要体现在它运行程序的速度上。影响运行速度的性能指标包括CPU的工作频率、Cache容量、指令系统和逻辑结构等参数。

主频

主频也叫时钟频率,单位是兆赫(MHz)或千兆赫(GHz)一个,表示CPU的操作、处理数据的速度。一般来说,主频越高,CPU处理数据的速度越快。

CPU主频=外部频率×倍频系数。主频和实际运行速度有一定的关系,但不是简单的线性关系。所以CPU的主频和CPU的实际运算能力没有直接关系,主频表示的是CPU中数字脉冲信号振荡的速度。你也可以在英特尔 的处理器产品:1GHzItanium芯片的行为几乎可以像2.66GHz至强(Xeon)Opteron一样快,还是1.5GHzItanium2大约跟4gz至强/Opteron也一样快。CPU的运行速度取决于CPU的流水线、总线和其他性能指标。

外频

外部频率是CPU的参考频率,单位是MHz。CPU的外接频率决定了整个主板的运行速度。一般来说,在台式机中,超频就是超级CPU的外频(当然,一般情况下,CPU的倍频是锁定的)我相信这个很好理解。但是对于服务器CPU来说,超频是绝对不允许的。前面说过,CPU决定主板的运行速度,两者是同步运行的如果服务器CPU超频,改变外部频率,就会出现异步运行(桌面很多主板都支持异步操作)这会造成整个服务器系统的不稳定。

在大多数计算机系统中,外部频率并不与主板的前端总线同步,而是与前端总线同步(FSB)频率又容易混淆。

总线频率

AMD 羿龙II X4 955黑盒

AMD 骁龙II X4 955黑匣子

前端总线(FSB)是连接CPU和北桥芯片的总线。前端总线(FSB)频率(即总线频率)它直接影响CPU和内存直接数据交换的速度。有一个公式可以计算,就是数据带宽=(总线频率×数据位宽度)8数据传输的最大带宽取决于同时传输的所有数据的宽度和传输频率。比如支持64位的Xeon Nocona,前端总线800MHz根据公式,其最大数据传输带宽为6.4GB/秒。

外频与前端总线(FSB)频率的区别:前端总线的速度是指数据传输的速度,外部频率是指CPU和主板同步运行的速度。也就是说,100MHz的外部频率是指每秒振荡1亿次的数字脉冲信号;100MHz前端总线是指CPU每秒可接受的数据传输能力为100MHz×64bit÷8bit/字节=800MB/s。

倍频系数 编辑本段

倍频系数是指CPU主频与外部频率的相对比例关系。在外部频率相同的情况下,倍频越高,CPU频率越高。但其实在外频不变的前提下,高频CPU本身意义不大。这是因为CPU和系统之间的数据传输速度是有限的,盲目追求高频率,得到高倍频的CPU会明显出现“瓶颈”效应-CPU从系统获取数据的极限速度无法满足CPU的运算速度。一般来说,除了英特尔 s CPU,倍频被锁定少数CPU如奔腾双核E6500K带Intel Core 2 core和一些extreme版本不锁频,而AMD没有 之前不要上锁AMD推出了CPU的黑盒版本(即用户可以在不锁定倍频版本的情况下自由调节倍频,调节倍频的超频模式比调节外频要稳定得多)

缓存

缓存大小也是CPU的重要指标之一,缓存的结构和大小对CPU的速度影响很大CPU中的缓存运行频率非常高,通常与处理器同频,工作效率远大于系统内存 和硬盘。在实际工作中,CPU经常需要重复读取同一个数据块,缓存容量的增加可以大大提高CPU内部读取数据的命中率,而无需在内存或硬盘中寻找,从而提高系统性能。但是由于CPU芯片面积和成本的因素,缓存很小。

L1Cache(一级缓存)它是CPU的第一层缓存,分为数据缓存和指令缓存。内置L1缓存的容量和结构对CPU的性能有很大影响然而,高速缓冲存储器都是由静态RAM构成的,并且结构复杂在CPU芯片面积不能太大的情况下,L1级缓存的容量不能做得太大。通常,服务器CPU的L1缓存容量通常为32-256KB。

L2Cache(二级缓存)它是CPU的第二层缓存,分为内部和外部芯片。内部芯片二级缓存运行速度与主频相同,而外部二级缓存只有主频的一半。L2缓存容量也会影响CPU的性能原则是CPU越大越好以前国内最大的CPU容量是512KB,在笔记本电脑上也能达到2M,而服务器和工作站使用的CPU L2缓存更高,达到8M以上。

L3Cache(三级缓存),分为两种,早期是外置,内存延迟,同时提高处理器在计算大量数据时的性能。降低内存延迟,提高大数据的计算能力,对游戏很有帮助。但是,通过在服务器领域添加L3缓存,性能仍有显著提高。例如,具有较大L3缓存的配置将更有效地使用物理内存,因此它比较慢的磁盘I更有效/o子系统可以处理更多的数据请求。具有更大L3缓存的处理器提供了更高效的文件系统缓存行为以及更短的消息和处理器队列长度。

其实最早的L3缓存应用在AMD发布的K6上-在III处理器上,当时的L3缓存受制造工艺限制,没有集成到芯片中,而是集成在主板上。L3缓存,只能和系统总线频率同步,和主存区别不大。后来,英特尔 面向服务器市场的安腾处理器。然后是P4EE和至强MP。英特尔还计划在未来推出9MBL3缓存的Itanium2处理器和24MBL3缓存的双核Itanium2处理器。

但是L3缓存对于提高处理器的性能并不是很重要比如配备1MBL3缓存的XeonMP处理器仍然不是骁龙的对手,这说明前端总线的增加会比缓存的增加带来更有效的性能提升。

制造工艺 编辑本段

CPU制造工艺的微米是指IC中电路之间的距离。制造技术的趋势是向更高密度发展。IC电路设计的密度越高,就意味着在同样尺寸和面积的IC中,你可以拥有更高的密度、功能更复杂的电路设计。主180nm、130nm、90nm、65nm、45纳米、22纳米,英特尔已经在2010年发布了采用32纳米制造工艺的酷睿i3/酷睿i5/酷睿i7系列,并于2012年4月发布了22纳米酷睿i3/i5/i7系列。此外,我们还计划推出14纳米产品(据新闻报道,14纳米将于2013年下半年在笔记本电脑处理器中推出。而AMD则表示、自己的产品会直接跳过32nm工艺(2010年第三季度生产了一些32纳米产品、如Orochi、Llano)在2011年中期和早期发布28纳米产品(APU)TrinityAPU于2012年10月2日正式发布,工艺还是32nm,28nm工艺代号Kaveri一再推迟。2013年推出的28纳米Apu只有用于平板电脑和笔记本的低端处理器,代号为Kabini。而且鲜为人知,市场反应正常。据可靠消息称,2014年上半年可能会发布一款28nm桌面Apu,其gpu将采用GCN架构,与高端a卡相同。

指令集 编辑本段

CPU依赖于来自计算和控制系统的指令,每个CPU都设计有一系列与其硬件电路相匹配的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率最有效的工具之一。

从目前的主流架构来看,指令集可以分为两部分复杂指令集和简化指令集(有四种类型的指令集)以及来自特定应用,例如英特尔MMX(Multi Media Extended,是AMD 的猜测,英特尔没有解释词源)SSE、SSE2(流动-单个 指令多个 数据-分机 2)SSE3、SSE4系列和AMD s 3DNow!等等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图像互联网等处理能力。

CPU的扩展指令集通常被称为”CPU的指令集”SSE3指令集也是最小的指令集以前,MMX包含57个命令,SSE包含50个命令,SSE2包含144个命令,SSE3包含13个命令。

从586CPU开始,CPU的工作电压分为核心电压和I/o电压,通常CPU的核心电压小于等于I/O电压。其中,内核电压的大小取决于CPU的生产工艺一般生产工艺越小,内核的工作电压越低;I/o电压一般在1.6~5V。低电压可以解决功耗过大和发热量过大的问题。

CISC

CISC指令集,也称为复杂指令集,在英语中被称为CISC(复杂 指令集 计算的缩写)在CISC微处理器中,程序的指令是顺序串行执行的,每个指令中的操作也是顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分利用率不高,执行速度慢。其实就是Intel生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是新的X86-64(也称为AMD64)都属于CISC的范畴。

要知道什么是指令集,我们应该从今天开始s X86架构CPU。X86指令集是Intel 的第一个16位CPU(i8086)特别开发,世界上的 IBM1981年推出的第一台个人电脑-i8088(I8086简化版)还使用了X86指令,在计算机中加入了X87芯片,提高了浮点数据处理能力从现在开始,X86指令集和X87指令集将统称为X86指令集。

虽然随着CPU技术的不断发展,Intel已经陆续开发出了新型的i80386.I80486直到过去的PII至强、PIII至强、奔腾 3,奔腾 4系列,最后是today s Core 2系列、至强(不包括Xeon Nocona)但是,为了保证计算机能够继续运行过去开发的各种应用程序,以保护和继承丰富的软件资源,英特尔公司生产的所有CPU仍然使用X86指令集,因此其CPU仍然属于X86系列。因为Intel X86系列及其兼容的CPU(如amd   thlon   MP、他们都使用X86指令集,所以今天 形成了庞大的X86系列和兼容的CPU阵容。X86CPU主要包括intel 的服务器CPU和AMD 的服务器CPU。

RISC

中央处理器

中央处理器

RISC是英文“简化 指令 集合 计算 ” 的缩写quot中文和英文quot意味着“精简指令集”他是由约翰 科克(约翰·科克)指出约翰 科克 他在IBM的第一个项目是研究拉伸计算机(世界上第一个“超级计算机”型号)他很快成为了大型机专家。1974年,Cocke和他的研究小组开始尝试开发一种每秒能处理300个电话的电话交换网络。为了实现这个目标,他必须找到一种方法来提高现有交换系统架构的交换速率。1975年约翰 科克研究了IBM370 CISC(复杂 指令 集 计算,复杂指令集计算)系统,对CISC的测试表明,各种指令出现的频率差别很大,最常用的是一些简单的指令,它们只占指令总数的20%,但是程序中的频率是80%

复杂的指令系统必然增加微处理器的复杂度,导致开发时间长,成本高。而且复杂的指令需要复杂的运算,必然会拖慢计算机的速度。基于以上原因,RISC CPU于80年代诞生与CISC CPU相比,RISC CPU不仅简化了指令系统,而且采用了一种称为“超标量和超级流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它不同于传统的CISC(复杂指令集)相对。相比之下,RISC比复杂指令集有统一的指令格式更少的类型和更少的寻址方式。当然处理速度要高很多。这种指令系统的CPU广泛应用于中高端服务器,尤其是高端服务器,都采用RISC指令系统CPU。RISC指令系统更适合高端服务器操作系统Windows 7,Linux类似于Windows OS(UNIX)的操作系统。RISC CPU在软件和硬件上与Intel和AMD CPU不兼容。

在高端服务器中,使用RISC指令的CPU主要包括以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、阿尔法处理器。

IA-64

EPIC(显式并行计算机,精确并行指令计算机)关于它是否是RISC和CISC系统的继承者,一直有很多争论单说EPIC系统,更像是英特尔处理器走向RISC系统的重要一步。理论上,在相同的主机配置下,EPIC系统设计的CPU比基于Unix的应用软件要好得多。

英特尔 采用EPIC技术的服务器CPU是安腾的安腾(开发代码是Merced)它是86位处理器和IA-64系列的第一款。微软还开发了一个代号为Win64的操作系统,由软件支持。英特尔采用X86指令集后,转向更先进的86-Bit微处理器,Intel这么做是因为他们想摆脱庞大的x86架构,引入精力充沛功能强大的指令集,所以采用了带有EPIC指令集的IA-64(x92)架构便诞生了。IA-(64 )x92)在很多方面,它比x86有了很大的进步。它突破了传统IA32架构在数据处理能力系统稳定性等方面的诸多限制、安全性、可用性、相当的合理性等方面实现了突破性的提升。

IA-64微处理器最大的缺点是不兼容x86,而英特尔正在努力解决IA的问题-64处理器可以更好的运行两个朝代的软件,而且是在IA-64处理器上(Itanium、钛2 …引入了x86-to-IA-64解码器,使x86指令可以翻译成IA-64指令。这个解码器不是最高效的解码器,也不是运行x86代码的最佳方式(最好的办法是直接在x86处理器上运行x86代码)所以运行x86应用时,Itanium 和Itanium2的性能很差。这也成为X86-64的根本原因。

处理技术 编辑本段

在解释超级流水线和超标量之前,先了解一下流水线(管道)流水线是英特尔第一次开始在486芯片中使用。装配线就像工业生产中的装配线一样工作。在CPU中由5-六个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5条-六个步骤之后,这些电路单元会分别执行,这样一个CPU时钟周期就可以完成一条指令,从而提高CPU的运行速度。经典奔腾的每个整数流水线分为四个阶段,即指令预取、译码、执行、写回结果,浮点流水线分八个阶段。

cpu

超标量是通过建立多条流水线来同时执行多个处理器,其本质是以空间换时间。而超级管道就是通过细化流量、提高主频使一个机器周期内完成一个甚至多个操作成为可能,其本质是以时间换取空间。比如奔腾4的流水线就长达20级。管道设计的步骤(级)它越长,完成一条指令的速度就越快,因此可以适应工作频率更高的CPU。但是长流水线也带来了一些副作用,很可能高频率的CPU实际运行速度会更低,就像Intel s奔腾4,虽然它的主频可以高达1.超过4G,但计算性能远不及AMD1.2G Athlon甚至奔腾III。

CPU封装是将CPU芯片或CPU模块用特定的材料固化在里面,防止损坏的一种保护措施一般CPU只有包装好才能交付给用户。CPU的封装方式取决于CPU的安装形式和器件的一体化设计从大的分类来说,通常Socket插座安装的CPU使用的是PGA(栅格阵列)Mode封装,Slotx插槽安装的CPU都采用SEC(单边接插盒)的形式封装。还有PLGA(塑料格栅阵列)OLGA(OrganicLandGridArray)等封装技术。由于市场竞争日益激烈,CPU封装技术的发展方向主要是节约成本。

多线程

同时多线程同时多线程,简称超小型电子管。SMT通过复制处理器上的结构状态,使同一处理器上的多个线程同步执行,共享处理器的执行资源,可以最大化的实现宽发射、乱序超标量处理可以提高处理器运算部件的利用率,缓解因数据相关性或缓存缺失而导致的访存延迟。当没有多线程可用时,SMT处理器几乎与传统的宽发射超标量处理器相同。SMT最吸引人的地方在于,只需小范围改变处理器内核的设计,几乎不增加额外成本,就能显著提升性能。多线程技术可以为高速计算核心准备更多的待处理数据,减少计算核心的空闲时间。这对于桌面低端系统来说无疑是很有吸引力的。Intel从3.从06 GHz的奔腾4开始,一些处理器将支持SMT技术。

多核心

多核,也指芯片多处理器(芯片多处理器,简称金属波纹管金属波纹管)CMP是由美国斯坦福大学提出的它的想法是在大规模并行处理器中结合SMP(对称多处理器)集成到同一个芯片中,每个处理器并行执行不同的进程。多个CPU同时并行运行程序是实现超高速计算的一个重要方向,称为并行处理。与CMP相比,SMT处理器结构的灵活性更加突出。然而,当半导体工艺进入0.18微米以后,线延迟已经超过门延迟,这就要求微处理器的设计要更小,把它分成很多部分、局部性较好的基本单元结构。相比之下,CMP结构被划分为多个处理器核,每个核相对简单,有利于优化设计,因此更有发展前景。IBM 的Power4芯片和Sun s MAJC5200芯片采用CMP结构。多核处理器可以共享处理器内部的缓存,提高了缓存利用率,简化了多处理器系统设计的复杂度。但是,这并不意味着内核越多,性能越高比如16核CPU没有8核CPU快,因为核太多,无法合理分配,所以运行速度变慢。买电脑请酌情选择。2005年下半年,英特尔和AMD的新处理器也将集成到CMP结构中。全新安腾处理器的开发代号为Montecito,采用双核设计,拥有至少18MB片上缓存,采用90nm工艺制造。它的每个内核都有独立的L1L2和L3cache,包含大约10亿个晶体管。

SMP

SMP(对称多重-处理)对称多处理架构symmetric multi processing architecture的缩写,意思是在一台计算机上组装一组处理器(多CPU)CPU共享内存子系统和总线结构。在这项技术的支持下,服务器系统可以同时运行多个处理器,并共享内存和其他主机资源。像双至强,也就是所谓的双路,这是对称处理器系统中最常见的一种(至强MP可以支持四个通道,AMDOpteron可以支持一个通道-8路)还有几辆16路公共汽车。不过一般来说,SMP结构的机器扩展性很差,很难做到100个以上的处理器,一般是8到16个,但这对于大部分用户来说已经足够了。它在高性能服务器和工作站级主板架构中最为常见,例如可以支持多达256个CPU的系统的UNIX服务器。

构建SMP系统的必要条件如下:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,然后是支持SMP的应用软件。为了使SMP系统高效运行,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX和其他32位操作系统。也就是说,可以执行多任务和多线程。多任务意味着操作系统可以让不同的CPU同时完成不同的任务;多线程是指操作系统让不同的CPU并行完成同一任务。

搭建一个SMP系统,对选择的CPU有很高的要求首先,、APIC必须内置在CPU中(高级编程中断控制器)单元。英特尔多处理规范的核心是高级可编程中断控制器(高级编程中断控制器–APICs)的使用;再次,相同的产品型号,相同类型的CPU核心,完全相同的运行频率;最后,尽量保持相同的产品序列号,因为当两个生产批次的CPU作为双处理器运行时,可能会出现一个CPU过载,另一个CPU负担轻的情况,无法发挥最大性能,更严重的可能会导致死机。

NUMA技术

NUMA是一种非均匀访问分布式共享存储技术,它是由若干个独立的节点通过高速专用网络连接而成的系统,每个节点可以是单个CPU或SMP系统。在NUMA,有许多解决缓存一致性的方法通常使用硬件技术来维护缓存的一致性,这通常需要操作系统来解决NUMA访问和内存的不一致性(本地存储器和远程存储器之间访问延迟和带宽的差异)进行专门的优化来提高效率,或者采用专门的软件编程方法来提高效率。NUMA系统的例子。有三个SMP模块通过一个高速专用网络连接起来组成一个节点,每个节点可以有12个CPU。像Sequent这样的系统最多可以有64个甚至256个CPU。显然,这是SMP和NUMA技术的结合。

乱序执行

乱序执行(out-of-订单执行),指的是CPU允许多条指令不按程序规定的顺序开发,并发送到相应的电路单元进行处理的技术。这样可以提前执行的指令会根据每个电路单元的状态和每个指令是否可以提前执行的具体情况,立即发送到相应的电路单元执行在此期间,指令不会按照指定的顺序执行,然后由重排单元按照指令的顺序重新排列每个执行单元的结果。采用乱序执行技术的目的是使CPU内部电路满负荷运行,相应提高CPU运行程序的速度。

分枝技术

branch)指令操作时,需要等待结果一般无条件分支只需要按照指令的顺序执行,而条件分支则必须根据处理结果决定是否按照原来的顺序进行。

控制器

许多应用程序有更复杂的阅读模式(几乎是随机的,尤其是cachehit不可预测的时候),带宽得不到有效利用。一个典型的应用程序是业务处理软件,即使它有乱序执行(无序执行)这种CPU特性也受到内存延迟的限制。这样,CPU必须等到操作所需的数据被除数加载后才能执行指令(不管这些数据是来自CPUcache还是主存系统)目前低端系统的内存延迟在120左右-150ns,而CPU速度已经达到4GHz以上,单个内存请求可能浪费200-300个CPU周期。即使在高速缓存命中率方面(cachehitrate)达到99.9%在的情况下,CPU也可能花费50%等待内存请求的结束-例如,由于存储器延迟。

将内存控制器集成到处理器内部将使北桥芯片变得不那么重要,改变处理器访问主内存的方式,并有助于提高带宽、减少存储器延迟和提高处理器性能制造工艺:英特尔 s I5可以达到28 nm,未来的CPU制造工艺可以达到22 nm。

ICT的应用 编辑本段

CPU应用

CPU应用

在ICT的应用中,我们可以简单地把CPU的内部结构看成一个黑匣子,这很好理解。它的行为模式是,向它输入指令,经过它的内部运算和处理,就可以输出想要的结果(数据或控制信号)

产品选购 编辑本段

核数选择

如果玩游戏的话,我个人认为四核也是必须的。因为按照60%并行计算,双核加速比在1左右.6倍,而四核至少可以有2倍.2倍(它永远不会翻两番,除非你的游戏没有我不需要显卡和it 就像国际象棋一样)这样看来,只要支持四核游戏,四核还是比双核游戏有优势的。

防假指南 编辑本段

看编号

这种方法对Intel和AMD处理器也有效每个真正的盒装处理器都有一个唯一的编号产品包装盒和处理器表面的条形码都会标明这个数字,相当于手机的IMEI码如果你在购买处理器后发现这两个数字不一样,可以确定你买的产品被不法商人更换了。

看包装

不法商人利用包装偷龙转凤是惯用手法,主要在Intel 的CPU英特尔和英特尔的区别s盒装处理器和散装处理器在于三年质保,价格差几十到几百元不等。当然AMD盒装产品也是假货满满,尤其是闪龙2500和E6 3000。由于不法商人的技术水平有限,虽然假包装已经成为一个小规模的产业,但在包装盒的印刷和生产中,仍然无法达到正品包装盒的标准所以可以从包装盒的印刷入手,鉴别真假。

以AMD s包装盒为例未开封的包装盒上贴有标签如果没有标签,那一定是假货。而这个标签也是鉴别包装盒真伪的一个起点。从图中可以看到,正品标签是机器刻上去的“十”撕裂后字形的切割痕迹会被破坏失效。假盒子上也有这个贴纸,这个也有“十”雕文有删减,但请注意正版“十”锯齿形的切口中间并不相连,切口的长度和深度都非常均匀,而且假货的标签往往是造假者自己用刀片切割的如果消费者发现这一点,“十”字形上的切口长短不一,中间相连,可以肯定被篡改过。

此外,由于这种方法的鉴别非常简单,一些无良商家就在包装盒上贴上新的号码,以假乱真。识别真伪的序列号也要和印刷区分开来。正规产品的序列号条码是点阵喷码机,字迹清晰,可以清楚的看到数字是由一个个组成的“点”组成。假条码一般都是打印出来的,而且字迹模糊黏黏的,用的字体也不一样。如果你发现这个条码印刷太差,字迹模糊,你 最好不要买它。

看风扇

这种方法主要针对Intel处理器打开CPU的包装后,可以查看原厂风扇中央的防伪标签真正的英特尔盒子CPU的防伪标签是立体的,除了底部图案的变化,还会有立体“Intel”标志。而假盒子CPU,它的防伪标识只改变了底部的图案,没有“Intel”标志,而且散热片很稀疏。

发展历史 编辑本段

计算机的发展主要表现在其核心部件——微处理器的发展上每当一种新的微处理器出现,都会带动计算机系统其他组件的相应发展,比如计算机体系结构的进一步优化,内存访问能力的不断增加、访问速度的不断提高,外围设备的不断完善,新设备的不断涌现。

根据微处理器的字长和功能,其发展可分为以下几个阶段。

第1阶段

第1阶段(19713541973)现在是4位和8位低端微处理器的时代,通常称为第一代其典型产品分别是Intel4004和Intel8008微处理器以及由它们组成的MCS-4和MCS-8微机。基本特点是采用PMOS工艺,集成度低(4000个晶体管/片)系统结构和指令系统比较简单,主要使用机器语言或者简单的汇编语言,指令数量少(20多条指令)基本指令周期为20~50μs,用于简单的控制场合。

1969年,英特尔开始为日本计算机制造商Busicom的一个项目开发第一个微处理器,并为一系列可编程计算机开发了多种芯片。最后,在1971年11月15日,英特尔向全球市场推出了4004微处理器当时每个Intel 4004处理器的价格是200美元。4004 是英特尔 s的第一个微处理器,为未来系统智能功能和个人电脑的发展奠定了基础它的晶体管数量大约是2300。

第2阶段

第2阶段(19743541977)是8位中高档微处理器的时代,通常称为第二代,其典型产品是Intel8080/8085、摩托罗拉公司、Zilog公司的Z80等。它们的特点是采用了NMOS技术,集成度提高了约4倍,运算速度提高了约10~15倍(基本指令的执行时间为1 ~ 2 μ s)指令系统比较完善,有典型的计算机架构和中断、DMA等控制功能。软件方面,除了汇编语言,还有BASIC、后期出现了FORTRAN等高级语言,相应的解释器和编译器,以及操作系统。

1974年,英特尔推出了8080处理器,作为Altair个人电脑的计算核心牛郎星是《星舰奇航》电视剧中企业号飞船的目的地。当时,电脑爱好者可以花395美元购买一套Altair套件。几个月就卖出了几万套,成为历史上第一款下单后制造的机型。Intel 8080的晶体管数量大约是6千个。

第3阶段

第3阶段(19773541984)是16位微处理器时代,通常称为第三代,其典型产品是Intel s 8086/8088,摩托罗拉的M68000,Zilog的Z8000等微处理器。它的特点是HMOS技术和集成(2万~7万个晶体管/片)和运算速度(基本指令执行时间为0.5μs)比第二代高一个数量级。指令系统更加丰富、完美,使用多级中断、多种寻址方式、段式存储机构、硬件乘除部件,并配置了软件系统。这一时期著名的微机产品包括IBM 的个人电脑。1981年,IBM推出的个人电脑采用了8088CPU。然后在1982年,一台扩展的个人计算机IBM PC问世/XT,它扩展了内存并增加了硬盘驱动器。

80286(也被称为286)它是英特尔 它是第一个可以执行旧处理器所有专有软件的处理器这种软件兼容性后来成为英特尔 全系列的微处理器在六年的销售期内,估计全世界已安装了1500万台286个人计算机。Intel 80286处理器的晶体管数量是134000个。1984年,IBM推出了以80286处理器为核心的16位增强型个人电脑IBM PC/AT。由于IBM在开发个人电脑时采取了开放技术的策略,个人电脑风靡全球。

第4阶段

第4阶段(19853541992)现在是32位微处理器的时代,也被称为第四代。其典型产品是英特尔 s 80386/摩托罗拉80486号公司的M69030/68040等。其特点是采用HMOS或CMOS工艺,集成度高达100万个晶体管/具有32位地址线和32位数据总线的芯片。每秒可以完成600万条指令(每秒百万条指令)微型计算机的功能已经达到甚至超过了超级微型计算机,完全有能力进行多任务处理、多用户的作业。在同一时期,其他一些微处理器制造商(如AMD、TEXAS等)也推出了80386/80486系列芯片。

80386DX具有32位内外数据总线和32位地址总线,可寻址4GB内存,管理64TB虚拟存储空间。除了实模式和保护模式,它的运行模式还增加了一个“虚拟86”多任务能力可以通过同时模拟多个8086微处理器来提供。80386SX是Intel为了扩大市场份额而推出的一款廉价且受欢迎的CPU其内部数据总线为32位,外部数据总线为16位它可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。80386SX推出后,受到了市场的广泛欢迎,因为80386SX的性能比80286好很多,而价格只有80386的三分之一。Intel 80386 微处理器包含275,000 个晶体管—比原来的4004多100多倍,这款32位处理器首次支持多任务设计,可以同时执行多个程序。Intel 80386晶体管的数量约为275万个。

1989年,我们都很熟悉的80486芯片由英特尔推出。这款历时四年研发投资3亿美元的芯片的伟大之处在于,它实际上第一次打破了100万个晶体管的界限,集成了120万个晶体管,并采用了1微米的制造工艺。80486的时钟频率从25MHz逐渐增加到33MHz、40MHz、50MHz。

80486在一个芯片上集成了80386数学协处理器80387和8KB缓存。80486中集成的80487的数字运算速度是之前80387的两倍,内部缓存缩短了微处理器和慢速DRAM的等待时间。而且80x86系列首次采用RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线模式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协处理器的80386 DX高4倍。

第5阶段

处理器芯片

处理器芯片

第5阶段(1993-2005年)是奔腾(pentium)系列微处理器时代,通常称为第五代。典型的产品是英特尔奔腾系列芯片以及与之兼容的AMD K6、K7系列微处理器芯片。内部采用超标量指令流水线结构,有独立的指令和数据缓存。随着MMX(多媒体 媒体 扩展)微处理器的出现使微机的发展网络化、多媒体和智能化达到了更高的水平。

1997年推出的Pentium II处理器结合Intel MMX技术,可以高效处理电影、音效、和绘图数据,第一次使用单个 边 触点3356(S.E.C) 盒装,内置高速缓存。计算机用户可以使用这种芯片、编辑、以及通过互联网与朋友和亲戚分享数码照片、编辑与新增文字、音乐或制作家庭电影的过渡效果、通过使用可视电话和通过标准电话线和互联网传输电影,Intel Pentium II处理器中的晶体管数量为750万。

1999年推出的Pentium III处理器增加了70条新指令,并增加了一个名为MMX的互联网流SIMD扩展集,可以大大改善高级图像、3D、串流音乐、影片、语音识别和其他应用程序的性能可以大大改善使用互联网的体验,允许用户浏览逼真的在线博物馆和商店,并下载高质量的电影英特尔首次推出0.采用25微米技术,Intel Pentium III中的晶体管数量约为950万。

同年,英特尔还发布了奔腾 IIIXeon处理器。作为Pentium II Xeon的继任者,它不仅在内核架构上采用了全新的设计,还继承了Pentium III处理器增加的70个指令集,更好地执行多媒体、流媒体应用软件。除了面向企业市场,Pentium III Xeon加强了电子商务应用和高级业务计算的能力。在缓存速度和系统总线结构方面也有许多改进,这大大提高了性能,并为更好的多处理器合作而设计。

2000年,英特尔发布了奔腾 4处理器。用户可以使用基于奔腾 4处理器的个人电脑来制作专业质量的电影,通过互联网传输电视质量的图像,并进行实时语音、图像通信实时3D渲染快速MP3编码和解码操作,以及在连接到互联网时运行多个多媒体软件。

奔腾 4处理器集成了4200万个晶体管,改进的奔腾 4(诺斯伍德)它还集成了5500万个晶体管;并且开始采用0.18微米,初速达到1.5GHz。

Pentium 4还提供SSE2指令集,增加了144条全新的指令在SSE中,128bit压缩的数据只能以四个单精度浮点值的形式进行处理,而在SSE2指令集中,数据可以以各种数据结构进行处理:

4个单精度浮点数(SSE)对应于两个双精度浮点数(SSE2)对应16字节数(SSE2)对应8个字数(word)对应4个双字数(SSE2)对应2个四字数(SSE2)对应于128位整数(SSE2) 。

2003年,英特尔发布了奔腾 M(mobile)处理器。虽然过去有移动版的Pentium II,、三甚至是奔腾 4-m产品,但这些产品仍然基于台式计算机处理器的设计,并增加了一些节能和管理的新功能。即便如此,奔腾 III-M和奔腾 4-m比专门为移动计算设计的CPU,如全美达 的处理器。

英特尔奔腾 M处理器结合了855芯片组家族和英特尔 PRO/无线2100网络连接技术成为英特尔迅驰(迅驰)移动计算技术最重要的部分。奔腾 M处理器最多可提供1.60GHz主频速度,并包括各种性能增强功能,例如:用于优化电源的400MHz系统总线、微处理操作的融合(Micro-视觉融合)和专用堆栈管理器(专用 堆栈 管理器)这些工具可以快速执行指令集并节省电力。

2005年,英特尔推出了两款双核处理器,奔腾 D和奔腾 至尊3356版,同时推出了945/955/965/975芯片组,以支持新推出的双核处理器新推出的两款90nm工艺生产的双核处理器采用LGA 775接口,无引脚,但处理器底部的片电容数量有所增加,排列方式也有所不同。

桌面平台的处理器代号为Smithfield,官方命名为Pentium D处理器除了去掉阿拉伯数字,用英文字母代表双核处理器的世代交替,字母D也更让人联想到Dual-核心双核的含义。

英特尔 的双核架构更像是双CPU平台,奔腾 D处理器继续使用Prescott架构和90nm生产工艺。实际上,Pentium D内核由两个独立的Prescott内核组成每个内核都有独立的1MB L2缓存和执行单元,两个内核加起来2MB但由于处理器中的两个内核都有独立的缓存,所以需要保证每个二级缓存中的信息完全一致,否则会出现操作错误。

为了解决这个问题,Intel把两个内核之间的协调交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输和存储并不庞大,但是由于需要外部MCH芯片来协调处理,毫无疑问会给整个处理速度带来一定的延迟,从而影响处理器的整体性能。

因为普雷斯科特内核,奔腾 D也支持EM64T技术、XD bit位安全技术。值得一提的是,奔腾 D处理器将不支持Hyper-穿线技术。原因很明显:在多个物理处理器和多个逻辑处理器之间正确分配数据流、平衡运营的任务并不容易。比如一个应用需要两个计算线程,显然每个线程对应一个物理内核,但是如果有三个计算线程呢?因此,为了降低双核Pentium D架构的复杂度,英特尔决定取消面向主流市场的Pentium D中的Hyper-支持线程技术。

都来自Intel,而且奔腾 D和奔腾  Extreme 3356 Edition名称的不同也说明了这两款处理器的规格不同。它们之间最大的区别在于超线程(Hyper-穿线)技术的支持。奔腾 D不支持超线程技术,而奔腾 至尊3356版则没有此限制。开启超线程技术时,双核奔腾 至尊3356版处理器可以模拟另外两个逻辑处理器,可以被系统识别为四核系统。

Pentium EE系列以Pentium EE8xx或9xx的形式标有三位数,如Pentium EE840等数字越大,规格越高或支持的功能越多。

奔腾 EE 8x0:意味着这是史密斯菲尔德核心、每核1MB L2高速缓存、800MHzFSB产品与奔腾 D 8x0系列的唯一区别是只增加了对超线程技术的支持,其他技术特性和参数完全相同。

奔腾 EE 9x5:意味着这是普雷斯勒核心、每核2MB L2高速缓存、1066MHzFSB的产品与奔腾 D 9x0系列的区别仅在于增加了对超线程技术的支持,并将前端总线改进为1066MHzFSB,其他技术特性和参数完全相同。

单核奔腾 4、奔腾 4 EE、Celeron D双核奔腾 D和奔腾 EE CPU采用LGA775封装。与之前Socket 478接口CPU不同的是,LGA 775接口CPU底部没有传统的引脚,而是775触点代替,即触点式代替引脚式,通过与相应LGA 775插槽中的775触点引脚接触来传输信号。LGA 775接口不仅可以有效提高处理器的信号强度、提高处理器频率的同时,也提高了处理器生产的良率、降低生产成本。

第6阶段

第6阶段(2005年至今)是酷睿(core)系列微处理器时代,通常称为第6代。酷睿”是一种新型领先的节能微建筑设计的出发点是提供出色的性能和能效,提高每瓦性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。酷睿2:英文名称为Core 2 Duo,是英特尔于2006年推出的基于酷睿微架构的新一代产品系统的总称。发表于2006年7月27日。Core 2是一个跨平台架构,包括服务器版本、桌面版、移动版三大领域。其中服务器版开发代码为Woodcrest,桌面版开发代码为Conroe,移动版开发代码为Merom。

酷睿2处理器的酷睿微体系结构是英特尔公司改进的新一代英特尔体系结构基于Yonah微架构的美国以色列设计团队。最显著的变化在于各个关键部位的强化。为了提高两个内核之间的内部数据交换效率,采用了共享二级缓存设计,两个内核共享一个高达4MB的二级缓存。

继LGA775接口之后,英特尔首次推出LGA1366平台,定位高端旗舰系列。首款采用LGA 1366接口的处理器代号为Bloomfield,采用了改进的Nehalem内核,基于45nm工艺和原生四核设计,内置8-12MB三级高速缓存。LGA1366平台再次引入了英特尔超线程技术,QPI总线技术取代了自Pentium 4时代以来一直使用的前端总线设计。最重要的是LGA1366平台支持三通道内存设计,大大提升了实际性能,这也是LGA1366旗舰平台与其他平台在定位上的一大区别。

作为高端旗舰的代表,早期LGA1366接口的处理器主要有45nm Bloomfield Core i7四核处理器。随着2010年英特尔进入32nm工艺,高端旗舰的代表被酷睿i7夺走-换成980X处理器,全新的32nm工艺解决了六核技术,性能最强大。对于准备搭建高端平台的用户来说,LGA1366依然占据高端市场,酷睿i7-980X和酷睿i7-950还是不错的选择。

Core i5是一款基于Nehalem架构的四核处理器,采用集成内存控制器,三级缓存模式,L3达到8MB,支持Turbo Boost等技术的全新处理器电脑配置。It 与Core i7相同(布卢姆菲尔德)最主要的区别是,大巴不用QPI,而是用成熟的DMI(直接 媒体 接口),并且只支持双通道DDR3内存。结构上采用LGA1156 接口,i5有turbo技术,在一定条件下可以超频。LGA1156接口的处理器覆盖了从入门级到高端的不同用户,32nm工艺带来了更低的功耗和更好的性能。主流级别以酷睿i5为代表-650/760,高端代表是酷睿i7-870/870K等。我们可以清楚的看到英特尔在产品命名上的定位区分。但总的来说,高端LGA1156处理器比低端入门更值得购买面对AMD 的低成本战略,英特尔酷睿i3系列处理器可以 性价比上比不上。LGA1156中高端产品在性能上更为抢眼。

Core i3可以看作是Core i5的进一步简化版本(或阉割版)会有32nm工艺版本(R d代码是Clarkdale,基于Westmere架构)这种版本。Core i3最大的特点就是GPU的集成(图形处理器)换句话说,Core i3将由CPU和GPU两个核心封装。由于集成GPU的性能有限,如果用户想要获得更好的3D性能,可以添加显卡。值得注意的是,即使在克拉克代尔,显示器核心的制造工艺仍将是45纳米。i3 i5 最大的区别就是 i3没有涡轮技术。代表有酷睿i3-530/540。

2010年6月,英特尔再次发布了革命性的处理器——,第二代酷睿 i3/i5/i7。第二代酷睿 i3/i5/I7属于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架构与第一代产品相比,i7主要带来了五大重要创新:1、采用全新32nm Sandy Bridge微架构,功耗更低、更强性能。2、内置高性能GPU(核芯显卡),视频编码、图形性能更强。( 3)睿频加速技术2.0,更智能、更高效能。4、引入新的环形架构,带来更高的带宽和更低的延迟。5、全新的AVX、AES指令集,加强浮点运算和加密解密运算。

SNB(Sandy Bridge桥桥)它是英特尔在2011年初发布的新一代处理器微架构这个架构最大的意义就是重新定义了它“整合平台”处理器的概念“无缝融合”的“核芯显卡”终结了“集成显卡”的时代。这一举措得益于全新的32纳米制造工艺。由于Sandy Bridge 框架下的处理器采用了比之前45nm工艺更先进的32nm制造工艺,CPU功耗进一步降低,电路尺寸和性能理论上显著优化,也就是集成了图形核心(核芯显卡)与CPU封装在同一基板上创造了有利条件。此外,第二代酷睿还加入了全新的高清视频处理单元。视频转换和解码的速度与处理器直接相关由于增加了高清视频处理单元,新一代酷睿处理器的视频处理时间比旧款处理器至少长30倍%新一代Sandy Bridge处理器采用了全新的LGA1155接口设计,不兼容LGA1156接口。Sandy Bridge是一种新的微架构,将取代Nehalem,但仍将采用32纳米工艺。更吸引人的是,这次英特尔不再使用CPU核和GPU核“胶水”粘在一起,但真正做到两者在一个核心。

2012年4月24日下午,北京天文馆,英特尔正式发布Ivy Bridge(IVB)处理器。22 nm 22nm Ivy Bridge将执行单元数量翻倍至最多24个,自然会带来性能的进一步飞跃。Ivy Bridge将增加一个支持DX11的集成显卡。此外,新增加的XHCI USB 3.0控制器共享四个通道,因此最多提供四个USB 3.0以支持本机USB3.cpu采用3D晶体管技术,CPU功耗会降低一半。Ivy Bridge架构产品采用22nm工艺,将延续LGA1155平台的寿命,所以打算购买LGA1155平台的用户不要 至少一年内不用担心界面升级。

2013年6月4日,intel 发布四代CPU“Haswell”,第四代CPU引脚(CPU接槽)它叫Intel LGA1150,主板名是Z87、H87、对于Q87等8系列芯片组,Z87是超频玩家和高端客户群体,H87是中低端通用级,Q87是企业级使用。Haswell CPU 将用于笔记本电脑、台式CEO套件电脑和 DIY组件CPU已经逐渐取代了目前的第三代Ivy Bridge。

安全问题 编辑本段

CPU 的蓬勃发展也带来了很多安全问题。 FDIV bug出现在1994年的奔腾处理器上(奔腾浮点除错误)会造成浮点数除法的错误;1997年,奔腾处理器上的F00F异常指令可能导致CPU死机;2011年英特尔处理器的可信执行技术(TXT,可信 执行 技术)存在缓冲区溢出问题,攻击者可以利用该问题提升权限;2017  英特尔管理引擎(我,管理 引擎)组件中的漏洞会导致远程未经授权的任意代码执行;2018年,Meltdown 和Spectre两个CPU漏洞影响了过去20年制造的几乎每一台计算设备,使得数十亿台设备上存储的隐私信息面临被泄露的风险。这些安全问题严重危及国家网络安全、关键基础设施的安全和重要行业的信息安全已经或者将要造成巨大损失。

CPU比较 编辑本段

GPU就是图像处理器CPU和GPU的工作流程和物理结构都差不多相对于CPU,GPU的工作更加单一。在大多数个人电脑中,GPU仅用于绘制图像。如果CPU想要绘制二维图形,只需要向GPU发送一个指令,GPU就可以快速计算出图形的所有像素,并在显示器上的指定位置绘制出相应的图形。因为GPU会产生大量的热量,所以显卡上通常会有独立的散热装置。

设计结构

CPU有强大的 元的算术运算单,可以在几个时钟周期内完成算术运算。同时还有一个很大的缓存,里面可以装很多数据。此外,还有一个复杂的逻辑控制单元,当程序有多个分支时,它可以通过提供分支预测的能力来减少延迟。GPU是基于大吞吐量设计的,运算单元多,缓存少。同时,GPU支持大量线程同时运行如果他们需要访问相同的数据,缓存会将这些访问合并,自然会导致延迟的问题。虽然存在延迟,但由于算术运算单元的数量巨大,它可以实现非常大的吞吐量。

使用场景

显然,CPU非常擅长逻辑控制,因为它有大量的缓存和复杂的逻辑控制单元、串行的运算。相比较而言,GPU由于拥有大量的算术运算单元,可以同时进行大量的计算工作擅长大规模并发计算,计算量大但是没有技术含量,而且要重复很多次。这样,很明显我们可以利用GPU来提高程序运行的速度。用CPU做复杂的逻辑控制,用GPU做简单但海量的算术运算,可以大大提高程序的运行速度。

未来发展 编辑本段

通用中央处理器(CPU)芯片是信息产业的基础部件,是武器装备的核心器件。我国缺乏具有自主知识产权的CPU技术和产业,不仅导致信息 产业受制于人,也难以充分保障国家安全。 “十五”期间,国家“863计划”开始支持自主研发 CPU。十一五”期间,“核心电子器件、高端通用芯片和基础软件产品”核高基”重大专项将“863, 笔”2000年的CPU成果被引入业界。从“十二五”起初,我国在多个领域开展了自研CPU的应用和试点,并在一定范围内形成了独立的技术和工业体系,能够满足武器装备的要求、信息化等领域的应用需求。而国外的CPU 已经垄断很久了,中国自主研发CPU产品和市场成熟还需要一段时间

相关品牌 编辑本段

龙芯”系列芯片

龙芯”系列芯片由中科院中科科技有限公司设计研发,采用MIPS架构,拥有自主知识产权现在的产品包括龙芯1号小型CPU、龙芯二号有三个系列的CPU,龙芯三号有大CPU,还包括龙芯7A1000桥片。龙芯一号系列32/64位处理器是专门为嵌入式领域设计的,主要用于云终端、工业控制、数据采集、手持终端、网络安全、消费电子等领域,功耗低、高集成度,高性价比。其中,龙芯lA 32位处理器和龙芯1C 64位处理器稳定工作在266~300 MHz,龙芯1B处理器为轻量级32位芯片。龙芯1D处理器是一种超声波热量表、水表气表专用芯片。2015年新一代北斗导航卫星搭载我国自主研发的龙芯1E和1F芯片,主要用于完成星间链路的数据处理任务1。

龙芯2系列是一款面向桌面和高端嵌入式应用的64位高性能低功耗处理器。龙芯2号产品包括龙芯2E、2F、2H和2K1000芯片。龙芯2E首次实现对外生产销售授权。龙芯2F的平均性能比龙芯 2E高20%以上,可用于个人电脑、行业终端、工业控制、数据采集、网络安全等领域。龙芯2H在2012年推出了官方产品,适用于电脑、云终端、网络设备、消费电子等领域,也可作为HT或 PCI使用-E接口全功能套的使用。2018年,龙芯推出龙芯2K1000处理器,主要是网络安全和移动智能领域的双核处理芯片,主频可达1 GHz,可满足工业物联网的快速发展、自主可控工业安全系统的需求。

龙芯3系列面向高性能计算机、面向服务器和高端桌面应用的多核处理器具有高带宽高性能低功耗的特点。龙芯3A3000/383000处理器采用独立微结构设计,主频可达1.5 GHz以上;计划于2019年上市的龙芯3A4000是龙芯 s第三代产品 该芯片基于28 nm工艺,采用最新研发的GS464V 64位高性能处理器核心架构,实现 256位矢量指令,同时优化片内互联和内存访问通道,集成64位DDR3/4内存控制器,集成片上安全机 系统,主频和性能将再次大幅提升。

龙芯7A1000桥是龙芯第一款专用桥组产品目标是替代AMD RS780 SB710桥组,为龙芯处理器提供南北桥功能。2018年2月发布,目前应用在一个高性能网络平台上,采用龙芯3A3000和紫光4G DDR3内存。与3A3000 780e平台相比,该方案的整体性能有了很大的提升,并且具有较高的国产率、高性能、高可靠性等特点。

Intel

根据英特尔 的产品线规划,到2021年,英特尔 s第11代消费级酷睿将有五大类产品:i9/i7/i5/i3/奔腾/赛扬。服务器也有至强白金级/金牌/银牌/HEDT平台铜牌和至强W系列。

AMD

根据AMD产品线规划,到2021年,AMD锐龙5000系列处理器将拥有ryzen9/ryzen7/ryzen5/Ryzen3四个消费产品系列。此外,还有面向服务器市场的第三代骁龙EPYC处理器和面向HEDT平台的thread ripper系列。

上海兆芯

上海赵信集成电路有限公司是成立于2013年的国有控股公司其处理器采用x86架构,产品主要有先锋ZX-A、ZX-c/ZX-C+、 ZX-D、让 让我们从KX的33565000英镑和KX的6000英镑开始吧;开胜ZX—C+、ZX—D、KH I 20000 等。其中,开县KX5000系列处理器采用28 nm工艺,并提供4核或8核版本,整体性能较上一代提升140%,达到国际主流通用处理器的性能水平,完全可以满足党政桌面办公应用,以及包括4K超高清视频观看在内的多种娱乐应用的需求。开胜KH-20000系列处理器是Megacore为服务器和其他设备推出的CPU产品。开先KX-6000系列处理器的主频高达3.0 GHz,兼容全系列Windows操作系统和中科方得、中标麒麟、国产自主可控操作系统如普华,性能与Intel s第七代酷睿i5。

上海申威

申威处理器简称“Sw处理器”来自DEC的Alpha 21164,采用Alpha架构,拥有完全自主知识产权其产品包括单核软件-1、双核Sw-2、四核Sw-410、十六核SW-1600/SW-1610等。神威蓝光超级计算机采用8704 SW1600,搭载神威锐思操作系统,实现软硬件全部国产化。而基于Sw-建于26010年“神威·太湖之光”自2016 年6月发布以来,超算已连续四次占据全球超算TOP 500榜单第一名“神威·太湖之光”全球两个1000万 核心机应用已经接管了2016年、2017年世界 高性能计算应用的最高奖项“戈登·贝尔”奖。

附件列表


1

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 ​瓦斯爆炸    下一篇 安防摄像头

同义词

暂无同义词