安捷影音在哪下载
本文由半导体产业纵横(ID:ICVIEWS)编译自Chips and Cheese
是时候来聊聊英伟达GeForce 6系列显卡了。

2025 年开头,显卡领域就吵杂不凡。英特尔的 Arc B580 标明,制造一款显存(VRAM)逾越 8GB 的中端显卡仍是可行的。AMD 的 RDNA 4 络续了 AMD 永远以来的一种作念法,即在追求高端居品之后,又认为终究不太值得。英伟达在 2025 年也推出了新一代居品,他们的 5000 系列显卡照旧发布,但市面上却一直莫得现货。不外,数字越大越好,是以当今是时候来聊聊英伟达 GeForce 6 系列显卡了。
每一代游戏玩家都对更高质料的图形后果有所需求。莫得东谈主比英伟达更了了这少量,因此英伟达 GeForce 6000 系列显卡旨在以富裕高的帧率提供接近电影级的画质,以赞助交互式游戏体验。GeForce 6000 显卡,简称 GeForce 6 系列,在遐想时推敲到了图形渲染的高度并行性。与此同期,它们在可编程性方面竣事了纷乱飞跃,为竣事复杂的游戏内殊效开辟了令东谈主欣慰的新可能。
抽象
图形渲染波及在规划最终像素状貌之前,将极点坐标从三维空间治愈到二维屏幕空间,这一历程被称为光栅化。这两个阶段骨子上都是并行任务,何况能很好地适配领有精深实践单位阵列的硬件。因此,英伟达GeForce 6 系列是一种大范围并行处理的设立。它领有精深的固定功能图形硬件,但该显卡确实切实力在于其一系列极点着色器中枢和像素着色器中枢。这些可编程组件实践由游戏提供的着色器花式,而不是实践预设功能。它们还充任基本的构建模块,使英伟达大概针对不同的功耗、价钱和性能目标进行扩张。英伟达 GeForce 6000 系列中最高端的芯片 NV40 配备了 6 个极点着色器中枢和 16 个像素着色器中枢。
摘自英伟达发表于电气与电子工程师协会(IEEE)的论文
一台高度并行的机器需要一个高带宽的内存子系统来为其提供数据赞助。英伟达 GeForce 6 系列居品最高可配备 256 位的 GDDR3 动态随即存取存储器,这使得它的内存总线宽度比典型的台式机中央处理器要宽得多。该显卡具有一个可被总计像素着色器中枢和极点着色器中枢分享的二级纹理缓存,这使得取得到的纹理数据大概在短期内被访佛使用。英伟达那时并未露馅缓存的大小,但他们的目标是在有好多未射中情况同期发生时达到 90% 的射中率,而不是像中央处理器缓存那样频频追求 99% 的射中率。该显卡通过流行的加快图形接口(AGP)与主机系统进行通讯,但也能赞助行将推出的外设部件互连高速步伐。
极点着色器中枢(Vertex Shader Core)
极点着色器花式将坐标从三维空间治愈到二维屏幕空间。这听起来可能是一项浅陋的任务,无非即是进行相机矩阵乘法和透视除法运算。但可编程的极点着色器带来了新的技能。举例,一个极点着色器不错对纹理进行采样,并将其用作置换贴图。除了赞助纹理拜访以外,英伟达 GeForce 6000 的极点着色器中枢还赞助分支、轮回和函数调用。在确切的中央处理器以外,畴前在其他设立上,这些功能中的大部分都是难以联想的,这展示了显卡发展的令东谈主欣慰之处。
极点着色器的实践从一个领有 512 个条款标提醒随即存取存储器中索要提醒开动。英伟达使用来自驱动花式花式的 128 位极点提醒,这些提醒会被治愈为 123 位的里面花式。因此,该提醒随即存取存储器的容量大致为 8 千字节。DirectX 9 的极点着色器 3.0 步伐章程至少要有 512 个提醒插槽,何况英伟达的极点着色器中枢提醒集架构与 DirectX 9 的高档着色器言语提醒精熟契合。由于存在提醒升天,着色器花式不会像中央处理器花式那样频频因提醒缓存未射中而导致性能赔本。此外,拜访提醒随即存取存储器不像缓存那样需要进行标签比较,从而检朴了功耗。
从梅萨(Mesa)代码中预见出的英伟达 GeForce 6000 极点着色器提醒布局
DirectX 9极点着色器的高档着色器言语提醒大致可分为标量提醒和矢量提醒两类。标量提醒包括诸如求往常根倒数之类的颠倒运算。矢量提醒经常波及像乘加这么的基本运算,何况对由四个32位值构成的128位矢量进行操作。英伟达GeForce 6000的极点着色器活水线针对这种拔擢进行了高度优化,何况具有镇定的矢量活水线和标量活水线。每条提醒集架构提醒都同期指定了一个标量运算和一个矢量运算,使得极点着色器中枢大概在一个提醒流中从两个维度期骗并行性。DirectX 9着色器花式指定的矢量提供了矢量级别的并行性。英伟达的编译器发现的任何标量+矢量双提醒辐照契机都能提供迥殊的并行性。
并行性的第三个来源是多线程,它起到了隐蔽延伸的作用。矢量运算插槽不错给与纹理采样提醒。极点着色器对内存的拜访相对来说仍不常见,是以极点着色器中枢并莫得一个与其纹理取得单位绑定的一级纹理缓存。英伟达展望,一个着色器花式需要20到30条提醒来隐蔽纹理取得延伸,而仅靠单个线程很难竣事这少量。因此,每个极点着色器中枢最多不错追踪三个线程安捷影音在哪下载,并在它们之间进行切换以隐蔽延伸。
提醒输入可来自寄存器或常量随即存取存储器。两者都由 128 位矢量条款构成,以匹配矢量实践宽度。寄存器文献分为输入寄存器、输出寄存器和临时寄存器。输入寄存器和输出寄存器各有 16 个条款,从着色器花式的角度来看,它们分裂为只读和只写。临时寄存器文献赞助读写操作,有 32 个条款。DirectX 9 的极点着色器 3.0 圭表允许一个着色器花式最多可寻址 32 个寄存器,但英伟达可能会在多个线程之间分享寄存器文献。淌若是这么,一个极点着色器花式应使用不逾越 10 个临时寄存器,以竣事最大占用率。
像素着色器中枢(Pixel Shader Core)
像素着色器,或称为片断着色器,承担了精深祸患的责任,因为渲染一个场景经常波及处理的像素数目远多于极点数目。相应地,英伟达 GeForce 6000 显卡最多可领有 16 个像素着色器中枢。像素着色器中枢本身和极点着色器中枢同样具有高度可编程性,具备分支赞助等诸多特质。但是,像素着色器中枢的构建方式大不相通,以期骗像素层面经常存在的更高并行性。
英伟达 GeForce 6000 的像素着色器使用 128 位提醒,不外由于硬件各异,其编码与极点着色器所使用的编码有很大区别。英伟达选拔赞助多达 65536 条像素着色器提醒,远远逾越了 DirectX 9 章程的最低 512 个提醒插槽的圭表。使用总计提醒插槽将耗费 1 兆字节的存储空间,因此像素着色器中枢可能会使用提醒缓存。
“片断处理器每条活水线有两个 32 位浮点数着色器单位,片断会先经过这两个着色器单位和分支处理器,然后再轮回复返总计这个词活水线以实践下一组提醒。”——《英伟达 GeForce 6 系列 GPU 架构》,作家埃米特・基尔加里夫(Emmet Kilgariff)和拉姆迪马・费尔南多(Ramdima Fernando)
英伟达的极点着色器中枢的运行方式很像带有三向同步多线程功能来隐蔽延伸的中央处理器,而像素着色器中枢则在多个线程间摄取单提醒多数据实践模子。这种并行性,经常被称为单提醒多线程,是在通过使用多重量矢量在单个线程内竣事的单提醒多数据的基础上应用的。英伟达并非追踪三个镇定的线程,而是将好多像素着色器调用分组为一个矢量,并在硬件中有用地轮回处理这些 “线程”。这种方法使英伟达大概以低本钱同期处理数千个 “线程”,因为归并矢量中的线程必须实践相通的提醒,且弗成选择与其他线程不同的镇定实践旅途。唯有正在处理的数据是不同的。
对于这种单提醒多线程线程模子,花式员必须钟情提醒不合带来的性能损耗。淌若一个矢量内的不同线程在条件分支上选拔了不同的地点,像素着色器中枢将实践分支的两个地点,同期屏蔽掉非步履线程。这与极点着色器中枢的多提醒多数据实践模子酿成了赫然对比,极点着色器中枢的实践模子即使在归并中枢中运行的线程分支地点不同期,也允许无损耗的分支操作。英伟达提议在逾越 1000 个像素的区域内保抓分支的一致性,或者大致 256 个 2x2 像素的四边形区域,这知道着矢量长度会相等长。
同期处理如斯多的任务对于隐蔽延伸至关报复,但这也给芯片里面存储带来了压力。DirectX 9 允许像素着色器寻址 32 个临时寄存器,这些寄存器的宽度依然为 128 位。要同期处理 256 个线程,每个像素着色器中枢将需要 128 千字节的寄存器文献容量,而这在改日几年内的GPU中都难以竣事。英伟达 GeForce 6000 使用的是较小的寄存器文献,其大小未知。英伟达知道,淌若像素着色器花式使用四个或更少的 128 位寄存器,就不错让同期处理的线程数目达到最大值。大致估算一下,256 个线程,每个线程使用四个寄存器,将需要 16 千字节的寄存器文献容量。
像素着色器中枢的两个 128 位矢量单位在不同的活水线阶段步骤罗列。每个周期,这两个单位都不错实践四次 32 位浮点数运算,不外唯有位于下方的阿谁单位不错进行乘加运算。位于上方的单位大概处理颠倒函数运算以及纹理地址规划。纹理运算在这两个实践单位阶段之间发出。32 位浮点数运算的峰值婉曲量为每个周期 12 次运算。举例,通过在上方阶段发出一次矢量 32 位浮点数乘法运算,鄙人方阶段发出一次 32 位浮点数乘加运算,就不错达到这一婉曲量。
从着色器花式的角度来看,上方和下方的矢量单位合起来每个周期不错完成两次矢量运算。与极点着色器中枢比拟,像素着色器的法例 “双提醒辐照” 布局使得上方的单位大概将其运算末端传递给下方的单位。因此,两条互相依赖的提醒不错竣事 “双提醒辐照”。除了对两个矢量单位的提醒进行交叉编排外,英伟达的编译器还不错将作用于矢量元素不同子集的运算打包到一条提醒中,这进步了单个线程内矢量单位的期骗率。半精度浮点数运算致使不错进一步进步婉曲量。对于图形渲染而言,齐全的 32 位精度往往并非必需,尤其是在处理像素状貌的时候。像素着色器中枢中的两个矢量实践单位都能以双倍速率实践半精度浮点数运算。使用半精度浮点数还能使这些数值对寄存器文献的占用减少一半,这反过来也不错进步占用率,进而更好地隐蔽延伸。
输入寄存器未绘图出来,但总计的着色器花式都会使用输入寄存器,并将其规划末端写入输出寄存器。纹理采样是像素着色的一个报复部分,因此与极点着色器中枢比拟,像素着色器中枢有一条经过优化的纹理采样旅途:每个中枢都有一个一级纹理缓存,由芯片级的二级纹理缓存提供赞助。
高出像素着色
像素着色器花式经常输出像素状貌,但状貌实践上仅仅一些数值。英伟达 GeForce 6000 强盛的大范围并行规划智商大部分集结在其像素着色器阵列中,而且其领有的高浮点运算智商(每秒十亿次浮点运算,GFLOPs)对于非像素干系的任务来说也相等出色。此外,像素处理活水线的机动性使得裕如创造力的花式员简直不错期骗它完成任何事情。
举例,明后追踪是一种与光栅化在骨子上迥然相异的图形渲染方法,它波及到在场景中追踪明后的旅途。由于对规划智商的要求,明后追踪在很猛进度上局限于离线应用。但是,英伟达GeForce 6系列的可编程像素着色器大概胜任及时渲染的任务,至少对于浅陋场景来说是如斯。
来自斯坦福大学对于布鲁克(Brook)应用花式编程接口(API)的展示内容
其可能性不仅限于不同的图形渲染技艺。可编程着色器的强盛功能鼓舞了一些新应用花式编程接口的发展,这些接口并非径直面向图形领域。斯坦福大学的布鲁克(Brook)应用花式编程接口针对 GPU 上的通用规划。它的编程模子与 GPU 针对并行任务进行优化的方式精熟相连。要熟练这么一种模子可能需要一些时刻来符合,尤其是因为大多数花式员一直以来学习的都是串行实践模子。但从事高度并行和高度法律讲授的数据处理的筹商东谈主员和其他开辟东谈主员应该存眷这些应用花式编程接口。
贫瘠仍然存在
在 GPU 上运行任何并行任务仍然存在首要舛错:着色器花式通过绑定的纹理来拜访内存;与 CPU 端的内存分拨比拟,纹理的大小有限;与齐全规格的 IEEE 754 步伐竣事比拟,浮点精度往往不及;着色器在不使清醒停顿的情况下只可实践很短的时刻;在着色器实践时间无法修改纹理等等。
开辟东谈主员还必须在 CPU 和 GPU 的内存空间之间传输数据,以便为 GPU 提供数据并取得末端。后者可能会出现问题,因为 GPU 经过优化,是为了将像素着色器的输出行动一帧图像呈当今屏幕上,然后赶快用后续的一帧覆盖它。从 GPU 将数据复制回 CPU 可能会碰到主机接口的升天。
英伟达无疑意志到了这些局限性,何况正在竭力处罚这些问题。GeForce 6 系列除了赞助 AGP 接口外,还将赞助行将推出的 PCI Express 步伐。PCI Express 增多的带宽使 GPU 更接近成为一个易于使用的并行加快器。
结语
GeForce 6 系列的像素和极点着色器活水线比以往任何时候都愈加机动,这标明英伟达正淡雅对待可编程着色器。对于现时的游戏责任负载而言,GeForce 6 系列引入的好多功能可能看起来有些多余。很难联想有东谈主会编写一个包含轮回、函数调用和分支,且长度达数百条提醒的着色器花式。GeForce 6 系列的功能标明,英伟达在基本图形渲染以外的特质方面张开竞争。这是开脱固定功能硬件这一更大趋势的一部分,何况对 GPU 的发展有着令东谈主欣慰的意想。也许很快,咱们就不会再称这些显卡为 GPU 了,因为它们能作念的远不啻渲染图形。
尽管英伟达 GeForce 6000 系列显卡具有可编程性,但其仍然相等提防图形处明智商。英伟达的着色器提醒集架构依旧与 DirectX 9 圭表精熟干系,这确保了游戏中的着色器花式能在该硬件上细密运行。而且这款硬件相等强盛;高端的 GeForce 6000 芯片领有逾越 2 亿个晶体管。这收货于外洋买卖机器公司先进的 130 纳米制程工艺才得以竣事。要提供如斯强盛的处明智商,也需要可靠的供电赞助,因此高端显卡使用了一双莫仕(Molex)相连器。莫仕相连器是经落后刻检修的步伐相连器,其粗针脚和电线大概可靠地为多样外围设立供电而不会溶化。
总之,GPU正以惊东谈主的速率发展。2005 年是令东谈主欣慰的一年。图形渲染技艺正与国度经济都头并进,向着 2008 年老进,毫无疑问,每个东谈主都在期待着阿谁光明的改日。
*声明:本文系原作家创作。著作内容系其个东谈主不雅点,本人转载仅为分享与运筹帷幄,不代表本人歌咏或认可,如有异议,请干系后台。
想要取得半导体产业的前沿洞见、技艺速递、趋势判辨安捷影音在哪下载,存眷咱们!
上一篇:安捷影音在哪下载 750的排量250的油耗! 本田黑科技NC750X引进国内订价若干成爆款?
下一篇:没有了