● G8X GPU 3D加速特性回顾
Geforce 8系列显卡的GPU设计均以系列中最强的G80为蓝本进行简化,就全规格产品G80-300来说,它拥有128个通用标量着色器(被NVIDIA称作SP:Streaming Processor)、可以维持最多4096个线程的GigaThread逻辑、24个光栅处理器(Raster Opteration)以及384bit位宽的内存控制器。 G80是PC平台上首个全面支持DirectX 10的GPU,它使用完全符合ShaderModel4.0需求的统一渲染架构,并在渲染后端的ROP设计上也完全符合DirectX 10的渲染输出精度要求,如128bit(RGBA每通道32bit)浮点精度的HDR。G86在基础特性上完全继承了G80的优势,包括全功能GigaThread逻辑和3D特性,缩减的只是规模。 
G80 GPU体系架构示意图 G80 GPU的128个通用标量着色器分成16组,每组着色器联合着一组均衡配置的纹理过滤、纹理地址单元和对应的L1/L2 Cache一起工作。这样一个着色器组是模块化设计的,并且脱离于后端的ROP和内存控制器。制造简化型Geforce 8系列GPU的工作就是基于这个基本的着色器组展开。G86 GPU实际上就是16SPs、改用80nm工艺制造的G80,G80能够支持的特效,G84和G86也能实现,它们的区别仅仅是运行速度。
比较G86-213和全规格G80的硬件规格(考虑进频率影响),G86-213大约只有G80的10%,Geforce 8400 GS在3D应用的运行速度上无疑是没法和Geforce 8800相比的。这种GPU的特点在于用极低的成本实现不凡的高清硬件解码能力。 全功能高清视频解码:PureVideo HD G86-213支持强化高清内容回放能力的最新版本PureVideo HD,在这个方面上它和G84、G86-300没有任何区别,并且在显卡实现的HDCP相关特性上,Geforce 8400 GS还强过Geforce 8600 GT和Geforce 8500 GT。 ● 100% GPU解码的期望
720p以上的高清视频能提供前所未有的细致入微画面,如果完全基于目前的恒码率MPEG2格式编码,1080p电影码率超过23Mbps,视频文件所需存储空间巨大,因此用于实现尽量高的压缩比,并保持良好画面质量的更先进编码格式不断涌现。之中最流行并被DVD标准制定组织DVD Forum认可的VC-1(微软WMVx的纯算法版)和H.264。而用户在播放使用这些编码的高清视频的时候,就需要对进行过复杂编码后的视频进行实时解码,如果没有专门的解码器硬件支持,这个软件解码的过程对于CPU是一个非常严峻的考验,因为运算量非常巨大。

两种标准的高清发行格式都需要强力硬件解码的支持
目前超过25Mbps码率的H.264 编码高清视频就很难在主流CPU平台上顺畅播放,100%的CPU负载并带来画面迟滞是所有视频爱好者的噩梦,如果不是使用超频至3GHz以上的Core 2处理器,最好的选择还是拥有额外的解码硬件。 ● 最新PureVideo HD特性 NVIDIA的GPU在NV4x一代开始便引入辅助高清解码技术的PureVideo HD,并在06年初增加了对H.264编码格式视频的解码支持。PureVideo HD已经能有效缓解CPU的压力,只是解码过程仍然需要CPU很高的参与度,不能彻底释放CPU负载。PureVideo HD最新版本现在在NVIDIA G84和G86 GPU上被引入,它的最大改进是:高清视频解码可以100%交由GPU计算!CPU彻底解放。 G7X和G80 GPU的PureVideo HD特性依靠内部的VP(VideoProcessor)提供,在对高清视频进行解码时,能够完成除了Bitstream处理和InverseTransform之外的其它操作,包括对CPU能力要求不低的De-Blocking操作。但以H,264编码的高码率影片播放时,即使CPU被PureVideo HD从De-Blocking解放出来,Bitstream处理仍旧给CPU沉重的压力。 
G84、G86 GPU内的视频解码逻辑得到大幅加强 G84、G86 GPU在内部设计上大大增强了视频解码逻辑,除了VP版本更新并加强了性能之外,还新增了针对H.264解码的BSP(Bitstream Processor)引擎,解决原来G7X和G80 GPU的PureVideo HD仍需CPU进行Bitstream处理的问题,彻底接手高清视频解码的所有工作。

无PureVideo HD和两个版本PureVideo HD的H.264解码对比 以G84、G86 GPU为核心的Geforce 8600 / 8500 / Geforce 8400系列显卡,能够基本不需CPU计算能力的支持,就流畅播放高码率H.264压缩格式的高清视频,BSP支持CABAC/CAVLC两种方式的Bitstream处理,即使使用的是低速CPU,CPU占用率也可以保持在40%以下,系统响应度和播放顺畅度都能够保证。
Geforce 8600 / 8500 / Geforce 8400对MPEG2、VC1及H,264均能提供最优的支持。VP+BSP的协同工作目前已经在InterVideo WinDVD和Cyberlink PowerDVD的最新版本中实现。 ● HDCP功能Geforce 8400 GS标配 Geforce 8400 GS的一大亮点是标配HDCP硬件,这一部分仅在Geforce 8600 GTS以上的Geforce 8上具备,而Geforce 8600 GT和Geforce 8500 GT均为选配,NVIDIA在最低端的Geforce 8400 GS上把HDCP列为标配,产品设计方向一目了然。 
富士康Geforce 8400 GS上的HDCP key ROM
HDCP是High-bandwidth Digital Content Protection的缩写,意为高清数字内容保护。HDCP技术是由好莱坞与半导体界巨人Intel合作发开,它可以实际运用在显卡、DVD播放机等传输端,以及显示器、电视机、投影机的接收端之间。想在计算机上播放有版权的高清节目,不论是HDTV、蓝光还是HD DVD碟片,都要求显示器和显卡支持HDCP协议。 在显卡端,实现HDCP需要卡上安装有存放了HDCP Licence安全密钥的Atmel AT88SC 0808C Crypto ROM。PCB背面和显卡BIOS ROM芯片临近的即是这枚Atmel AT88SC。显卡支持HDCP配置的意义在于,未来所有发行载体的高清视频内容均会被加入HDCP,如果显卡不支持这个功能,显示输出的内容将被降低分辨率水平甚至是不能输出信号。 ● 基于NVIDIA官方样板设计的产品 Geforce 8400 GS可以配置成128MB或256MB容量的本地内存,目前还只有GDDR2的搭配方案。在ZOL评测中心收到的多块Geforce 8400 GS,富士康(FOXCONN)的产品和NVIDIA官方样板显卡最为接近,笔者就从这款产品入手对Geforce 8400 GS进行详细的剖析。 NVIDIA Geforce 8400 GS官方样板为low profile(半高卡)设计,PCB编号为P413,它成本低廉同时便于在2U厚度的Flex型机箱内配置,这类机箱在商用型PC和HDPC型PC中相当普及。P413 PCB正反两面各提供两个GDDR2芯片焊位,本身提供一个DVI和一个S端子输出接口,板载D-SUB模拟输出接口插针。 
FOXCONN Geforce 8400 GS 128MB 零售市场上的Geforce 8400 GS都会配置成全高型档板,PCB上的D-SUB接口插针被转接成D-SUB接口输出,正如这款富士康产品的形式。

显卡背面状况

输出接口配置

GPU、内存供电电路元件 富士康产品的用料做工都很不错。P213 PCB上的GPU、内存供电电路元件集中在GPU和输出接口之间的位置,规模轻盈。

轻量级的GPU散热方案 富士康Geforce 8400 GS配置的散热器体积轻巧,其规模和主板上的芯片组散热器相仿。透明塑料的风扇部分看起来非常清爽,为普通的2pin电力接口,恒定转速运作。散热片使用铝材挤压工艺制造。
● PCB和核心硬件构成
6层板设计的P413在样式上和Geforce 7300 LE GDDR2版的PCB相似,它不提供SLI应用的MIO接口。下图是拆下散热器后的FOXCONN Geforce 8400 GS 128MB

P413 PCB

G86-213 GPU 富士康Geforce 8400 GS的BIOS默认核心频率为460MHz,着色器频920MHz,和NVIDIA官方规格完全一致,卡上的GPU工艺版本为A2。

hynix 2.5ns GDDR2芯片 显卡上搭载128MB容量的GDDR2本地内存,BIOS默认运行频率800MHz(DDR)。使用了hynix的2.5ns GDDR2芯片HY5PS561621A FP-25,16M*16bit组织形式,额定运行频率800MHz。
富士康Geforce 8400 G支持HDCP,前文已经详述,这里不再重复。 |