为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 高端显卡设计经验论文

高端显卡设计经验论文

2011-08-09 41页 pdf 3MB 43阅读

用户头像

is_662484

暂无简介

举报
高端显卡设计经验论文                               高端显卡设计经验  ——尹为作  高端显卡设计经验 2 【摘要】 随着微电子技术和计算机技术的不断发展,显示技术的不断发展,21世纪人 类对视觉的完美追求.造就了显卡对高端技术的追求. 本文概要地介绍了一些GPU的工作过程,高端显卡的原理,硬件架构,原理图 的设计,PCB设计, 重点介绍了设计高端显卡前期需要了解的一些知识,显卡关键 元器件,BOM选物料重点参数介绍,显卡中典型的电路设计应用,和在设计过程中 要掌握的知识和设计中需要注意的问...
高端显卡设计经验论文
                              高端显卡设计经验  ——尹为作  高端显卡设计经验 2 【摘要】 随着微电子技术和计算机技术的不断发展,显示技术的不断发展,21世纪人 类对视觉的完美追求.造就了显卡对高端技术的追求. 本文概要地介绍了一些GPU的工作过程,高端显卡的原理,硬件架构,原理图 的设计,PCB设计, 重点介绍了设计高端显卡前期需要了解的一些知识,显卡关键 元器件,BOM选物料重点参数介绍,显卡中典型的电路设计应用,和在设计过程中 要掌握的知识和设计中需要注意的问. 【关键字】 GPU、高端显卡、设计、高速 PCB 高端显卡设计经验 目 录 3 目 录 第一章 绪论 ………………………………………………………………………4 第二章 高端显卡的简介 ………………………………………………………….5 2.1 认识显卡 …………………………………………………………………..5 2.2 显卡 GPU 的工作原理 ……………………………………………………5 第三章 设计显卡的前期准备工作…………………………………………………6 3.1 显卡关键元器件以及重点参数介绍 ……………………………………6 3.2 高端显卡新技术的了解 ………………………………………………….8 3.3 设计中必须理解和掌握的的知识 ……………………………………….8 第四章 高速 PCB 的设计方法……………………………………………………..20 4.1 高速 PCB 设计理念 ………………………………………………………20 4.2 高端显卡 PCB 的实际 check ……………………………………………22 第五章 高端显卡的设计方法……………………………………………………..26 5.1 高端显卡的硬件架构 …………………………………………………….26 5.2 设计中重点关注问题的总结 ……………………………………………26 第六章 结束语 ……………………………………………………………………..16 参考文献 ……………………………………………………………………………30 附录:专业术语的解释……………………………………………………………..31 HD6850-Barts 原理图 ……………………………………………………...32 高端显卡设计经验 第一章 绪论 4 第一章 绪论 10年前我们所有人都认为显卡服务于制图、动画、游戏等电子娱乐领域,这 没有错。因为GPU(Graphic Processing Unit 图形处理器)发明的目的就是为了 应对繁杂的3D图像处理。GPU的工作通俗的来说就是完成3D图形的生成,将图 形映射到相应的像素点上,对每个像素进行计算确定最终颜色并完成输出。但是 谁都没有想到10年后的今天,GPU的内部架构和应用范围已经发生了翻天覆地的 变化。 随着信息宽带化和高速化的发展,从1999年到现在从第一个显卡GPU产生到 现在只有短短十年的时间。在这短短十年当中我们已经看到了GPU的运算能力呈 几何级数提升,这个世界在GPU的虚拟之下更快更真,而更重要的一点是GPU 已经将它的应用范围不断拓展。 从图形领域虚拟现实的角度来说,只要有显示终端的地方就需要一颗GPU。 借助于GPU可以让医学家观察到更细微的分子;借助于GPU可以让军事演习的拟 真度更强;借助于GPU可以让专业工作站的效率翻倍提升;借助于GPU可以让电 影的特效骗过你的眼睛。21世纪视觉需求与GPU变化.让4D电影和你共享. 最近几年中当我们发现GPU的硬件结构能够适应极高并行度与大量浮点吞 吐的运算环境,更多的科学研究领域已经开始大量采购GPU设备应用于电脑辅助 、油气勘探、金融安全评估等领域。至此,GPU存在的意义已远远不是为图 形运算服务这么简单。 高端显卡设计经验 第二章 高端显卡的简介 5 第二章 高端显卡的简介 2.1 认识显卡(通俗易懂) 为什么我们需要独立的高端显卡. 我们在显示工作画面的时候,渲染复杂的画面的时候,需要高端的独立显卡 帮助我们硬件加速完成这项出色的任务. 我们把集成显卡和独立显卡分别比喻成能载 10 吨的小型货车和一个能载 80 吨的大型卡车,在安排一个 5 吨重的稻谷(轻载), 货车和卡车都很容易运输.但 是在安排一个 50 吨的稻谷运输(3D 重载)的时候. 小型货车这时候一次性就很难 运输.但是大型卡车还是可以很容易一次性运输完成任务.这个比喻虽然不是很恰 当.但是我相信应该是可以理解大概的意思. 显卡是如何帮助我们画画的. 显卡的通俗易懂的原理: 把显卡比喻成为画画的画匠.比如画一个人,画完了身体的轮廓,接着就要画 皮肤了,然后就给皮肤配上颜色.大概一个人的模样基本确认了. 显卡的工作过程大概是这样的 2.2 显卡GPU的工作原理(专业化) 简单的说:GPU主要完成对3D图形的处理——图形的生成渲染 GPU图形流水线的工作原理: 1、顶点生成 2、顶点处理 3、光栅化计算 4、纹理帖图 5、像素处理 6、最终输出. 图2.2 高端显卡设计经验 第三章 设计显卡的前期准备工作 6 第三章 设计显卡的前期准备工作 3.1 显卡关键元器件及重点参数介绍 3.1.1 GPU:图形中央处理器,实现显卡所有的图形计算功能; AMD/NV 封装:BGA; 功率,电压,支持的显存类型;核心及Memory接口工作频率; 主机接口及输出接口:PCI Express、VGA、DVI、HDMI、DP 极限工作温度;API 3.1.2 Memory:存储GPU处理的临时图形、图像数据; 主要类型:DDR2 DDR3 GDDR3 GDDR5; 封装:FBGA 组织结构:总容量=地址容量 x 位宽 速度:通常以ns为单位;频率:速度的倒数;带宽:频率 x 2 x 位宽 3.1.3 PCB 作用:各电子料的载体,连接显卡上各种电子元器件以形成完整的电路, 一般用型号和版本来区分;型号:BD3xxx(GPU,Memory,输出接口); 尺寸大小:符合PCI Express,金手指:PCI,AGP,PCI Express; 厚度:符合PCI Express标准,层数(4,6,8,10),颜色 PCB工艺:板材;表面处理:OSP抗氧化无铅工艺;层叠及阻抗控制; 3.1.4 散热器 类型:主动(风扇)、被动(散热片);尺寸,材质,散热系数 散热功率;噪音;温度控制(风扇) 3.2 电源部分的关键元器件 显卡开关电源的拓扑结构: 高端显卡设计经验 第三章 设计显卡的前期准备工作 7 3.2.1 PWM IC PWM控制器:产生方波,控制上下两个开关的通断,通过调节通断时间 使输出的电压保持稳定; 工作电压,驱动电压;开关频率;门驱动能力;过载保护; 封装及散热能力; 3.2. 2 MOSFET MOSFET:在开关电源中作开关使用,能够通过较大电流; Vds及Vgs电压;Rdson:越大MOSFET的温度越高;Ciss: 越大要求PWM的驱动能力越强;Qg越小越好. Id越大越好. 3.2.3 LDO IC 输入输出电压范围;输出电压精度;输出电流;耗散功率;工作温度 3.2.4 电感 功率电感:隔离输入和输出级,存储能量; 电感值:越大纹波越小;电流:大于负载的电流需求;DCR; 3.2.5 电解电容 电解电容:在电源的输入和输出级作滤波和存储能量使用。 电容值;额定工作电压;ESR;纹波电流;工作温度;寿命; 3.2.6 电阻 电阻值;精度;耗散功率; 在电路中的主要作用:分压,限流;信号电平设置,防止误操作; 终端匹配,保护信号完整性。 高端显卡设计经验 第三章 设计显卡的前期准备工作 8 3.2.7 陶瓷电容(MLCC) 电容值;工作电压;精度;工作温度; 在电路中的主要作用:滤波,去耦;交流耦合;储能 。 3.2.8 磁珠(Bead) 阻抗,通常是100MHz小的阻抗;直流电阻;额定电流。 作用:用于抑制信号线、电源线上的高频噪声和尖峰干扰 ★ 如下图是没有风扇的显卡,其他电子器件都完整的显卡. 图3.1.1 3.2 高端显卡新技术的了解 高端显卡现在的发展速度是飞快的,归结起来有功耗的增加,性能提升,频率 的增加,电压的降低,节能的设计,工艺的提升,散热的增强,成本的降低等,其中频 率的增加和功耗的增加会影响高端显卡稳定性问题的两大主要因素。 所以,在设计过程中,我们需要了解高端显卡新技术的应用,的评估. 3.2.1 影响整卡性能的参数(软件) GPU及Memory频率:频率越高,显卡性能越好,功率越大,需要的散热器更好; Memory的容量及带宽,容量越大,带宽越高,整卡性能越好; 3.2.2 影响整卡性能的参数(硬件) 电源设计:输出越稳定,超频性能越好; PCB:阻抗控制越好,Memory超频性能更好,输出的图像画面质量更稳定; 散热器:散热性能越好,整卡运行更稳定,寿命更长; 高端显卡设计经验 第三章 设计显卡的前期准备工作 9 3.2.3 PCI Express的结构 分层结构: 事务处理层 ECRC负责端到端的错误检测 负责流量控制: 发射与接收端都设有VC Buffers, 接收端回告诉发射端它Buffers 的情况, 免除溢出导致数据丢失QoS: 在TLP Header中其中有3bit标签了分组包 的TC等级(TC0-TC7), 按照不同的TC等级分配不同数目的VCs资源与优先传送 次序 8数据链路层 LCRC负责链路上的错误检测, 即每一跳是否出现错误 ACK确认接收无误与NAK确认接收错误, 出 错则再尝试传送, 确保可靠无误的传输 8物理层 PCI Express物理层功能 物理层: 分2个子层: 所以物理层芯片的升级将不会影响数据链路层 逻辑子层负责链路重置, 初始化与同步,设置链路速率,宽度,与多路相差校正, 8B/10B编解码, 扰码等电气子层差分信令,嵌入式时钟, 8b/10b编码 双单工: 1个通道由1对收,1对发差分对所组成,1个链路可由多个通道所组成:x1, x2, x4, x8, x16, x32 PCI Express物理层通道结构 PCI_E 2.0传输速率: PCI-E x16: 8GB/s (500MB/sX16) 3.3 电源设计中必须理解和掌握的知识 过去几年中,GPU 的性能得到了显著提升,而性能的提升也使图形控制器 Rx Tx Tx Rx 高端显卡设计经验 第三章 设计显卡的前期准备工作 10 的稳压器愈加精密和复杂。电源设计者面临的最大挑战是,如何实现更大的电量、 更紧密的容限和更快的瞬时电流,同时降低电源的总体成本。 以下是电源设计所面临的主要挑战: • 增大输出负载电流。 • 增大负载瞬时电流。 • 增大负载瞬时电流的压摆 (slew) 率。 • 更低的输出电压。 • 更小的输出电压余量。 • 相应减小占用 PCB 的空间。 • 散热。 3.3.1 从AMD/NV获得公板设计资料design kit. 3.3.2 熟悉整个GPU的芯片组的总体硬件架构,了解整个高端显卡的功耗. 3.3.3 掌握公板最新用到的技术,比如VID电源/VRM电源、数字电源. 3.3.4 了解设计的用到芯片参数.电源部分的原理.把GPU、memory、PWM等规格 书下载,联系供应商,需要获得一些资料,对不懂的知识要做全面的了解. 3.3.5 从产品经理得到产品规格书.根据客户的需求设计出性能稳定的高端显卡. 3.3.6 显卡电源设计的流程图: 3.3.6 Multi – Phase PWM运用的原理: 绘制电路图和布局 从 AMD/NV 获得 产品的功率数据 使用功率估算表格设 计估算是否 OK 确定拓扑 ,分配并检查 每条线路功能的估算 机械检查 通过 接受BOM成本和设计 优化 确认设计 测量实际数据 按需要调整设计 验证最终设计 高端显卡设计经验 第三章 设计显卡的前期准备工作 11 2011-4-8 8 Channel 1 IL1 IL3 IO IL2 UGATE LGATE Drive Channel 2 UGATE LGATE Drive Channel 3 UGATE LGATE Drive Ripple frequency and cancellation Multi – Phase PWM IL2 IL1 IL3 IO 图3.3.1 图3.3.2 9 Ripple frequency and cancellation Vout Ripple Phase Node Phase Voltages V_out Ripple 4 Phase3 Phase Multi – Phase PWM ◆ Current sharing ◆ Reduce voltage ripple ◆ Reduce input and output capacitor ★★★ 图 3.3.3 高端显卡设计经验 第三章 设计显卡的前期准备工作 12 从图3.3.3的测试结果中容易看到. ① 3Phase的电源的 phase 的overshoot比4phase的电源要差. ② 4phase输出电压比3phase的输出电压稳定. 3.3.7.1 举例 GPU Vcore 电源参数选定: COUT、LMIN、H/L-Side MOS、IRMS GPU Core VR Design _ COUT(MIN) 设计题目: 4-Phase VRM Design For 80A(IOUT (MAX) of AMD 89W GPU) 提取有效信息: 4-Phase, IOUT=80A, POUT=89W 求: COUT、LMIN、H/L-Side MOS、IRMS COUT(MIN) = [(1/phase) * Lout * IOUT _Design (MAX)^2] / [ VOUT * ᇞV] = (0.25 * 0.3uH * 80A^2) / (1.35V * 150mV) = 480u / 202.5m H*A^2/V^2 = 2370.37037uF < 680uF*6+10uF*11+4.7uF*3=4204.1uF (COUT of VRM at Hounds) ESR(MAX)=ᇞV / IOUT (MAX) = 150mV / 80A = 1.875m ohm PANASONIC EL-CAP(680uF/4V) ESR=28m ohm maximum under 100KHz, then we can get the number of capacitors need to load on 80A (AMD 89W GPU design) is: IRMS = (IOUT (max)/ phase) * [(phase * D ) – (phase * D)^2] ^1/2 = (80A / 4 ) * [(4 * 1.35V/12V ) – (4 * 1.35V/12V)^2] ^1/2 = 20A * [(4 * 0.1125) – (4 * 0.1125)^2]^ 1/2 = 20A * 0.4974937186 = 9.949874372A Ripple current of NCC EL-CAP(470u/16V) is 1140mA under 105 degree C and temperature coefficient 1.7 under 85 degree ambit temperature, then we can get the total ripple current of VRM Input CAP : 高端显卡设计经验 第三章 设计显卡的前期准备工作 13 1140mA*1.7*6=11628mA=11.628A > 9.949874372A 3.3.7.2 Input Choke Selection IRMS = 11.628A * 130% = 15.116A (30% saturation margin), So we choose 1.2uH/18A Choke. 3.3.7.3 Output Choke Selection LMIN = [(VIN – VOUT) * VOUT] / [VIN * IOUT (MAX) /4 * Fsw] =[(12V–1.35V) * 1.35V] / [12V * 80A / 4 * 200KHz] =14.3775 / 48000K=0.29953125uH so we choose 0.3uH/50A Choke 3.3.7.4 GPU Core VR Design _ High-Side MOS Pupper =Pconduction + Pswitching =Io^2*Rds(on)*D+1/2*Io*Vin*(Trise+Tfall)*Fsw = (80/4)^2* 0.0095 *1.35/12 +1/2*80/4*12*(6n+34n)*200K=0.4275+0.96(W) =1.3875W Tjunction (MAX) = Pd*Tja+Ta = 1.3875W*62.5℃/W+35℃ = 121.71878 ℃ Tcase (MAX)=Tjunction–Pd*Rjc=121.71878℃–1.3875W*2.5 ℃/W=118. 25003℃ We had two of DPAK MOSFET parallel on low side, then the result of Plower side is, Plower = Pconduction Plower=Io^2*Rds(on)*(1-D) =(80/4/2)^2* (0.0095/2)* (1-1.35V/12V) =0.4215625W Tjunction (MAX) = Pd*Tja+Ta = 0.4215625W*62.5℃/W+35℃= 61.34765625 ℃ Tcase (MAX) = Tjunction–Pd*Rjc = 61.34765625℃– 0.4215625W*2.5 ℃ /W =60.29375 ℃ 3.3.7.5 GPU Core VR Design _ Low-Side MOS We had two of DPAK MOSFET parallel on low side, then the result of Plower side is, Plower = Pconduction Plower=Io^2*Rds(on)*(1-D) =(80/4/2)^2* (0.0095/2)* (1- 1.35V/12V) =0.4215625W Tjunction (MAX) = Pd*Tja+Ta = 0.4215625W*62.5℃/W+35℃= 61.34765625 ℃ Tcase (MAX) = Tjunction–Pd*Rjc = 61.34765625 ℃– 0.4215625W*2.5 ℃ /W =60.29375 ℃ 高端显卡设计经验 第三章 设计显卡的前期准备工作 14 高端显卡设计经验 第三章 设计显卡的前期准备工作 15 3.3.8 常见的典型电路的设计计算: Resistor spec consider 电路图如右图3.3.4 I =V / ( R1+R2) PR1 = I2XR1, PR2 = I2XR2 Resistor direct voltage only can use for small current circuit Consider regulator VREF current when use resistor divider R1 : 432 ohm ,tolerance 1%, P=1/10w,size=0603 R7: 200 ohm,tolerance 1%, P=1/10w,size=0603 Vo =1.8V I=1.8V/(432 + 200)ohm = 2.84mA PR1=2.84mA2* 432 ohm= 3.4mW PR7=2.84mA2* 200 ohm= 1.6mW 图3.3.4 Capacitor spec consider EL cap 电路图如右图3.3.5 VRIPPLE = CESR X I Rated voltage must be careful for EL cap EC13 : 53m ohm ESR 越小越好,VRM部分使用的EL Cap約在 10mohm左右 I=2A,VRIPPLE=53m ohm X 2A =106mV 图3.3.5 高端显卡设计经验 第三章 设计显卡的前期准备工作 16 MOSFET spec consider Switch 电路图如右图3.3.6 VDROP = RDSON X I VGS = VG - VS >= MOSFET TRUN ON SPEC Q2 : N-MOS VDS (ON) :VGS > 5V, RDS = 65m ohm Q3 : N-MOS VDS (ON) :VGS > 7V, RDS = 30m ohm I =2A Q2 :VGS = 10V–5V=5V Q2 : VDROP = 65m ohm X 2A = 130mV Q2 : P = 22 X 65m ohm = 270mW Q3 : VGS = 12V – 5V = – 7V Q3 : VDROP = 30m ohm X 2A = 60mV Q3 : P = 22 X 30m ohm = 120mW 图3.3.6 MOSFET spec consider Regulator 电路图如右图3.3.7 P= (VIN - VOUT) X I If continue P >= 3W recommend use TO-263 package else TO-252 If continue P > 4W recommend use 2 set linear regulator or switch regulator Q10 : ID = 12A, Junction to Ambient = 60。C /W V out = 2.5 V;I out =4 A P = ( 3.3 V – 2.5 V ) X 4 A = 3.2 W 图3.3.7 高端显卡设计经验 第三章 设计显卡的前期准备工作 17 3.3.9 设计电路中经验list: 3.3.9.1 N沟道的CMOS选择问题 R892 0R C843 100NF C842 10uF_X6S R849 10K Q845 SI2304DS 1 3 2 R840 100K +12V_BUS +3.3V_BUS +3.3V ALL_RAILS_UP (18) DNI ALL_RAILS_UP 16V 402 X5R 图3.3.8 如上电路3.3.8图,在设计中,选择Q845料件的时候,一定要记得为选用Vgs>12V. 名称 SPECIFICATIONS 是否OK Si2304BDS PASS AO3402 FAIL 3.3.9.2 电阻封装设计选择问题 问题:在客户退回板卡中,发现位置REG911(AS432S)芯片坏, 一开机瞬间温 度上升到110度, R915也有90度.(R915的封装为0402 1/16W) 改善R915由原来75欧姆增加到150欧姆,实际测量REG911.温度为77度.降低 了.R915温度为94度. 图3.3.10 高端显卡设计经验 第三章 设计显卡的前期准备工作 18 3.3.9.3 时序电路极限情况 R857 4.7K C846 100nF Q851 MMBT3904 1 2 3 Q850 MMBT3904 1 2 3 R853 200R Q852 MMBT3904 1 2 3 R851 200R R852 1.62K R850 475R +3.3V_BUS +12V_BUS +12V_BUS PSEQ_OUT 1%1% 1% Node 2 5% 1% PSEQ_N1 Node 3 PSEQ_N2 PSEQ_N3 Node 1 图3.3.9 1,将问题显卡在华硕P5Q主板上测试,问题复现. 2,检查外观,没有发现明显制程问题. 3,测量电压信号,发现VDDC电压为0.05V. 4,检查MOS,电感,电容均没问题.测量发现pwm COMP/EN pin为0.03V 5,测量发现+12_BUS和+3.3_BUS均正常,分析时序电路,理论计算Q850的基极电压 Vbe=0.98V ,接近三极管的极限开通电压0.95V,同时,Q850,Q851的极限开通电压之 和为0.6V,接近Q852的最小开通电压,存在设计隐患. 6,更换电阻提升基极电压和电流使三极管达到深度饱和. 7,对更改后的不良卡进行如下实验:开关机100次,老化验证Run 3D mark06 12小 时,AMD DIAG,结果均PASS. 分 析 步 骤 8,使用更改后电阻,R850:2.32KΩ, R851:1KΩ, R852:11.3KΩ , R853:1.5kΩ 并进行小批量(100pcs)生产无异常. 更改电阻前 Q851:Vbe=0.98V Ib=1.97MA 极限情况: Ib=0.2MA Q850:Vbe=1.31V Ib=2.35MA 极限情况: Ib=1.25MA 更改电阻后 Q851:Vbe=1.31V Ib=2.12MA 极限情况: Ib=0.38MA Q850:Vbe=1.75V Ib=1.6MA 极限情况: Ib=1.33MA 高端显卡设计经验 第三章 设计显卡的前期准备工作 19 3.3.9.4 VGA模拟信号水波纹分析 1,发现在XP Desktop中,左上角上有很大的水波纹 2,调试LRC硬件没有任何改善 3,测试RGB信号,发现有一个300KHZ的频率干扰 4,观察BD3A05的PCB LAYOUT, 发现RGB信号走线靠近PWM的PHASE.PHASE的频率是300K 5,用铝箔纸抱住VGA CABLE.发现水波纹消失 分 析 步 骤 6,重新LAYOUT BD3A05.进行实验室评测.结果水波纹消失 3.3.9.5 显卡休眠唤醒花屏分析 1、将2PCS问题显卡(S03D和S004)在ASUS P5Q-SE PLUS主板上测试,300W的电源,XP 系统,驱动是8.68,对Run 3D mark06 2个小时,问题复现.将驱动改为Lenovo 8.732, 然后Run 3D mark06 测试40分钟,问题复现. 2、再一步分析,将问题显卡在Lenovo_G43平台上测试,在Linux系统下,循环Run 2 次 DIAG.2PCS问题显卡测试结果是PASS.在Lenovo_G43平台上测试,驱动为Lenovo 8.732,然后Run 3D mark06,问题复现. 3、将1PCS问题显卡变更VDDC电压,将电阻R610阻值由原来的78.7KΩ改为56.2KΩ, 电压由原来的VDDC=1.002V变化到VDDC=1.064V.然后Run 3D mark06,问题复现. 4、将问题显卡S03D拆下GPU,更换新的GPU测试,在Lenovo_G43平台上,Run 3D MARK06,测试3个小时未发现异常现象.socketboard(测试GPU的工具)验证拆下问 题显卡(S03D)的GPU, 循环DIAG Run 2 次,测试结果是PASS, 3D MARK06 测试3 个小时未发现异常现象.(目的是验证GPU是否不良). 将问题显卡S004,拆下GPU重 新植球上回原板测试3D MARK06,约20分钟出现死机.(目的是验证是否制程问题) 5、进一步分析,改变显卡的BIOS(把DPM动态电源管理Disable),更新2PCS问题显卡的 BIOS.在Linux系统下,循环Run 2次linux(P260_X32) Diag, 2PCS问题显卡测试结 果是PASS,在XP系统下,Run 3D mark06 , 测试3小时无问题,测试结果是PASS. 分 析 步 骤 6、老化验证分析,在环境温度为48度,平台Lenovo_G43为对2PCS问题显卡(S03D和 S004) ,更新BIOS(把DPM Disable),循环Run 3D mark06 12小时, 2PCS问题显卡 老化测试结果无异常.无3D 死机花屏的现象. 高端显卡设计经验 第三章 设计显卡的前期准备工作 20 7、经以上分析可以得知是由于BIOS中的DPM(动态电源管理)部分功能问题引起,存 在着DPM不稳定的问题,关闭DPM能解决3D mark06测试死机 此问题为GPU的 GPIO读写报错,是导致死机蓝屏问题的根本原因. 3.3.9.6 HDMI 黑屏现象分析 1.确认此板使用HDMI接口进WINDOWS 7或是VISTA黑屏 2.检查外观没有发现明显制程问题. 3.使用CRT接口进入WINDOWS 7或是VISTA显示正常,热插入HDMI接口设置双屏 幕复制和扩展显示均正常 4.万用表量测HDMI接口数据线正常,GPU照X-RAY没有发现制程问题 5.更换GPU test pass, GPU做Socketboard验证pass, 将GPU植株上回原板不良现象依旧,进WINDOWS 7或是VISTA黑屏 6.将原驱动卸载重新安装驱动test不良依旧(driver ver:8.68) 7.测试AMD DIAG PASS.超频也PASS. 8.以上,初步分析为GPU与显卡兼容性问题 3.使用CRT接口进入WINDOWS 7或是 V ISTA显示正常,热插入HDMI接口设置双屏幕复制和扩展显示均正常 9.分析.最后分析是BIOS的SSC的打开.导致HDMI黑屏现象. 分 析 步 骤 10.设计总结.虽然更改驱动,更改BIOS,更换GPU可以改善黑屏问题, 但是在设计前期,尽量考虑问题全面,避免一些无法预知的bug. 高端显卡设计经验 第三章 设计显卡的前期准备工作 21 3.3.9.7 LDO +5V电路设计分析 F10 D4101 2 1 +5V_VESA R2014 0R VGA G3179C219-005 R 1 G 2 B 3 MS0 11 MS1 12 MS2 4 MS3 15 NC 9 HS 13 VS 14 VSS 5 VSS#6 6 VSS#7 7 VSS#8 8 VSS#10 10 CASE 16 CASE#17 17 C95310uF C869 1uF_6.3V C870 1uF_6.3V C871 1uF_6.3V If using diode stuf f a 470 or 680 on R382 +5V_VESA+5V C833 100nF +VESA_IN R1 R2 603 603 +5V 5% 1/4W 1206 +12V_BUS Overlap footprints 16V 0603 Vout(V) = Vref (1+R2/R1) D863 5.1V 2 1 Place D861 inside MU830 or U830 R945 845R R947 845R R946 845R R906 ? R948 845R U812 AMS1117-5.0 SMD_SOT223_AOI-PL V_IN I G N D G V_OUT O R907 ? C954 10uF C638 10UF_16V R882 0R B1013 30R_3A R1013 0R 如上图是LDO +5V产生的电路. 方案一,原理上有保护,但是效果不是很明显,不能很明显起到保护芯片的作用 方案二,虽然有保护AMS1117芯片,但是相对于方案3的成本高.需要提高5V电压到 5.3V,由于二极管的压降导致的.可能会造成其他用5V电源的部分电路受到影响. 方案三,通过大量的实验证明,+5V_VESA显示器电路短路.必然会导致1206封装 的33欧姆的电阻烧断.这样会导致显卡的接口不显示.这样会导致客户不满 意,客诉比较多.优点不但有利用保护AMS1117芯片而且有利用成本的控制. 目前公司的设计是方案二,这样有利于品质的保证. 比较 R946/位置 D4104/F10/R2014位置 优点 缺点 方案一 0Ω电阻 保险丝 设计简单 显示器5V短路,芯片容 易坏 方案二 0Ω电阻 (1206) 二极管 芯片不容易,利用了 二极管的导电性. 需要调节+5V电源 方案三 33Ω电阻 0Ω电阻 设计简单.成本低 5V短路,电阻R946容易 烧断 高端显卡设计经验 第四章 设计显卡的前期准备工作 22 第四章 高速PCB的设计方法 现在的高速信号,PCB设计越来越重要,信号完整性对高速PCB有很高的要求. POWER 完整性也对是如此, PCB设计不合理会导致EMI无法通过, 4.1 高速PCB设计理念 正确的电路板布线原则以便尽量降低电磁干扰,作为高端显卡设计,必须学习 高速PCB的设计方面的资料.对基本的布线规则必须掌握.信号完整性需要相当的 了解. 比如:我们一想到高速PCB就知道,走线不可以走90度,走线越直越好, 尽量减 少任何信号的通孔数量,有阻抗要求.模拟信号和数字信号的隔离,差分信号,多大 的铜皮和通孔漏电流的大小,信号的线宽的要求:地线>电源线>信号线,参考层的 完整性.4层板的最基本层叠结构等等. 4.1.1 信号的完整性 现代高速信号的的特点:信号边缘速率越来越快,片内和片外时钟速率越来越高 系统和板级SI、EMC问题更加突出,电路的集成规模越来越大,I/O数越来越多,单 板互连密度不断加大,推向市场的时间不断减少,开发成本成为主要推动力,一次 性设计成功的挑战. 我们先熟悉一个最基本的原理:电源层与对应地相邻,保证了电源层与地的 阻抗最小.这样电源的完整性有了保证.然后信号层与地和电源作为参考层. 4.1.2 层叠和阻抗控制 我们先熟悉一个最基本的原理:电源层与对应地相邻,保证了电源层与地的阻 抗最小.这样电源的完整性有了保证.然后信号层与地、电源层作为参考层.保证了 信号的完整性. 保证了信号和电源的完整性.同时也保证了阻抗最小. POWER 完整性也对是如此, PCB设计不合理会导致EMI无法通过. 在高速PCB设计中,阻抗与信号质量密切相关.特性阻抗与路径PCB层.所用材 料的介电常数,路径层的厚度,线路的宽度,对间或对内间距以及线路和参考平面 的距离相关. 高端显卡设计经验 第四章 设计显卡的前期准备工作 23 这里我们只分析8层板的层叠结构. 8层板的层叠结构: 图4.1.2 *八层板:优选方案2、3、可用方案1 方案 电源 地 信号 1 2 3 4 5 6 7 8 #1 1 2 5 S1 G1 S2 S3 P S4 G2 S5 #2 1 3 4 S1 G1 S2 G2 P S3 G3 S4 #3 2 2 4 S1 G1 S2 P1 G2 S3 P2 S4 #4 2 2 4 S1 G1 S2 P1 P2 S3 G3 S4 #5 2 2 4 S1 G1 P1 S2 S3 G2 P2 S4 对于单电源的情况下: 方案2比方案1减少了相邻布线层,增加了主电源与对应地相邻,保证了所有信号层与地平面 相邻,代价是:牺牲一布线层; 对于双电源的情况: 推荐采用方案3,方案3兼顾了无相邻布线层、层压结构对称、主电源与地相邻等优点,但 S4应减少关键布线; 方案4:无相邻布线层、层压结构对称,但电源平面阻抗较高;应适当加大3-4、5-6,缩小 2-3、6-7之间层间距; 方案5:与方案4相比,保证了电源、地平面相邻;但S2、S3相邻,S4以P2作参考平面;对 于底层关键布线较少以及S2、S3之间的线间窜扰能控制的情况下此方案可以考虑; 高端显卡设计经验 第四章 设计显卡的前期准备工作 24 4.2 高端显卡PCB的实际check 4.2.1 信号部分的PCB check: 高端显卡对PCB的信号check是一个非常重要的过程.也是一个必要个过程. 这里是例举了信号部分的check. power的check这里就没有讲述,power需要根 据芯片的PCB设计规范来check,同时也需要学习相关的PI方面的知识. 关键信号的检查,EMI的顺利通过,同时对于这个产品是否可以大批量生产是 非常重要的. 4.2.2 对于CLK、TMDS、RGB 和 PCIe 差分对必须尽可能平直并且严格控 制线路阻抗。不能为了让差分对内长度相等而采用蛇形线路。此规则同样适用于 内存差分时钟。 4.2.2.1下图以黄色突出显示了内存时钟的差分对,它的线路阻抗不匹配. 图4.2.2.1 4.2.2.2 下图显示了 RGB 伪差分对,它们的线路阻抗是不匹配. 图4.2.2.2 高端显卡设计经验 第四章 设计显卡的前期准备工作 25 4.2.2.3 下图以黄色突出显示了 PCIe 差分对。它的线路阻抗不匹配 图4.2.2.2 4.2.2.3下图显示了 ASIC 端的 TMDS 差分对,它们的线路阻抗是不匹配. 图4.2.2.3 高端显卡设计经验 第四章 设计显卡的前期准备工作 26 4.2.2.4 下图显示了 DVI 接头端的 TMDS 差分对,A的线路阻抗不匹配,需要改 为B图. 图4.2.2.4 4.2.2.5 内存CLK信号和分割的参考平面,他们阻抗不连续.没有统一的参考层.没有连续的返 回通路. 图4.2.2.5 高端显卡设计经验 第四章 设计显卡的前期准备工作 27 4.2.2. 6 下图显示了差分对及其参考平面,关键网路与参考平面边沿之间的距离是不足够 图4.2.2.6 4.2.2.7 下图显示 RGB 线路的三个 EMI 滤波器的位置和ESD保护器件。这些滤波器与 DVI-I 接头和或 VGA 接头之间的距离是否足够近. 图4.2.2.7 高端显卡设计经验 第五章 高端显卡的设计方法 28 第五章 高端显卡的设计方法 熟悉了上面的一些知识,我们要对如下的一些知识了解并且掌握.对一些硬件 架构要有相当的理解.设计高端显卡,主要对一些散热,功耗方面的要求比较严格, 一些电源的设计不是很稳定等,这些会直接导致系统的稳定性.温度会影响电容寿 命,同时对芯片的寿命降低.PCB的设计占主要部分.一个好的产品是可以在非常 苛刻的条件下能很稳定的工作.如下是设计主要高端显卡的一些参考经验. 5.1 高端显卡的硬件架构 5.1.1 高端显卡的硬件架构如下图所示(附件有更详细的硬件架构): 5.2 设计中重点关注问题的总结 5.2.1 高端显卡的硬件设计需要注意如下的问题: ① 原理图的CHECK 电源方案是否至少有2种设计思路.设计电源是否有考虑电流大小,功耗问 题,电阻的封装是否够大流.是否有防呆电路.过温保护电路.时序电路中电路参数 设置是否正确.是否有温控电路.是否增加对显卡保护电路.ESD等等. 物料的复用率.检查封装. ② PCB layout的重点关注: 1,PCIE差分线信号.(线宽,线长,差分对线间距,参考层). 2,memory并行信号,地址线, 数据线,CLK,DQ,DQS.ODT等信号线,参考 层检查. BBIIOOSS DDPP DDVVII--II PPCCII--EE DDDDRR33//GGDDDDRR55 PPOOWWEERR DDVVII--II SSttrraappss CCrroossss FFiirree FFAANN SSppeeeedd ccoonnttrrooll CCTTFF PPoowweerr SSeeqquueenncciinngg CCiirrccuuiitt CClloocckk HHDDMMII AAMMDD GGrraapphhiiccss ssoorr 高端显卡设计经验 第五章 高端显卡的设计方法 29 防止电源干扰. 对有等长要求的走线(含时钟线、数据线等)误差应满 足时序要求 3,接口部分.TMDS信号,差分信号.VGA伪差分信号.模拟信号. 4,晶振部分的LAYOUT. 5,开关电源LAYOUT,检查phase信号是否远离Noise信号,VCC供点. RC电路是否靠近PWM芯片.采样信号是否远离大电流信号. 6,12V电源的线宽要大.减少阻抗. 走线宽度应满足载流能力 7,要关注EMI方面的问题.检查阻抗要求. 8,高速差分信号换层时候,需要增加回路过孔. 9,同类型的信号线走在一起(数据线、地址线、总线), 不同类型的信号(如模拟与数字)应分开走线,防止相互干扰 10,相应的泪滴是否有增加. ③ BOM的检查 检查元器件的封装,精度,高度.是否符合客户的AVL,电容的电压范围等. ④ 高端显卡的第一打样需要重点关注的问题: 1 观察PCB设计是否合理.元件摆放是否有干涉.是否适合批量生产. 2 对有高度限制的零件是否有符合.电容,电感的高度是否会影响散热器. 是否会引起电源短路. 3 波峰焊是否会引起一些短路现象. 4 实际板元件的封装和PCB的封装是否保持一致. ⑤ 在第一片高端显卡开机的时候,需要重点关注如下: 1,再一次仔细认真核对BOM.特别是电源部分,一些分压的电阻, 2,目检焊接状况;产品是否有漏件.空焊等. 最好建议是至少有1PCS空板,无GPU和MEMORY的显卡. 目的是把电源调节OK以后才上电.这样比较安全.不容易破坏GPU和 memory芯片.也不容易烧毁PCB.因为高端显卡都是大电流的板卡. 3,测量电源是否短路.电源拓扑结构元器件是否有连锡,是否有空焊短路. 检查电源芯片是否有短路,空焊现象.芯片是否反向. 4, 检查风扇的是否OK.样品的风扇有可能是不良品. 高端显卡设计经验 第五章 高端显卡的设计方法 30 5, linux LOOP测试,超频测试,Windows 3D测试,高低温测试. 6,实验室样品评测.根据客户的需求按照要求测试. 7,最后要全部功能测试OK的高端显卡送给客户. 8,高端显卡的上电,严格按照一定流程; ⑴ Inspection board visual (显卡外观检查) 检查显卡是否漏打元器件, 例如: 电容、电阻、二极管…… ⑵ Voltage/Signal Check(电压/信号检测) (3.3V、12.0V、VDDC、MVDD、LDO1.0、
/
本文档为【高端显卡设计经验论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索