在拿到不良MB之时,请不要急于上电!应当先用眼睛仔细观察板面,有可能的话,用一块OK的MB比对着,看板面上的焊接情况以及零件的摆放状况(尤其是多件、错件、漏件和反件),因为很多Bug的产生都可以归功于这些问题!有些仅仅是零件反件,由于Debug人员急于求成,把NG MB拿来就上电,导致了元器件损坏,从而要花好几倍的时间精力来Debug……如果养成了Eyes Checking这种习惯,则可以大大提高Debug的效率。
关于“不显示和显示NG:
当试产MB在F/T被判为不显示时,往往仅是LCD Panel没有图像出现,并非MB的显示功能NG,例如CPU、RAM没插好也会导致此现象,所以:
不显示定义为当Debug Card跑过60H时,显示器始终没有画面出现;或者是由于某种原因使POST无法跑到60H。
显示NG指的是显示器上有画面出现,只是画面不清晰或者花屏;另外一个就是LCD、CRT、S-Video无法切换或者Error ID等。
Display Problem Debugging
一、看Power是否OK;
用万用表量每一个Power Net的对地阻抗,用良板作比对,则可以知道短路与否。有一个判断Power有没短路的最快捷的方法是使用Power Supply,看其显示的电流值:
如果电流值偏大,则表示Power有短路,应立即移除ADP;用万用表量每一个Power Net,看是哪个Net短路了;确定短路Net后,找到相关电路,将Bead一组组断开,直至找到短路的地方,然后将损坏的元器件更换。
如果电流值偏小,则表示有些Power没起来,依旧用万用表把它找出来。
有关Power方面的Debugging会在今后完成。
二、POST无法跑完造成的不显示;
(一)Debug Card的LED不亮;
在Power OK的情况下,Debug Card的LED就会亮起来。如果不亮,可能是Mini PCI插槽或Debug Card本身的问题;还有可能是用了不兼容的CPU或RAM等,那样会导致LED不亮或者显示一些很古怪的符号。。。
(二)Debug Card显示FF(00);
Debug Card 显示FF(00)表示CPU连第一道指令都没有去执行。
思路CPURST# <—> PLTRST# <—>PCIRST#
第一步:(请参考流程图及其解释)
去量CPU复位信号CPURST#:如果OK,则跳到第二步,应该可以用万用表量到CPURST#的电压值有1.05V(Napa大概是1.5V);如果 CPURST#量不到,则先在非BGA封装的PCI Device Controller Pin脚上量PCIRST#:如果没有量到,则说明PCI总线上有问题,先去看南桥的晶振、Clock信号、是否植过球(见下面的注释)以及怀疑其焊接问 题,假如都OK,就要去一一断开每个PCI Device与PCIRST#的连接,确定是哪个Device影响了PCIRST#;如果PCIRST#有量到,则去看北桥复位信号PLTRST#有没从 南桥发出:如没有发出,则依旧要看南桥本身的问题;如PLTRST#有发出,则看北桥有没收到。可以去量传送PLTRST#线路上连接北桥和南桥的电阻。 如果北桥收到PLTRST#却没有发CPURST#,则需要去看北桥的晶振、Clock信号、是否植过球以及怀疑其焊接问题,排除这些问题之后,就跳到第 二步。
注释:有时板子上BGA Chip点了彩色的点,灰色的点表示Chip曾经被更换过,绿色或者红色的点则表示该Chip是工厂回收再利用的(经过重植球),极有可能本身就是坏的。点的颜色所代表的意思并非统一的,要看工厂怎么定。
第二步:
CPU本体OK,而且收到了CPURST#,Debug Card还是FF(00),则有可能是CPU或北桥的外围电路有问题,例如REF、TEST、COMP、CFG等。
CPU GTLREF and TEST
CPU COMP[0,3]
North-Bridge H_VREF
North-Bridge Strap Pin
North-Bridge H_XSCOMP/H_YSWING
另外一种可能是CPU和北桥之间的Data、Address信号沟通有问题,造成此问题的原因是CPU Socket、北桥或者PCB Trace的问题。(请参考流程图及其解释)
我们必须对HA#[3..31]和HD#[0..63]一一进行测量,来确定问题所在。这是一个处理起来很麻烦的问题,因为HA#[3..31]和HD# [0..63]一共有96根,而且万用表无法插入CPU Socket进行测量。所以,一种辅助工具——CPU Pin Saver(Pin护套,见Figure.2),应运而生!
将CPU Pin Saver插在Socket上,按照上面的标记(见Figure.3、4:Dothan或Celeron参考Figure.3的铅笔划的斜杠,Yonah 参考Figure.4的大黑点A/D 0.255V左右),测量HA#[3..31]和HD#[0..63]一共96个点的对地阻抗。(在这里,一般会把万用表打到测量二极体的那一档,用电压 信号代替阻抗信号,因为这里的阻抗有时候不好显示出来。只要电压信号跟好板子的差不多就OK了。短路了电压就会很小,断路则没有电压。)如果量到CPU Pin Saver某点对地短路了,则有可能BGA内有连锡了,先找到与该点相连的Via,再将CPU Socket吹下来,来确定是CPU Socket短路还是北桥短路;如果量到CPU Pin Saver某点断路了,则表示有空焊了,需要去看该点和改点Net相对应Via,来确定是CPU Socket还是北桥空焊或者是PCB的Trace断裂。(见Figure.1,本人制作的关于CPU与North Bridge之间HA#[3..31]/HD#[0..63]的走线示意图,以方便大家理解)排除这些问题之后,就跳到第三步。
Figure.1 HA#[3..31] / HD#[0..63] From CPU To North-Bridge
Figure.2 CPU Pin Saver(Pin护套)
Figure.3 护套上代表HA#[3..31]和HD#[0..63]的孔都用铅笔连线作的标记
Figure.4 Yonah CPU Socket Reference