域控制器发生故障时确保继续复制活动目录（一）

dn001 2008-10-30 14:48:43 78 0

对管理员来说，他们最重要的工作能力之一就是要能进行突发故障的恢复，无论该故障是故意的还是偶然的。活动目录（AD）灾难恢复包括确保AD恢复的许多方面。比起只是留有备份，这要复杂的多。本篇是关于AD灾难恢复系列文章里的第一篇，这些系列文章包括了从如何确保环境保护到灾难损失方面的实用例子。

确保你能对任何故障，无论硬件还是软件方面进行恢复的最佳方法就是要抢先防备。设法让业务停工期的时间最短，最好没有停工期。在本文中，我们将讨论关于在关键域控制器发生故障时如何确保继续复制AD方面的问题。

密码和安全发生改变，安全策略以及关键配置设置通过组策略执行，FRS复制和AD复制都能使所有域控制器具有相同的组策略。因此，有理由相信它是企业的最大兴趣点，可帮助企业确保成功进行AD复制，并保留未遭破坏的部分。对公司来说，通常会创建灾难恢复站点，在整个组织“轴心”站点出现故障时，该站点可用于支持基础结构，关键应用程序以及数据。许多组织网络以重复轴心及轮辐网络方式进行配置，如图一所示。注意在某些配置中，多种轴心形成AD恢复的核心。多种核心轴心站点包含固有的灾难恢复配置。也就是说，如果一个核心站点出现故障，还有其他站点分担载荷。

对单一的轴心配置来说，灾难恢复的难题在于在网络链接良好的地方创建AD站点，至少与企业中的每个森林的每个域中的一个域控制器相连接。这就得包括至少一个通用目录服务器（GC），Exchange服务器和其他依赖于用来支持用户社区的基础结构中的打印文件或应用程序服务器。

假设我们选择了这样一个站点，并具备必需的服务器基础结构，我们需确定的一件事就是在主要轴心站点不可用时AD恢复会如何。记住，你不必非要等到对该站点的恐怖袭击会使其不可用，一个简单的网络故障或电力损耗都会使其出现问题。

你需要考虑哪里的网络是简单的中心辐射型拓扑结构。如果主要轴心站点发生故障，设计良好的DR站点可以继续工作。为避免轴心站点中所有域控制器发生故障，在考虑如何准备多余AD复制时要创建与主要轴心站点及DR站点之间的站点链接，如图二所示。这里我们发现将远程站点与主要轴心站点相链接起来的站点消耗为100，而那些将远程站点与DR站点链接起来的要消耗200。表面看起来很有道理。只要主要站点中的域控制器还在运行，就不会用到多余的链接。然而，在测试主要站点域控制器实效时，我们发现KCC计算出不同的拓扑结构，而不是本来想要的结构，这样就在远程站点之间而不是直接同DR站点建立连接。它无法进行纠正。在考虑为何KCC会以这种方式进行计算时会发现，AD复制规则中显示该错误是源于设计问题。

活动目录复制有一个内置的冗余特性，被称为站点链接桥（SLB）。如在任何给定站点中，域控制器出现故障，SLB允许KCC建立可传递链接，在不需人力操作的情况下，允许复制对出现故障的域控制器进行调整。当出现故障的域控制器是站点中唯一的域控制器（或者，如站点中所有域控制出现问题时），SLB就尤为重要了。看看图示三中的情况。有三个站点，ATL，CHI，以及NYC。假设物理网络将所有三个站点联结起来，一个站点链接联结ATL和CHI，一个站点链接联结CHI和NYC。ATL与NYC之间没有站点链接联结。只要CHI中的域控制器可用，复制就没有问题。但如果CHI域控制器发生故障怎么办？似乎ATL同NYC之间的复制也会无法进行，在没有SLB的情况下更会出现这种问题。如果SLB可用，KCC就要有所决定，因为ATL能复制到CHI，CHI复制到NYC，然后ATL又能复制到NYC。从ATL到NYC之间又会创建链接，消耗与CHI-NYC，ATL-CHI链接的联合消耗相等。