容错设计
⑴ 容错是什么意思容错
概述
容错既是一种彩票专业术语又是计算机行业的专业术语。
容错是彩票软件运算中条件过滤保护机制的一种高级模式,在彩票专业术语里指用户选择了N个指标,并指定了其中允许出现错误的条件个数范围,在这种情况下的最终结果依然是正确的。
容错参数格式:A-B(其中A必须小于B,而且B一定不能大于用户选择的参与过滤的总条件个数。)
容错参数含义:前一个数字A代表错误的最小可能性,后面数字B代表错误的最大限度。只要错误的情况在这个范围之内,过滤后的结果中一定包含中奖号码。
例如:实战中一共选择了5个条件参与过滤,容错设置参数为0-2,那么前面的参数0表示这5个条件中错误的最小可能性为0,即没有错误发生;后面的参数2表示这5个条件里允许错误的最大限度为2个,即可能有1个条件或2个条件是错误的,但是不能超过2个,如果实际操作中的条件错误个数范围在0-2之间,那么过滤后的结果一定包括中奖号码。
再如:实战中一共选择了6个条件参与过滤,容错设置参数为1-3,那么前面的参数1表示这6个条件中错误的最小可能性为1,即最少会有1个条件是错误的,但是不知道是哪个条件错误;后面的参数3表示这6个条件错误的最大限度为3个,即可能有1个条件或2个条件或3个条件是错误的。如果实际操作中的条件错误个数范围在1-3之间,那么过滤后的结果中也一定包括中奖号码。
优势:
1.对于彩票,即使选择的条件有意料中的错误,中奖号码也会在容错后的号码组里。
2.对于计算机,当系统出现数据、文件损坏或丢失时,使用容错技术能够自动将损坏或丢失的数据和文件恢复到事故发生前的状态,使系统能够保持连续正常的运行。
缺点:
一、容错后过滤结果的号码注数随着容错参数设置的变化相应地增加了。
二、容错在计算机中指系统恢复文件的错误,存储在计算机中的文件或者在网络中传输的文件有可能因为故障或者干扰信号等的影响而发生错误或者丢失,此时一般情况下系统能够自动恢复文件,但是文件错误严重时候必须认为恢复或者文件彻底丢失。系统的恢复能力就是容错能力简称容错。
IT含义
容错(fault-tolerant)描述的是一个电脑系统或组件,它们被设计用来在组件发生故障时备用组件或程序能够立即代替它,这样就不会耽误它的服务。容错可以通过软件或嵌入硬件来提供,也可由一些组合来提供。
当执行软件时,操作系统提供一个界面,这个界面允许程序员在事务中预先确定的地点“检查站点”的关键数据。在执行硬件时(如Stratus 和它的VOS操作系统 ),程序员不需要知道机器的容错能力。
在硬件层上,容错(fault tolerance)通过转接各个硬件组件来实现。磁盘被镜像。多处理器以锁步(lock-stepped)的方式运行。当异常情况发生时,错误的组件被确定并从服务中删除,同时机器能继续正常运行。
⑵ 在微型计算机控制系统中,采用容错设计有何意义
提高可靠性,故障的时候有备用控制
⑶ 冗余 和 容错 的区别
区别:容错主要依靠冗余设计来实现,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。
硬件冗余是通过硬件的重复使用来获得容错能力。
软件冗余的基本思想是用多个不同软件执行同一功能,利用软件设计差异来实现容错。
信息冗余是利用在数据中外加的一部分信息位来检测或纠正信息在运算或传输中的错误而达到容错。在通信和计算机系统中,常用的可靠性编码包括:奇偶校验码、循环冗余码CRC、汉明码等。
时间冗余是通过消耗时间资源来实现容错,其基本思想是重复运算以检测故障。按照重复运算是在指令级还是程序级分为指令复执程序复算。指令复执当指令执行的结果送到目的地址中,如果这时有错误恢复请求信号,则重新执行该指令。
程序复算常用程序滚回技术。例如将机器运行的某一时刻称作检查点,此时检查系统运行的状态是否正确,不论正确与否,都将这一状态存储起来,一旦发现运行故障,就返回到最近一次正确的检查点重新运行。
冗余设计可以是元器件级的冗余设计,也可以是部件级的、分系统级的、或系统级的冗余设计。冗余要消耗资源,应当在可靠性与资源消耗之间进行权衡和折衷。
容错系统工作过程包括自动侦测、自动切换、自动恢复。
⑷ 在设计过程中 如何进行容错性设计
即便你的产品90%的时间都运行良好。但是如果在用户需要帮助时置之不理,他们是不会忘记这一点的。——《 real》 我们有时候不能不面对产品出错的时候。无论设计得多么用心,无论做了多少测试,用户仍然会遇到错误和问题。既然出错不可避免,那么如何进行容错性设计才是关键。 容错性设计就是当错误发生时,人们看到的界面。 就像对付不该发生的错误一样,容错性设计的关键在于“做好防御”。产品设计者们必须不断寻找可能造成用户困惑和不满的出错点。好的防御性设计决定用户体验的好坏。 举个例子: 有没有人注意过进入银行ATM机可以有多少种刷卡方式。答案是八种!而正确进入方式只有一种方式。 如何从设计上避免用户出错,限制是一种非常必要的方式。 限制用户某些交互操作 SIM卡如果做成一个倒角避免了长方形带来多种插入方式的错误。 三项插座和相应插孔的匹配避免了用户使用两项或其他插座错误的可能。 置灰是界面上限制某些操作的好方式。 Flickr的照片上传wizard,防止用户跳过第一步直接进入后面操作,采用置灰的方式。一方面告诉用户这可以进行当前操作,另一方面预示后面还有哪样的操作。 其次,减少认知困惑也很重要。 减少用户认知混淆 根据已订阅和未订阅的不同,订阅button和退订进行视觉上明显的区分,避免错误操作。 合理利用系统反馈 如果错误不可避免的发生了,,合理恰当的提示可以减少用户的挫败感。 1、提前提示某些操作可能引起错误。 在输入密码需要区分大小写时,caps lock键打开下作出提示以免出错。 2、防止用户错误,操作后提示确认。 在用户点击发送后提示没有输入主题信息,防止用户直接发送无主题邮件。 3、不仅要反馈出错,更要给用户解答。 最好能够告诉我,具体错误的原因在哪里,是那句话和字出现的问题。 4、给予用户适当指引和建议。 当用户搜人没有结果的时候,引导用户继续查找或者 邀请好友。 当用户搜索无结果时,智能猜测用户的出错原因或者给予其他引导。 人非圣贤,孰能无过。用户是产品的上帝,如何通过设计减少用户的出错后的挫败感。错误永远是产品的,宽容用户的错误,不容忍产品的错误。
⑸ 如何实现企业级网络系统容错性设计
如何实现企业级网络系统容错性设计 合…信鲥合23bool 合肥市电信局计算中心(合肥)l 摘要文章以争肥市电信局计算机综合管理网络系统为例,详细说明 了客错网络的基本概念,设计原J0,jg 具体 的实现方法,具有普遍的指导意义. 关键词冗余链路FDDITRUCLUSTERRAID5 l 前言 近年来,随着全国范围内企业级网络系统建设的蓬勃 发展,网络系统的容错性日益受到人们的关注.据美国IDC 公司的统计数字表明,6%的数据丢失可归咎于网络.因此, 一 个没有高可靠性的网络系统是一个不完整或不完善的 网络,而容错技术则是提高网络系统可靠性的关键. 合肥市电信局作为安徽邮电省会局,拥有市话,移动 等各类用户40 多万,其帐务,号线等业务数据非常庞大. 由于电信行业具有覆盖面广,业务繁多,实时性强等特点, 在建设合肥电信”九七工程计算机网络系统过程中,合肥 局对业务数据的安全可靠提出了很高的要求.一旦网络故 障,造成数据(尤其是帐务数据)丢失,系统中断,由此造成 的损失是不可估量的.因此,提高整个网络的高可用性,建 设具有高容错性能的网络系统,势在必行.那么如何设计 一 个高性能,高容错的网络系统呢? 2 容错网络设计的一般原则 所谓网络的容错性即是寻找最常见的故障点,通过冗 余度(Redtmdancy)来加强它们,以最大限度地缩短网络故 障的持续时间(downtime).为了避免各种故障造成数据的丢 失或出错,甚至网络的瘫痪,必须果用各种冗余措施来提 高网络的容错能力.影响网络系统容错能力的因素很多, 其中包括:用户到网络中心的数据链路如何冗余,网络中 心枢纽如何容错,以及网络主干,网络服务器如何容错等 等. 作为网络容错性设计,其一般原则如下: (1)并行主干,双网络中心. 网络中心是整个网络系统的核心,具有突出重要的地 位.为了加强网络中心,可采用并行网络及冗余网络中心 的方法,将每个用户同时连到两个网络中心上,以提高整 个网络系统的容错能力. c2]多数据链路,多路由的广域网互联. 边界网络至网络中心采用多数据链路,多路由的连接 方式,任一数据链路的故障并不影响局部网络用户的正常 使用: c3)采用具有模块化结构,热插拔功能的网络设备. 网络设备的模块化结构,热插拔功能,不仅使您拥有 灵活的组网方式,而且使您能及时更换故障模块而不用切 断电源.以提高网络系统长时间连续工作的能力. (4]网络服务器采用新技术. 网络服务器通过采用双机热备份,双机镜像和容错存 储等当今计算机最新技术来增强网络服务器的容错性能. 9419995 计算机工程与应用 根据以上原则,结合电信局的实际情况,笔者等成功设 计与实现了具有高容错性能的合肥市电信局计算机综合管 理网络系统. 3 容错网络系统的结构及组成 该系统为企业级局域网,采用了当今最为流行的高速 网络技术FDDI 为网络主干.以大钟楼,黄山路局为双网络 中心的结构模式,12 个远端分局则以双E1 链路覆盖.网络 系统的设备选型对提高整个网络系统的性能至关重要,经 过多次调研,笔者选择了美国着名网络厂商CISCO 公司 的各种高,低档网络设备及美国DEC 公司Alpha2100 系 列小型机.网络结构如下:(见下一页) 3.1 并行网络主干 主干网络由位于两个网络中心的4 台Alpha2100 系 列小型机与3 台CATALYST5OOO 和CATALYST1200 交换机通过FDDI 双环互联组成.FDDI 作为一种成熟的高 速主干网络技术,以其传输速度快,传输距离远,抗干扰性 强等特点,在全国范围内得到广范的使用,其特有的主,副 双环结构,使它具有良好的”自愈”功能,当主环发生故障 时,备环能即时启动,因此,FDDI 具有极佳的容错性.极适 合用于大型企业的网络主干. 3.2 双网络中心 该系统承担着各种大量的实时性,可靠性要求很高的 业务数据信息及数据的传输工作,尤其是业务数据中心, 如出现网络瘫痪,其后果不堪设想.因此,笔者建立了大钟 楼,黄山路双网络中心的结构模式.它分别由两台美国 CISCO 公司的高端路由器CISCO7010 和高性能交换机 CATALYST5000 组成,这样任一网络中心的故障甚至瘫 痪,并不影响整个网络正常使用.另外CISCO7010 路由 器,CATALYST5OOO 交换机均为CISCO 公司的高端产 品,均具有模块化,插槽式结构和带电热插拨的能力,不但 灵活性很高,而且排除故障非常方便,为网络的高可靠性 及高容错性的可靠保证. 3.3 双E1 数据链路,双路由 合肥市电信局共有12 个远端分局,为了提高各分局 网络与中心网络的可靠互联,笔者采用了”双E1 数据链 路,双动态路由”的广域网互联方式.每个分局的CISCO 2514 路由器均通过两个E1 通道与两个网络中心的CISCO 7010 互联.这样,即使任一个E1 链路断开,也不会影响各 分局网络系统的正常使用.另外,对于CISCO2514.和 CISCO7010,均果用了”双动态路由,负载均衡”的配置方 式,实现了局间数据在双E1 链路上的自动均衡分流.目 此,不仅大大提高了广域网络的容错性,而且使网问流量 增大了一倍,优化了网络. 3.4 小型机系统的容错 小型机数据库服务器不但是整个综合应用系统的核 心+也是网络系统容错性设计的关键,根据合肥市电信局 目前的业务规模及今后若干年的远景规划,笔者选择了4 台美国着名DEC 公司的新一代Alpha 系列小型机作为数 据库服务器:黄山路的两台DiotalAlpha2100A5/250 和 大钟楼的两台ni6t,dAlphn2100A5/300.这4 台小型 机以DAS 方式分别连接在两网络中心的FDDI 主干上.采 用了”双机容错,异地容灾”的结构模式,保证了业务信息 资源的可靠性,从而极大提高了网络的容错能力. 为了提高连续不断的数据可用性,最大限度地降低故 障停机时间和实现最高水准的设备使用率,以确保业务数 据的安全可靠+小型机系统采用了当今世界上最新的容错 技术: fI)双机集群TRUCLUSTER 技术 DEC 公司是小型机双机集群CLUSTER 技术的先驱,其高容错性能的TRUCLUSTER 技术,极大地提高了系统的容错能力和业务 数据的可靠性.因此,两个网络中心的两台 小型机均采用了DEC 公司TRUCLUSTER Ver1.4 的产品.两台小型机数据库服务器采 用松耦合的方式,以内存通道MCe Channe1)互联,真正实现了对共享磁盘阵列 的实时,并行访问+为小型机采用并行数据 库提供了技术上的支持. (2)ORACLE 并行服务器 ORACLE 数据库系统是较完备的关系 型数据库系统.因此,笔者选用了它的并行 数据库ORACLEVer7.3.2.3,ORACLE 并行 服务器允许多节点上同时并行访问一个数 据库,它除了提供标准的ORACLE7 所具 有的强大的包括EXPORT&IMPORT,镜像备 份和归档(hot&cold)在内的各种数据库备份 与恢复功能外,还提供其独特的容错特性,如 高可用性和自动联机恢复.当某个节点或实 例发生故障时,运行实列的后台进程SMON 会监测到这个故障,并自动恢复该故障实 列. (3)独立磁盘冗余阵列—RAID 对于双机集群的容错系统,为了获得高 性能的I/O 和较高的存贮能力,采用了当前 计算机I/0 的最新技术—独立磁盘冗余技 术RAID.根据组成RAID 的结构不同,可以 把RAID 分成各个等级.为了充分利用阵列 的磁盘空间,又能够提高磁盘阵列的容错性 能,可以选择RAID5.每个RAID5 由多个 数据盘和一个Spare 空闲盘组成,而无校验 盘,所有的检验信息分散于每个数据盘中, 因此所有数据盘可以同时进行读写.一旦任 一 数据盘出现故障,RAID5 就可以利用余 下数据盘中的校验信息,在spare 盘中恢复故障盘中的所 有数据,因而提高了磁盘阵列的容错能力. 4 结束语 根据网络容错性设计的一般原则,采用当今各种最新 的网络冗余技术,笔者成功地实现了合肥市电信局计算机 综合管理容错网络系统设计.事实证明,经过一年多的运 行,网络系统的高容错性为合肥电信”九七工程”的顺利运 行,提供了可靠性的保证,从而成为全国电信”九七工程” 中独具特色的范例.(定稿日期:1998 年3 月) 参考文献 1.L~DavidJ.Stang,s.Moon.NetrkSeeufi~Secrets. 电子工业出版杜缩 2.[美lLAuRAA.CHAPPEL.Novell’sGuide【nMdtipmt— oeollmernetworldng.电子工业出版社编 合肥市电信局计算机综合管理系统网络拓扑图 太钟楼局计算机中心黄山路局网络中心 三孝口局铜陵I 局……寤惦局 计算机工程与应用1999.595