摘要:故障接触人员有:故障现场接触人员、初级支持人员、高级支持人员。
希赛软考网小编为大家整理了信息系统管理工程师的知识总结,希望能帮到未来的信息系统管理工程师们。
1、故障接触人员有:故障现场接触人员、初级支持人员、高级支持人员。
2、故障原因分类:对非计划宕机故障原因有三类即技术原因(如硬件,OS,环境因素及灾难性事故)、应用性故障(性能问题、应用缺陷Bug及系统应用变更)和操作故障(人为进行非法操作或错误操作)。
3、实际操作中对非计划宕机故障原因有七类:按计划的硬件、OS维护操作时引起的故障、应用性故障、人为操作故障、系统软件故障(OS死机、数据库故障)、硬件故障(硬盘网卡损坏)、相关设备故障(停电时USB失效)和自然灾害(火灾等)。
4、故障调研包括:故障信息搜集、故障查明和记录。
5、故障分析和定位包括故障调查分析和故障定位分析。
6、中央处理器故障定位:其原因是集成电路失效(更换电路卡)
7、外围设备故障定位:对外围设备故障检测采用脱机检测和联机检测两种方式,其故障有两种集成电路失效(更换电路卡)和特殊故障(磁盘盘面损伤、读写磁头位置偏离、打印机打印部位损坏、打印约传递机构故障等)。
8、脱机测试指外设在逻辑上与CPU脱离下对外设运行特定测试程序,进行不含接口部分的功能测试。
9、联机测试是测试设备与CPU的接口部位协调关系,还可进行模拟环路测试。
10、故障的基本处理程序是:①计算机发生故障导致系统不能运行时应停机进行临时性维修 ②区分是软件故障还是硬件设备故障 ③如是软件故障,可能是系统软件不能正常运行引起的,或因争夺资源出现死锁造成 ④软件故障排除方法是采用重启系统或其他人工干预手段恢复排除。 ⑤如是设备性能变差引起的硬件故障,应切换到备用系统,先恢复系统服务⑥使用测试程序检测故障机各部件,特别是中央处理器和磁盘存储两部件,尽快进行故障定位,然后进行后续维修。
11、主机故障恢复措施:主机故障时通常需启用系统备份进行恢复,有热重启、暖重启和冷重启三种。热启动服务专门针对客户暂时的系统故障提高立即恢复可用性的服务。冷重启服务提供商专门解决长期的系统问题(系统完全瘫痪)。
12、热重启恢复时间最快,也最难实现,也需要预先备份部件(需保存当前信息),如2N系统。暖重启也需保存当前信息,当备份部件和现行部件不完全相同的系统中,更易实现暖重启。
13、冷重启最易实现,但需最长的时间,备份部件只能从初始状态开始。热重启模式时间为T,暖重启时间将会是2-3T、冷重启时间为10-100T.
14、系统发生故障,利用数据库后备副本和日志文件可将数据库恢复到故障前的一致性状态,数据库故障分为事故故障、系统故障和介质故障。
15、事务故障指事务在运行至正常终点前被终止,其恢复措施由系统自动完成,恢复步骤是:①反向扫描日志文件 ②对该事务更新损伤执行逆操作 ③继续反向扫描日志文件 ④如此处理下去直至此事务开始标记。
16、系统故障是造成系统停止运转的任何事件,使系统要重新启动,如特定类型硬件错误、操作系统故障、DBMS代码错误、突然停电等。其恢复由系统重新启动时完成,恢复子系统撤销所有未完成的事务并重做所有已提交事务。恢复步骤:①正向扫描日志文件 ②反向扫描文件 ③正向扫描文件。
17、介质故障也叫硬故障,指外存故障如磁盘损坏、磁头碰撞、磁场干扰等。恢复方法是重装数据库,然后重做已完成事务。步骤是:装入最新数据库后备副本、装入相应日志文件副本。介质故障的恢复需DBA(数据转储的介入)。
18、网络故障指线路故障或网络连接问题,需利用备用电话或改变通信路径等恢复方法,恢复措施有:双主干(辅助网络承担数据传输任务)、开关控制技术、路由器、通信中件。
19、问题是指导致一起和多起故障的潜在的、不易发现的原因。已知错误是一个故障和问题。
20、问题控制过程是把应急措施记录在问题记录中,并提供意见和建议。故障控制重在解决故障并提供响应的应急措施。故障管理是尽可能恢复服务,而问题管理是要防止再次发生故障。
21、错误控制是解决已知错误的一种管理活动。问题预防是在故障发生之前发现解决问题和已知错误。
22、问题管理和控制的目标:①是将由错误引起的故障和问题对业务的影响降到最低 ②找出故障和问题的原因,防止再次发生与之有关的故障 ③实施问题预防。
23、问题管理流程主要涉及问题控制、错误控制、问题预防、管理报告4种活动。
24、问题控制过程包括:①发现和记录问题 ②问题归类 ③调查分析 ④错误控制 ⑤跟踪和监督 ⑥问题管理数据库。
25、所有原因未知的故障被称为问题,将重复发生的和非常严重的故障归类为问题。
26、调查问题的过程是发现故障产生的潜在原因,更细致深入范围更广,需希赛网支持。调查故障的过程是尽快恢复服务。
27、问题分析方法有四种即Kepner&Tregoe法、鱼骨图法、头脑风暴法和流程图法。
28、Kepner&Tregoe法是一种分析问题的方法,分为五个阶段即定义问题、描述问题、找出产生问题的可能原因、测试最可能的原因、验证问题原因。
29、鱼骨图法是分析问题原因常用的方法,是将系统或服务的故障问题作为结果,以导致发生失效的因素作为原因绘出图形,故鱼骨图法又叫因果图法和石川图法。
30、头脑风暴法是激发个人创造性思维的方法,即明确问题、原因分类和获得解决问题的创新性方案,须遵守畅所欲言、强调数量、不做评论、相互结合四个原则。
31、错误控制是管理控制并成功纠正已知错误的过程,对所有已知错误的发现、解决的全过程进行控制。
32、错误控制流程为发现和记录错误、评价错误、记录错误解决方案、终止错误、跟踪监督问题和错误的解决过程五个部分。
33、问题预防的流程包括趋势分析和制定预防措施两项活动。
34、安全策略包括技术手段和解决方案,如加密技术、防病毒技术、防火墙技术、入侵检测技术和安全隔离技术等。
35、安全管理措施有 ①信息系统的安全保障措施 ②健全的管理措施 ③灾难恢复措施 ④备份策略。
36、安全保障措施有:安全策略、安全组织、安全人员、安全技术和安全运作。
37、灾难恢复措施有灾难预防制度(自动备份系统信息,做灾难恢复备份)、灾难演习制度(熟练灾难恢复损伤过程)和灾难恢复(进行灾难恢复,有全盘恢复和个别文件恢复)。
38、备份策略有完全备份、增量备份、差异备份。
39、风险指某种破坏或损失发生的可能性,风险管理指识别、评估、降低见到到可接受程度并控制风险保持在此程度内。风险评估的目的是确定信息系统安全保护等级和安全保障能力级别。
40、风险管理包括风险分析(定性和定量分析)、风险评估和风险控制(方法有降低风险、避免风险和转嫁风险、接受风险等)。
点击返回目录》》》》》软考信息系统管理工程师知识重点总结汇总
相关推荐:
》》》》》信息系统管理工程师教程串讲视频
》》》》》信息系统管理工程师培训视频教程
》》》》》2015年上半年信息系统管理工程师考试试题分析与解答
软考备考资料免费领取
去领取