1、概 述
1.1 分散控制系统
分散控制系统(Distributed Control System)英文缩写为DCS,有时也称分布式控制系统,其实质是计算机技术对生产过程进行集中监视、操作、管理和分散控制的一种新型控制技术。它是由计算机技术、信号处理技术、测量控制技术、通信网络技术、人机接口技术相互发展渗透而产生的,即不同于分散的仪表控制系统,又不同于集中式计算机控制系统,它是吸收了两者的优点,在它们的基础上又发展起来的一门系统工程技术,具有很强的生命力和显著的优越性。
分散控制系统是计算机技术和自动化技术发展的结果。机组容量不断增长、参数不断提高,为DCS应用创造了广阔;随着DCS系统的广泛使用,为机组安全经济运行提供了有力保障。
进入20世纪90年代,由于微处理器及其超大规模集成电路(VLSI)技术的发展,DCS发展很快,加上计算机技术、容错技术和人机接口技术的发展,窗口技术、交互图形等的出现,以及标准化的数据通信链路、通信网络技术的发展和人工智能、知识工程方法的发展及信息管理系统的发展,特别是开放式结构和集成技术的发展深刻地影响着90年代以后的DCS的发展。90年代以后DCS向综合化、开放化发展,即90年代生产过程自动化要求各种装置(计算机、DCS、单回路调节器、PLC等)之间的通信能力加强,以方便地构成大系统;并且在大型DCS进一步完善和提高的同时,发展小型DCS,也就是说随着PLC计算机与DCS和其他控制回路之间接口的迅速发展,将连续控制回路、逻辑功能和批量控制功能汇入在统一的高性能系统中,从而将PLC与DCS融合在一起,满足了协调的需要,同时也为了适应离散类和批量工业自动化的要求。今后的DCS发展方向将进一步采用人工智能技术,特别是知识库系统(KBS)和专家系统(ES)。
DCS具有通用性强、系统组态灵活、控制功能完善、数据处理方便、显示操作集中、人机界面友好、安装简单规范化、调试方便、运行安全可靠的特点,在国内外火电机组中得到广泛的应用。
东海拉尔发电厂2×50MW机组、2×220T循环硫化床锅炉,采用了北京和利时系统工程股份有限公司生产的MACS分散控制系统。用以完成DAS(数据采集系统)、MCS(模拟量控制系统)、SCS(顺序控制系统)、BMS(燃烧器管理器)DEH(数字电液控制系统)、ETS(故障跳闸系统)等控制功能。系统设有现场控制站9台、操作员站7台、工程师站2台、历史数据站1台、通讯站1台。系统投运后东海拉尔发电厂的自动化水平将有一个整体的提高。
1.2 和利时SmartPro系统特点
实时性:控制器CPU采用Pentium级芯片,基于QNX嵌入式操作系统,保证控制精确、实时、高效。
可靠性:采用多种冗余结构(网络、控制器、电源模件、I/O模件),系统安全可靠。
先进性:灵活的Client/Server结构,适合大规模系统的 I/O、Alarms、Reports、Trends、Time服务器可分布式设置;既保证数据的一致性,又可负荷均担;功能丰富的HMI人机界面,灵活强劲的控制软件,支持离线仿真。
易用性:智能设备管理(故障诊断、精度校正、带电插拔),维护简单方便。
延续性:操作站采用通用系统平台,可跟随计算机水平不断提高而同步升级。
SmartPro系统不仅拥有以上优点,更具有高效的可靠性设计;
1) 危险分散措施
过程I/O单元采用的智能化设计方法,可有效地将部分控制或采集运算分散到各I/O单元,降低主控单元的负担,提高可靠性;另一方面,一旦主控制器发生故障,各单元仍能完成基本的输入输出功能,,如控制输出的自动保持功能,回路控制的独立执行等。
2) 故障隔离措施
所有过程输入输出单元都采用可靠的光电隔离技术,使各单元之间和单元与上位机之间的CPU无任何电气联系,从而提高系统的抗干扰能力、可靠性和安全性。在同一单元的不同通道及逻辑功能侧和现场信号侧,也提供了隔离措施,可消除由于现场地电位差对系统造成的损坏。
3) 迅速排除故障措施
现场控制站的所有单元上均带有CPU,每单元均可进行周期性自诊断。诊断主要包括CPU与内存等的自检、开关量输出回读比较、模拟量输入通道的正确性比较判断、模拟量输出通道的正确性比较等。诊断结果每秒钟都上传到上位机的系统状态图中显示。
4) 各种运行提示
系统中所有单元上均有状态指示灯、包括运行灯、故障灯、网络通信灯等,可以根据指示灯的状态及时发现、排除故障。
5) 可带电热插拔
一旦发现故障,可带电对故障单元进行更换。由于采用了特殊保护措施,系统中所有过程I/O单元均可带电插拔,对系统的运行不会产生任何影响。
-
-
-
小麻籽 发表于 2009/4/24 19:56:43
3、检修运行维护的主要内容
检修运行维护的目的,就是为了采用正确的方法和手段,确保分散控制系统处于完好、准确、可靠状态,从而满足生产过程正常运转的需要。
3.1 检修的主要内容
分散控制系统检修的主要内容包括系统停运前各部件状态检查,并做好记录,以便停运后针对性地进行检修;系统停运后要对系统各部件进行外观检查等一般性检查,对系统控制装置、卡件等硬件设备按反映技术指标所必须的项目进行测试或检验,以校验各硬件设备技术特性满足相关要求;对系统软件及应用软件进行逻辑检查及功能试验,以确保软件功能的完整性,并满足生产工艺流程的要求;从而保证分散控制系统安全可靠运行。
分散控制系统运行维护的主要内容包括系统在投运前应做好必要项目的检查,检查合格且一切准备就绪后系统上电,按照相关步骤启动系统,并检查验收系统各部件正常或满足相关技术要求后,系统投入在线运行。系统正常运行时,为确保系统处于完好、准确、可靠状态,要进行必要的日常与定期维护工作,即每日一次设备巡检,记录系统各部分的工作状况,发现异常问题及时查明原因解决处理,定期进行有关内容是否符合技术指标质量要求的试验和检查,并根据热控系统的运行工况决定热控系统设备的投入与退出。
引用 小麻籽 2009/4/24 19:56:43 发表于2楼的内容
-
-
-
-
小麻籽 发表于 2009/4/24 19:58:14
DCS在运行中常有以下几类故障:
4.1 通信网络故障
通信网络类故障一般易发生在接点总线、就地总线处,或因地址标识错误所造成。
4.2 节点总线故障
节点总线的传送介质一般为同轴电缆,有的采用令牌信号传送方式,有的采用带冲突检测的确良多路送取争用总线信号传送方式。不论采用哪种方式,当总线的干线任一处中断时,都会导致该总线上所有站及其子设备通信故障。目前,一般防止此类故障的方法是采用双路冗余配置的方式,避免因一路总线发生故障而影响全局,但这并不能从根本上避免故障的发生,并且一旦一根总线发生故障,处理时极易造成另一个总线故障,其后果是非常严重的。有效的方法应是从防止总线接触不良或开路入手。比较成功的是系统的节点总线布置方式。其同轴电缆的连接不是在通信模件的前面,而是在模件的后面,这样当系统运行中处理通信模件故障时,可避免误碰同轴电缆,造成网线断路。同时,其同轴电缆除专门进行检查,任何时候都不会去触动,可防止因多次插拔同轴电缆的插头造成松动,增加其故障的可能。另外,应制定同轴电缆检查与更换管理制度,在其接触电阻增大至影响通信之前,进行更换或处理。
4.3 就地总线故障
就地总线或现场总线一般由双绞线组成的数据通信网络。由于其连接的设备是与生产过程直接发生联系的一次元件或控制设备,所以工作环境恶劣,故障率高,容易受到检修人员的误动而影响生产过程。另外,总线本身也会因种种原因造成通信故障。防止此类故障的有效方法是,首先要将就地总线与就地设备的联接点进行妥善处理,拆装设备时,不得影响总线的正常运行,总线分支应安装在不易碰触的地方。同时,就在总线最好是采用双路冗余配置,以提高通信的可靠性。
4.4 地址标志的错误
不论是就地组件还是总线接口,一旦其地址标识错误,必然造成通信网络的紊乱。所以,要防止各组件的地址标识故障,防止人为的误动、误改。系统扩展时,一般应在系统停止运行时进行。尤其是采用令牌式通信方式的系统,任何增加或减少组件的工作都必须在系统停运时,将组态情况向网络发布,以免引起不可预料的后果。
4.5 硬件故障
DCS系统根据各硬件的功能不同,其故障可分为人机接口故障和过程通道故障。人机接口主要指用于实现人机联系功能的工程师站、操作员站、打印机、键盘、鼠标等;过程通道主要指就地总线、通道、过程处理机、一次元件或控制设备等。人机接口由多个功能相同的工作站组成,当其中一台发生故障时,只要处理及时,一般不会影响系统的监控操作。过程通道故障发生在就地总线或一次设备时,会直接影响控制或检测功能,因而后果比较严重。
4.6 人机接口故障
人机接口故障常见的有球操作失效、控制操作失效、操作员站死机、薄膜键盘功能不正常、打印机不工作等。球标操作不正常一般是由于内部机械装置长期工作老化或污染,使触点不能可靠通断,或因电缆插接不牢固造成与主机不通信,这时只需将其更换检查即可。
控制操作失效是由于球标的操作信号不能改变过程通道的状态,一方面可能是过程通道硬件本身故障,另一方面可能是操作员站本身软件缺陷,在设备负荷过重或打开的过程窗口过多时,导致不响应。在检查过程通道功能正常后,应对操作员站进行检查,必要时进行重启,初始化操作员站。操作员站死机原因比较多,可能是由于硬盘或卡件故障、软件本身有缺陷
冷却风扇故障导致主机过热,或负荷过重造成。可首先检查主机本身的温升情况,其次用替代法检查硬盘、主机卡件等,以确定故障部分。
薄膜键盘在大多数操作员站上得到应用。其主要功能是快速调取过程图形,便于操作员迅速监控过程参数。当因薄膜键盘组态错误、键盘接触不良、信号电缆松动或主机启动时误动键盘造成启动不完整,均可导致其功能不正常,应针对不同的情况进行处理。
打印机不工作一般是由于配置的原因。同时,以打印机进行屏蔽后,也会使打印功能不能进行。另外,打印机本身的硬件故障会造成其部分功能或全部功能不正常,应重新检查打印机的设置及其硬件是否正常并进行处理。
4.7 过程通道故障
过程通道出现最多是卡件故障或就地总线故障。一种原因是卡件本身长时间工作,元器件老化或损坏;另外,因外部信号接地或强电信号窜入卡件也会导致通道故障。现在一般卡件本身都采取了良好的隔离措施,一般情况下不会导致故障的扩大,但此类故障一旦出现,则直接造成过程控制或监控功能的不正常。所要要及时查明故障原因,及时进行更换卡件。
一次元件或控制设备出现故障有时不能直接被操作员发现,只有当参数异常或报警时,方引起注意。控制处理机(过程处理机)故障一般会立即产生报警,引起操作员注意。现在控制处理机基本上全是采用不1:1冗余配置,其中一台发生故障不会引起严重后果,但应立即处理故障的机器。在处理过程中,绝对不可误动正常的处理机,否则会发生严重的后果。
4.8 人为故障
在对系统进行维护或故障处理,有时会发生人为误操作现象,这对于经常进行系统维护或新参加系统检修维护的人员来说都是会发生的。一般在修改控制逻辑、下装软件、重启设备或强制设备,保护信号是最易发生误操作事件。轻则导致部分测点、设备异常,重则造成机组或主要辅机设备停运,后果是非常严重的。在使用的电厂,人为误操作发生的故障在热工专业中的不安全事件中占有很大比例。
4.9 电源故障
电源方面的问题也较多,如备用电源不能自投,保险配置不合理及电源内部故障等造成电源中断,稳压电源波动引起保护误动及接插头接触不良导致稳压电源无输出;有的系统整个机柜通过一路保险供所有输入信号或一路电源外接负载很大,还的控制电源既未接又未有冗余备用。
SOE工作不正常
SOE的结论对事故的分析判断起了很重要的作用,但在现实中,许多电厂发生保护动作等情况时SOE未记录下来或记录时间与实际情况不符。如 电厂#1机组出现过SOE事件顺序追忆时间与实际跳闸时间不相对应,SOE 时间打印浏览后不能返回,首次跳闸原因在事件顺序吵能第一个反映,SOE时间顺序数据不能设置等问题。而有的电厂在几次事故分析时发现SOE结论中的时序与历史曲线中的时序有偏差,有时甚至时序颠倒,具体表现于同一点在历史曲线和SOE中民生时间不一致,且有时偏差很大,这会延误事故分析的进程,有时甚至误导事故分析方向。SOE问题既与系统设计不合理,SOE点没完全集中在一个上有关,也与系统硬件及软件设计考虑不周有关。
干扰造成的故障
干扰造成的故障的事例也不少。系统的干扰信号可能来自于系统本身,也可能来自于外部环境。由于不同的系统对接地都有严格要求的规定,一旦接地电阻或接地方式达不到要求,就会使网络通信的效率降低或增加误码的可能,轻则造成部分功能不正常,重则导致网络瘫痪。
电源质量同样影响系统的稳定运行。用于系统的电源既要保证电压的稳定,也要保证在一路电源故障时,无扰切换至另一路电源,否则会对系统工作产生干扰。过程控制处理机主/备处理机之间的切换有时也会导致干扰。另外,大功率的无线电通信设备如手机、对讲机等在工作时,极易造成干扰,危及系统运行。
引用 小麻籽 2009/4/24 19:58:14 发表于3楼的内容
-