基于beowulf集群的透明工厂型工业以太网 |
摘 要:本文探讨和研究了基于beowulf集群的“透明工厂型”工业以太网的构架以及关键技术,对“透明工厂型”工业以太网的研究和建设提供了一套可行切实的解决方案,对相关的研究具有指导意义。 关键词:beowulf,集群,透明工厂,工业以太网 1、 前言 以太网是一种成功的信息网络技术,进入市场已近30年了,在办公自动化获得了广泛的应用。以太网具有成本低、稳定和可靠等诸多优点,它已经成为最受欢迎的通信网络之一。以太网的典型通信特点是随机接入、载波侦听、碰撞检测和竞争冲突。 然而以太网是为面向办公自动化等实时性要求不高的领域而设计的,传输报文具有排队延迟不确定的缺陷,无法保证数据传输的实时性要求,所以无法在工业控制中得到有效的使用。随着管控一体化技术的发展,迫切要求能将管理层的以太网向下延伸,直到设备层,形成一个统一的无需数据转换的透明的数据链路。因此,工业以太网技术已经成为人们关注的重点,本文研究了基于beowulf集群的“透明工厂型”工业以太网构建的有关问题,为高性能、低成本、高数据处理能力和实时性能的工业以太网建设提供了一套简单便捷的解决方案。 2、 “透明工厂型”工业以太网 2.1 “透明工厂”及其特点 透明工厂是21世纪提出的一个创造性的战略,它将构建互连网基础的技术与施耐德自动化的产品融合。其宗旨是将现存的、开放的和已经证实的技术引入市场,从而消减专有系统的集成障碍。透明工厂的实施将大大减少系统集成的工作量,也会减少从设计和概念到实际运行产品的时间。“透明工厂”是建立在新的信息技术和通讯技术基础上的,这些技术包括OPC开放、软件标准和Web技术等。透明工厂中的一个显著的特点是将Web访问的功能扩展到I/O级,从而实现远程调解I/O的功能,而不仅仅是停留在访问I/O信息。 2.2 “透明工厂型”工业以太网及其实质分析 “透明工厂”型工业以太网是工业以太网的完全解决方案,也就是说企业网从上到下完全是由以太网组成。实现了整个工厂对用户来说是“透明”的,如图1是传统混合型工业以太网和“透明工厂型”工业以太网的比较。 如图1左侧a的传统混合型工业以太网其实是一种折中的方案,也是比较容易实现的方案,是目前许多公司的工业网络架构模型。在工业现场的管理层和车间层使用以太网,向上可以和Internet连接,向下可以读取车间里各个控制子系统的状态信息。在设备层,仍然采用独自的现场总线技术,如CAN、Profibus、ASI 等。它们与以太网之间通过专用的网关连接。这种方案可以最大限度地利用现有以太网所能提供的通信功能。每个网关是以太网的节点,同时也是下面子系统的主站。网关可以实现对子系统实时的控制,并把子系统内部的信息进行预处理,只把一些重要的信息按照TCP/IP 的帧的格式发送到以太网上。 这种方案的好处是避免以太网直接对传感器和执行器等底层设备的访问,减少了以太网上实时数据的传送量,减少了冲突的机会,在一定程度上避免了在恶劣的工业条件下传输实时数据出现迟延的问题。但这种模型还只是一个过渡型的结构,因为设备现场总线的繁多协议同样影响着终端用户的使用,而现场总线的统一开放的思想还是没有完全实现。同时由于在工业环境下,以太网的可靠性和数据处理能力都会收到影响,在一定程度有所降低,在电磁兼容性方面也有待于进一步提高 基于新型的“透明工厂型”工业以太网其网络架构模型如图1右侧b所示,其整个网络是基于统一的协议,所以用户可对从高层的管理层到底层的设备层的任一个设备进行访问,而无需知道这种访问是如何进行的。普通的传感器、执行器通过工业以太网I/O模块连接到以太网上,管理层的主机可采用IP访问的方式与各个设备进行通信。这种方案的优点是现场监控网络的全面解决方案,但实现起来还有许多技术问题需要解决。主要要对以太网进行面向实时控制的修改,还要在网络层以上引入实时控制算法,弥补以太网在传输确定性数据方面先天性的不足。 而Beowulf 集群技术解决了如何通过使用普通PC来达到高性能、高实时的计算系统的问题。近年来,集群系统迅速发展,主要是因为集群结点为工作站系统的处理性能越来越强,更快的处理器和更高效的多CPU机器已大量进人市场,以及局域网新技术和新协议的引入,集群结点间的通信能获得更高的带宽和较小的延迟,集群系统比传统的并行计算机更易于融合到已有的网络系统中去。集群开发工具日臻成熟,其价格也愈加便宜并且易于构建。另外集群的可扩展性良好,结点的性能也很容易通过增加内存或改善处理器性能获得提高。因此采用集群技术来解决“透明工厂型”工业以太网的实施的难题已经成为可能。下面讨论如何通过建立beowulf集群系统来大大提高工业以太网的计算机处理性能和数据传输能力,解决工业以太网中实时性能的关键问题,来实现“透明工厂型”工业以太网的问题。 3、 Beowulf 集群系统 集群,是由一组独立的计算机系统构建的一个松耦合的多处理机系统,系统中各进程借助网络实现通信、共享内存传递信息,从而实现分布式并行计算。一组廉价的微机协同工作可以达到超级计算机的性能。目前,集群已经成为各高性能计算机厂商的研究热点。 Beowulf的定义至今还有争议,但大多数人已经赞同将用市售微机构建的廉价计算集群的称为Beowulf系统。第一个Beowulf于1994年诞生于美国航空航天局的戈达德空间飞行中心,该中心科学家Sterling和他的同事,将16台Intel486微机用标准以太网连接成一个计算集群,获得70兆flops的持续运算能力,建造该集群仅费4万美元,而当时市场上出售的具有相同性能的超级计算机约为100万美元一台。Beowulf 系统所具有的价格优势是传统的并行计算机所无法比拟的。 Beowulf系统除了强大的计算能力和极为优越的性价比,还具有其它诸多优点。首先,它依赖的都是一些成熟的、容易获得的计算机技术和设备,不存在技术上的风险。其次,很多构建Beowulf系统所用的软件可以免费从Internet网上下载,构建方法手册、帮助文件等都可以在Internet网上获得,这不但降低Beowulf系统的成本,也使系统的构建较为容易。第三、微机是应用最为广泛,最为广大科研工作者熟悉的一类计算机,Beowulf系统与现有软、硬件结合,允许用户在一个熟悉的硬件和软件环境下开发,调试和运行并行程序,这为使用者带来了很大的方便。第四、Beowulf系统具有良好的移植性,同时Beowulf系统亦具有良好的可伸缩性,这对系统的构建、维护以及资源的充分利用都十分有利。 4、 基于beowulf集群的“透明工厂型”工业以太网的研究与实现 4.1 beowulf集群系统的构建 PC集群属于高性能集群计算、并行计算技术中的一种,集群构建时组成部分可根据要运行的主要应用进行调整,因此,构造集群系统的方案可以根据具体需要调整。而Beowulf集群主要是使用普通的、相对廉价的计算机构建能够处理繁重计算的集群。这里我们采用PC集群构建Beowulf 集群系统。Beowulf PC集群系统采用通用PC作为节点,其各个节点由基于Intel、运行Linux或Windows等通用操作系统的节点计算机紧密集成,它也可以存在多个网络通信模式或路径,在工业以太网环境下我们这里都采用以太网通信。 如图2所示,我们采用16台CPU为PIV-2.66GHz、内存为512M、硬盘为80GB/7200RPM、配有双网卡的普通PC机作为节点组成集群机,实现基于消息传递的分布式内存的并行Beowulf PC集群系统。采用CISCO2900XL系列交换机(24口/100M),将交换机设置为3个虚拟网段,其中的一个网段设置为信息接收网段(LAN1) ,另一个网段设置为信息发送网段(LAN2 )。LAN1只负责接收来自节点计算机的消息,将接收到的消息发送到LAN2的各个端口,LAN2将消息发送到相应的节点计算机,以使各节点计算机的两个网卡分别进行消息的发送和接收,提高消息传递的速度。交换机的第3个网段用于将系统与局域网连接,从而实现远程登录服务等功能。 为达到更快的运行速度,可清除各节点操作系统中不必要的服务以提高应用程序的执行效率,并且可以采用将NFS通讯和数据通讯分别绑定在不同网卡上的方法提高数据传输速度,甚至可以在每个节点安装三块网卡,其中之一绑定NFS,另两块绑定数据通讯,达到高速通信的目的。同样采用以上技术,对于48个ATHLON 1G节点的Beowulf系统,其峰值运算速度可以达到38Gflops/sec。 4.2 软件环境的搭建 通常在Beowulf集群上运行的软件是 Linux操作系统、并行虚处理机 PVM(Parallel Virtual Machine),和消息传递接口MPI(Message Passing Interface)。集群环境中应用较多的是消息传递模型。消息传递模型为编程者提供了灵活性但却将各个并行执行部分之间复杂的信息交换和协调控制的任务交给了编程者,增加了编程者的负担,这是消息传递编程模型的劣势。 目前比较流行的消息传递软件是并行虚拟机PVM(parallel virtual machine)和消息传递接口MPI(message passing interface)。MPI是一个显示的消息传递模式,在其中,任务通过发送消息相互通信。其最大的优点是高性能,点到点通信函数模型、可操作数据类型都比PVM丰富,群组通信的函数库也更大,但是不如PVM灵活。MPI和PVM都提供了一套函数集,且各有所专。它们能在所有的并行平台上运行,包括PVP、SMP、MPP(massively parallel processor)、工作站和PC组成的集群系统,并已经在Windows平台上实现,提供了对C、Fortran和Java语言的绑定。Beowulf集群系统的微机操作系统多为:UNIX、Linux、WindowsNT/2000/XP。它们都具有很强网络支持功能和可靠性。其中Linux作为著名的开放操作系统,可以在Internet上免费下载,被多数Beowulf系统作为操作系统。 在实际的项目实施中采用了Redhat Linux9.0操作系统,安装好Linux后,对Linux进行网络配置。在所有的结点微机上安装TCP/IP网络协议,并将所有的结点微机设置为同一工作组,结点微机定义不同的网络名以便区分。再将结点微机上安装MPI软件MPICH1.2.5.2作为集群的支撑环境,并把存储并行程序的硬盘分区或文件夹设置为共享。 4.3 Beowulf集群系统在“透明工厂型”工业以太网中的实施 基于Beowulf集群的“透明工厂型”工业以太网构架如图3,Beowulf集群系统在新的工业以太网中和通用计算机一样连接到中央交换机,整个网络分为4层,分别是计算机管理层(计算机中心),管理人员层(管理层),车间层(生产线上工业PC机)以及设备层,各层通过高速中央交换机连接,另外通过Internet远程管理人员可以接入,对整个“透明工厂”进行操控。当然,要实现完全意义上的“透明工厂型”工业以太网,还需要解决CSMA/ CD 监听机制的安全问题,数据的冲突问题等等其它有关的问题,这里限于篇幅,不一一讨论。 5、性能测试与结果分析 工业以太网的测试通常包括以下几个重要的指标:(1)最大响应时间。对于每个节点的报文,在网络正常运行的情况下,报文从发送到接收后产生响应所经历的最大的延迟时间。(2)数据包丢失率。在正常工作的情况下,指定时间内数据包的丢失数目。(3)传输介质。普通以太网传输介质在工业现场的测试结果并不令人满意。以太网的传输介质是否能保证数据稳定、可靠地传输是重要的选择标准。(4)传输速率。在网络正常工作的情况下,单位时间所能传送的比特位数。 以动态通信量滤波型工业以太网的的标准测试条件:帧长度512 Byte ,测试时间600s,帧间距9.6μs做测试。测试结果如下:通信量:300MB/s,最大响应时间:187.3ns;丢失帧数:11。由测试的结果可见,在实时性要求不是极高的工业场合,这种方案已经完成可以满足要求。以上方案在太阳能电池生产线的工控机管理和控制的实施中成本节约了近80%,而同样达到了良好的效果。 6、结论与展望 本文讨论了如何构建基于Beowulf集群的“透明工厂型”工业以太网,该系统采用由微机及高速以太网络组成的分布式、同构、对等集群结构形式,由16台微机组成的Beowulf集群系统担当了以太网中计算中心与数据处理中心的重任,达到了高性能超级计算机的指标。而以太网由于结构简单、构造容易,可以低廉的价格获取较高的局域网数据传输性能, 因而也和Beowulf 集群系统相辅相成,共同解决了工业以太网的数据传输实时问题。 |