[导读]由千家传媒主办的2014年第十五届中国国际建筑智能化峰会北京站于11月27日在北京国宾酒店盛大召开,活动现场吸引智能建筑行业专家、设计院人士、系统集成商、渠道商、厂商、终端用户等超...
由千家传媒主办的2014年第十五届中国国际建筑智能化峰会北京站于11月27日在北京国宾酒店盛大召开,活动现场吸引智能建筑行业专家、设计院人士、系统集成商、渠道商、厂商、终端用户等超过五百人到场交流,每年一届的智能化峰会为智能建筑行业搭建学习交流平台,成为智能建筑业界人士关注的大型活动之一。
——Tridium 亚太技术总监艾铁军
以下分享TRIDIUM亚太技术总监艾铁军的精彩演讲
Tridium 亚太技术总监艾铁军
艾铁军:谢谢主持人!尊敬的各位嘉宾,上午好!
今天我要跟大家分享的话题是《开放分布式架构——构造大规模设施联网趋势》。我会从四个方面跟大家作一个分享,首先是我们目前现状的认识,面临的一些挑战和问题,我们如何解决这些问题,以及我们在各个行业的解决案例。
前段时间我对一家世界级的连锁企业做了一个调研和分析,很惊讶的发现了一些问题,这些连锁企业在中国区有将近1000家的门店,他们在不同的门店里有大量不同的系统,包括主控系统、冷冻、空调、防水包括外围系统,照明、电梯甚至一些门禁系统。在各个门店里现在有不同的设施团队在维护,他们现在面临的一个问题是怎么能够有效的远程管理这么多国家的门店。在总部有一个报警中心,主要来管理解决这些核心系统的主控设备的报警,他们是怎么做到的?目前因为这些单一门店,或者是分布在不同地方的门店,并没有联网,系统之间也没有做任何集成,这是怎么做到呢?所以他们在中央有一个报警中心,这个报警中心雇佣了不同的团队,通过24小时三班倒的方式来实时以人工方式去扫描和远程登录这些设备,看看有没有相应的报警,如果有报警,他们会以手工的方式记录下来,然后通过打电话的方式给到门店,说这个地方有报警,需要去处理,之后他会再跟踪这个问题有没有解决,如果已经解决,会在单子上打勾,去关闭这样的报警。这种方式是通过大量的人工,将近20个人的团队,主要来解决核心两个系统的报警问题,还有大量其他的系统是没有办法解决的。这种人工方式最大的问题,它会造成直接间接的浪费。
曾经有一个人跟我们讲,有一次报警没有实时的响应,另外就是数据问题,每年都要得到各个系统不同品牌的系统之间对比数据,或者是各个门店之间的能耗数据,或者是整个报警所有的历史数据还有整个响应过程的数据,如果出现问题之后,需要还原当时的情况,所有的这些他目前是没有办法收集数据的,通过人工的方式也是不现实的。我们可以怎么帮到他们?这家企业目前在全球排前十名,在欧美超过一万家店,在欧美,人工成本非常昂贵,所以在若干年前,他们已经形成了门店设施联网的观点,能够远程实时监控数据搜集、数据分析、数据决策,所以他们在中国区的这些管理层也深深意识到这样一个必然的趋势,所以他们的目标很明确,他告诉我,他说我需要一个开放式的平台,我需要接入所有门店不同的智能系统,能够去创造一个安全、舒适的环境,所谓安全就是能够监控到你设备的运行情况,减少宕机的时间。
同时,他也希望降低每年的人工几百万的投入,这是直接的一些成本的降低。 其次是低能耗,他希望有数据,他希望有对比,他希望分析到在哪些地方有浪费。他现在没办法做标准,因为他没有一个基础的数据,所以他即使在同样规模的门店,也没办法分析为什么这家门店的能耗比另外一家门店的能耗高20%,问题到底在哪,他需要有高投资回报率,他说我们建一个系统只是解决目前的问题,我目前只是接入最核心的两个系统,让我能够有效的监控,得到数据,未来我会有更多的门店和更高的需求,所以他希望一个可以持续改进的系统。
刚才讲了两个关键词,一个是减少浪费,一个是持续改进,这两关键词都来自于经营管理的思想核心。谈到经营管理,最早来自于丰田,经营管理思想不仅是在制造业,甚至在软件行业也大量的应用,所有这些都是在用经营管理的思想得到延伸。很多人问我,你们称你的系统整个分布式平台可以接入不同的子系统,可以用来连接所有的设备,那又能怎么样呢?我现在通过刚才的例子,通过人工的方式也可以主动的得到现场的控制和一些信息,通过打电话也好,通过人工处理也好,我可以解决其中的问题。我回答是可以解决,可以通过人的方式,但是人的成本很高,而且人在这种重复的简单的工作面前非常容易出现人为的因素,导致一些间接的成本发生。如果有一个方法能够自动的、透明化的把所有分布在不同地方的设施连起来,能够自动给推送这些消息,而不需要靠人为24小时盯着,而且是不同团队的人。看起来这个很好,但是如果让我投资几百万或者上千万去解决这个系统,去解决事中监控的问题,投资回报率不够高。
如果没有数据,原来的方式是没有办法得到整个设备运维非常详细的数据,没有这些数据无法做分析、对比,因此如何发现你的设备处于不稳状态,怎么提前预防,设备出现宕机的概率。还有一点,如果有了这些分析之后,我可以帮你做到事前的决策,而不是你发现问题之后再去解决问题,而是如果能够分析这个设备的行为模型,我能够预测到你未来在什么时间点这个设备可能出问题,或者是我能预测到你在什么最佳时间点打空调、照明,如果我能帮助你做事前决策,对你会不会有帮助?当然有,我想怎么能做到这些呢?是不是可以真正的实现所有的从事中到事后,以及事前的预防决策,怎么解决这个问题? 首先,我们看一下技术背景。
目前,云计算的发展速度很快,云计算可以帮助我们提供无线接入和大数据存储以及数据分析决策的计算能力。还有物联网,物联网可以让我们的设备变得越来越智能,越来越可以被连接,越来越可以被管理。还有就是大数据的分析,存储技术的发展,以及移动计算,每个人手机里面都有运算能力很强的移动终端,移动终端甚至我的手表就可以监测到末端设备运行情况等等,这些都为我们的设备联网带来了很好的支撑。还有web2.0浏览器,帮助我们远程管理我们的设施。 这是思科在2013年做的分析预测,说到2020年将近500亿设备会接入到互联网领域,其中将近40%是来自于建筑和设施领域,所以这是一个非常巨大的空间。在这样的一些背景下,就为设施联网去做连接分析提供了一个平台。但是真正建立大型的平台还是提出了一个挑战,首先第一个就是跨系统、跨平台,就算你在单一的移动设施里,你会有很多的子系统设备,有的系统是封闭的,有的是开放的,有是半开放的。如果你能够把单一的智能设施里的系统集成起来,已经是很有挑战的。如果你要把分布在不同地方的设施都集成起来,在同样一个门店里,他用的空调系统可能是来自于不同的厂家,所以你用的是千差万别的系统,如何把它们有效的集成起来,这个非常难。还有就是跨地域的问题,设施联网一定是你的设施分散在不同的地方,分散在不同的网段里,如何把它们有效的联合起来。
很多人会说,现在的网络无处不在,而且现在的智能设备越来越IP化,我可以把IP的系统直接联入到互联网,我在中央架设一个集中式的服务器,我可以租一个云服务,然后把IP设备连上去。就算不是IP的设备,我可以通过IP网关的方式挂到互联网上,在上面开发监控画面、很炫的报表,实现远程的联网管理。 技术原理看上去是OK的,但是如果你要构造一个真正的可以商用、稳定的设施联网平台一定要考虑这几个因素,第一个是数据实时的问题,如果两个设备需要联动,这个设备说我这里很热,你告诉中央服务器,让某一个控制器把设备打开。要知道,互联网是不稳定的,是不安全的,这是实施上的问题。还有就是数据完整性的问题,我们说要做事后分析你需要有大量的运维数据、设备模型的数据。如果说你的设备直接挂到互联网,挂到中央服务器上面,如果你的网络断了怎么办呢?互联网就是不稳定,怎么办呢?如果有另外的设备连到中央服务器,互联网一旦断裂,是不可控的。还有一个就是数据安全性,现在大量的IP控制器用了标准的工业协议,这些协议本身没有安全认证,如果一旦把这些IP的控制设备挂到互联网上,就意味着你把这些设备赤裸裸的曝露在所有的网银面前。
大数据改善系统
我们在2012年的时候遇到了一个很大的挑战,当时有一个机构开发了一个搜索引擎,有点类似于谷歌的搜索引擎,但是它主要是用来搜索的,挂到互联网上的智能设备,他会尝试用不同的协议访问某一个端口。有一次他发现有大量的工业级的设备挂到了互联网,他可以轻而易举的控制这台设备,这是非常不安全的。大家有兴趣可以了解一下这个搜索引擎。还有系统稳定性的问题,集中式的架构把所有的东西都联上了,你怎么解决无线接入的问题,本来要接入一栋楼、两栋楼,管理会越来越多,你会接入更多的数据点,所有数据都要实时通讯。你的系统一旦出现宕机,就会大面积瘫痪。还有就是系统的扩容性,比如说你租用云服务器,可以虚拟计算,但是任何单一的节点接入都是有限的。这些都是我们在解决跨域分布式连网面临的问题,所以我们需要去思考。 还有就是大数据的问题,我不想过多的解释什么是大数据,但是我想解释一下我对大数据的一个认识。到底多大算是大数据呢?一个G,一个T,十个T,一百个T?在我们看来,如果你有足够的数据可以分析一个设备的行为模型,你可以预测到它未来一小时、一天会不会出现问题,需不需要维修,是否处于不稳态?如果你可以分析一个人一天在某个时间点跟什么人在哪里约会,如果你有足够多这样的数据,我们称之为大数据,你是可以来做预测的。大数据解决的问题是如何收集,如何定义数据模型和设备的行为模型以及设备的关联模型,如何去分析和存储大量的数据。如果有了这些,我们就可以做出预测,可以做到事前的预测,让我们整个管理变得越来越高效。 Lord Kelvin说过如果一个事情没有办法量化的话,我就没有办法改变它,充分说明了我们需要有数据,这样才能改善系统。
首先,我们需要开放,去年的话题就是开放,在我看来,开放有三层的含义。第一层就是互联,只有开放了之后,大家才可跟你连接,跟你互操作,才可能变成一个智能的系统,各个子系统之间可以协调工作。还有就是可扩展性,如果你一个系统建造不可扩展,或者说可扩展性很弱,我们知道任何事情都不可能是完美的,而且也不可能是一成不变的,所以你的管理的要求、你的需求,你一定是需要不断的扩展新的功能,或者是接入更多的子系统,把整个测试变得越来越智能化,所以你一定是要可扩展,从横向接入更多的东西,提供更多丰富的功能。第三个是渠道,如果一个技术只有被一个渠道买到的话,就不够开放。像安卓是开放的,你可以通过不同渠道买到不同品牌的安卓手机,它可以很快的满足你的客户需求。还有一点,跨地域挑战的问题,我们用分布式的办法来解决这个问题。什么是分布式,什么是分布式计算?其实分布式计算在人类系统大量在用,小到一个公司,大到一个国家都有区域政府、地方政府、中央政府,你可以没有中央政府、地方政府也可以协调工作,区域高度自治,不是把所有的都给到中央。我们的设备也是一样的,怎么把大量的子系统管理起来呢?在一个局域网或者在一条总线上是相对安全的实时可控的,我们需要部署本地的单元,一个分布式的计算节点来解决问题,做到实时数据通讯的交互控制问题。这些控制都需要到一个总部操作起来。第二个问题要解决数据收集、存储以及局部运算的能力,而不是说把所有东西直接就不管,实时扔到上面去,这也是不现实的。所以,在这个地方它解决的两个最关键的问题。如果说你的社区足够大,你就需要一个联邦政府,如果各个分布式单元之间协调运作,可能有些大的运算,你可能需要一个界面,来协调所有分布式单元一起合作,这时候你可能是中央单元,或者你中央单元哪天工作了、罢工了,这个系统还在工作。通过这样一个解决方案,你的实时性的问题,数据完整性的问题安全问题都可以得到解决。因为分布式计算最核心的问题就是把合适的计算放在合适的位置,全部放在一个地方,什么叫合适的计算?实时计算这种能力应该放在离社会最近的地方,包括实时数据搜集能力,或者本地处理的能力应该放在局域网里。就算你的网络断点之后,一旦重新连上,两个节点之间可以保持自动连接。
刚才讲了分布式单元要解决的最核心的就是设备实时介入和互操作,另外是本地数据收集和实时数据的存储。我们怎么去解决大数据的问题?核心的几个问题,一个是如何定义设备的行为模型和关联模型,有了这个模型之后你怎么得到所有的数据,怎么保证是完整得到这些数据。有了这么大的数据,你怎么去存储这个数据?所有东西都实时推送到一个节点也不现实,所以你可以通过这种分布式的节点,通过定义你的设备对分模型,获取本地的实时数据,可以建立本身的设备对方,你可能关注的是设备的温度、装置、开关这样一些模型,这个温控器跟其他设备的关联。你把这个模型建好之后,通过本地的控制来得到所有设备的实时数据,而且可以在本地存储。一旦我现在需要有一个地方来调用不同节点的所有数据来做一个分析和对比,你可以有一个中央的节点,如果说我要做一次大的分析,我要用很多不同门店的数据。这些数据源头在哪里?分布在各个节点,而不是一个节点。 通过这些方式你可以得到你的完整数据,你可以在上面做你的决策,因为你有了主要的设备模型,我们可以进行数据分析模型分析你的数据算法,同样的子系统你用了不同品牌,这两个品牌之间可以做能耗的对比等等,来解决大数据的分析和应用问题。
所以,总结起来,我们的解决办法是一个闭环的精益管理模型,通过分布式单元定义所有模型,收集数据,同样中央系统汇总,按需的方式归总分析,再通过分布式单元反向控制设备。通过这种方式我们可以从事中监控到事后分析,让你的管理变得精益起来,减少不必要的浪费,而且可以持续改善你的系统。
最后,简单分析一下我们在一些大型设施联网的案例。第一,在连锁银行,美洲银行超过5000个银行网点的联网。在电信领域,美国AT&T电信,加上智慧城市、商业地产、连锁超市、甚至全球连锁工厂,管理所有运维的能耗和报警数据。还有在太阳能站点,在欧洲的2800个太阳能站点联网监控,进行能源管理,当然每个太阳能站点本身是高度自治的,在中央进行分析和对比这些数据。所有这些东西都是真实的,通过分布式开放的架构来实现的大型设施联网的案例。我们相信随着开放,越来越多的设备会变得开放起来,开放互联分布式云计算的发展,我们相信我们的大型设施联网会越来越好,而且它就在眼前。
谢谢大家!
声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们。
千家智客微信公众号
扫描下方二维码,关注千家智客微信公众号(qianjiacom),随时随地知晓智能行业天下事!