大規模的數據應用和平臺架構在政府、金融、電信等行業已經經歷了充分的驗證,所以在工業智能領域大致會有類似的演進路線,但具體到細節里又處處不同,值得細細品味。
首先,數據在哪里?
一類是管理數據:結構化的SQL數據為主,如產品屬性、工藝、生產、采購、訂單、服務等數據,這類數據一般來自企業的ERP、SCM、PLM甚至MES等系統,數據量本身不大,卻具有很大的挖掘價值;
另一類則是機器運行和IoT的數據:以非結構化、流式數據居多,如設備工況(壓力、溫度、振動、應力等)、音視頻、日志文本等數據,這類數據一般采集自設備PLC、SCADA以及部分外裝傳感器(裝什么?怎么裝?),數據量很大,采集頻率高(一般在ms級),需要結合邊緣計算在本地做一些預處理;
總的來講,由于場景的割裂和分散,工業數據本身具有量大、多源、異構、實時性要求高等特點,而且隨著未來280億設備逐步接入,這些特性將會進一步加強,這是做工業大數據服務的核心難點之一,和互聯網大數據不僅量級不同,結構不同,應用也完全不同。舉個簡單的例子,互聯網場景中我們常用的是推薦算法,相關性分析等等,但是到了工業場景,很多機器數據需要做頻譜分析、歸因分析,這是完全不同的兩個方向。
其次,基于這些工業數據,平臺層應該提供哪些服務?
完整的協議解析:數據采集首先要完成工業協議的打通,這部分工作不算太難,但需要花費人力和時間,是真正的苦活、累活,往往是不想做但又不能不做,當然,反過來講,各種協議的打通和支持本身也是服務客戶的壁壘之一。以應用層協議為例,EtherNet/IP和PROFINET的市場占有率最大,其中PROFINET主要市場在歐洲,EtherNet/IP主要在美國。其次是EtherCAT、Modbus-TCP和EtherNetPOWERLINK這些。
標準化的數據整合:采集上來的數據要做統一的主數據管理,第一步是建立標準。一般來講,我們先要用ISO或其他業內標準,制定統一的編碼、結構、流轉方式和屬性,確保數據的一致性,這一點非常重要。其次,要在項目實施的歷程中,逐步積累行業知識庫、合適的算法組件以及相關機理模型,這一點也很重要,這是從數據標準進化到業務標準化的關鍵一步,是為實現真正的產品層面的微服務化打下基礎。
強大的PaaS支持:工業數據本身的特殊性導致平臺必須要有強大的中層支撐能力。我們以時序數據庫為例,最近,阿里云發布了商用版本的高性能時間序列數據庫 (High-Performance Time Series Database) 。所謂時序數據,是帶有時間戳的一系列數值,時序數據是工業數據,尤其是設備工況和傳感器數據的典型品種。這類數據頻率高、量大,用傳統關系型數據庫處理,需要每次把所有值拉出來計算,吞吐量極大,性能很差。所以,一個高壓縮、高性能的時序數據庫,就是平臺層必備的能力之一。
最后,我們應該做哪些應用?
設備級:質量控制。為了避免產線宕機,工廠的傳統做法是對設備或核心零部件做定期的更換或檢修,這種做法往往不能解決問題,而且會造成浪費。在工業智能時代,如果我們能夠采集到合適的實時數據,結合該設備所適用的機理模型,就有可能用機器學習的方法挖掘出產品質量與關鍵數據之間的關聯或因果關系,也就有可能實現實時在線的質量控制和故障預警,如果數據頻率能對工藝流程形成完美包絡,我們還有可能實現最大限度的效率提升。
廠級:計劃排產。工業智能的最終目的是要實現大規模的個性化定制,即C2M。從工廠計劃排產的角度來看,這其實是一個數學問題。這一問題的目標是實現當時當地的產能最優,約束條件來自企業的產線設備、人員、產品屬性、供應鏈數據等等,通過歷史數據的學習和訓練,不難形成一個較好的預測模型。這一模型能根據產線和工廠的實時數據動態分析,動態調整,以幫助企業實現準確把控,最大化經濟效益。
在可以預見的未來,隨著數據的完整性和可靠性越來越高,場景越來越豐富,數據應用層面會誕生相當多的優先企業,他們幫助工業用戶降低成本,提高效率,能解決實實在在的業務問題。目前來看,無論是阿里云所謂的ET工業大腦、三一的根云,海爾的COSMOPlat,甚至富士康的BEACON,等在往這一方向努力,數據能驅動的,絕不只是信息的加速流通,未來一定是業務全流程的重構,讓我們拭目以待。
(審核編輯: 智匯胡妮)
分享