如何打好工業大數據實施與落地"攻堅戰"?——天拓分享
發布日期:
2021-11-24

近年來,隨著企業(ye) 所擁有的數據日益豐(feng) 富,以及數據驅動意識的不斷提升,越來越多的製造企業(ye) 加強了大數據應用探索,並已有一些成功的應用實例。然而,對於(yu) 很多製造企業(ye) 而言,在推進工業(ye) 大數據的應用過程中仍麵臨(lin) 著以下難題:采集了很多數據,如何來分析和利用這些數據,找到與(yu) 自身業(ye) 務融合的應用場景以解決(jue) 實際問題?如何務實推進工業(ye) 大數據的實施與(yu) 落地?本文將圍繞著以上問題進行討論和分析,希望為(wei) 企業(ye) 開展工業(ye) 大數據的實施與(yu) 應用提供啟示與(yu) 借鑒。

一、合適的場景是工業(ye) 大數據落地的關(guan) 鍵

當前,工業(ye) 大數據在製造企業(ye) 已形成加速產(chan) 品創新、生產(chan) 工藝優(you) 化、生產(chan) 流程優(you) 化、質量監測、能耗管理、設備故障預測、銷量預測、供應鏈優(you) 化、智能化服務、個(ge) 性化定製等典型應用場景,不僅(jin) 幫助企業(ye) 優(you) 化了現有業(ye) 務,如指導產(chan) 品設計、監控與(yu) 優(you) 化生產(chan) 過程、推動精準營銷、優(you) 化供應鏈管理、快速服務響應等,還促進了企業(ye) 的轉型升級,為(wei) 產(chan) 品、服務和商業(ye) 模式的創新提供了有力支撐。

如何打好工業(ye) 大數據實施與(yu) 落地

工業(ye) 大數據典型應用場景


(來源:《工業(ye) 大數據白皮書(shu) (2019版)》)


以上應用場景與(yu) 突出價(jia) 值為(wei) 製造企業(ye) 推動工業(ye) 大數據提供了參考,並加快了其大數據探索的決(jue) 心。但是,工業(ye) 大數據能否落地,不在於(yu) 技術的先進性,關(guan) 鍵是企業(ye) 能否找到與(yu) 自身業(ye) 務融合的應用場景。

然而,工業(ye) 大數據應用具有非常強的個(ge) 性化特征,不同企業(ye) 基於(yu) 不同的產(chan) 品、製造工藝、數據基礎、應用需求等,便會(hui) 產(chan) 生不同的應用方式和層次;同時,工業(ye) 大數據的門檻較高,應用場景的效果產(chan) 出需要企業(ye) 具備一定的行業(ye) 知識和數據應用能力與(yu) 經驗,且當前缺少統一、規範化的工具、標準和流程來支撐。因此,如何找到合適的場景和融合方式成為(wei) 了眾(zhong) 多製造企業(ye) 推進工業(ye) 大數據應用的首要難題。

在筆者看來,企業(ye) 應用工業(ye) 大數據的核心目標是創造價(jia) 值,合適的應用場景一定是能為(wei) 企業(ye) 持續帶來價(jia) 值的,是擁有比較理想的投入產(chan) 出比的。

基於(yu) 此,企業(ye) 在明確自身核心需求與(yu) 痛點的基礎上,可以從(cong) 以下三個(ge) 方麵著手確定應用場景的選擇是否合適。

1、業(ye) 務價(jia) 值較高。

數據驅動價(jia) 值已成為(wei) 企業(ye) 共識,但並非所有的數據,都值得去深入開展分析挖掘,如一些變化維度低的“死”數據,根本沒有分析價(jia) 值;也不應為(wei) 了一些微不足道的性能指標提升而投入大量資源去應用大數據技術。

建議可以從(cong) 那些采樣頻率高、變化維度多的數據或者高價(jia) 值、關(guan) 鍵的設備/工序等著手,探究業(ye) 務應用場景,並基於(yu) 已有的曆史數據資產(chan) ,來估算潛在價(jia) 值高低。

如何打好工業(ye) 大數據實施與(yu) 落地


比如,某重汽動力部機加單元有100多台機加設備,收集了大量的設備運行使用數據,並計劃通過大數據技術提高設備的運維質效。通過初步分析,該機加設備運行故障頻次較少,但機加生產(chan) 過程所需的刀具卻是易耗品,需頻繁更換,且刀具在加工過程中出現一定程度磨損時,會(hui) 影響產(chan) 品的整體(ti) 加工質量。

針對這一突出性問題,該工廠詳細評估了刀具的損耗率和因刀具問題導致的產(chan) 品不良率影響,有效估算了智能刀具管理場景應用大數據分析的潛在價(jia) 值。最後,通過與(yu) 產(chan) 品技術服務商、高校研究團隊的有效協作,構建了刀具狀態在線監測、使用壽命評估等分析應用,提高了產(chan) 品良率和刀具使用效率與(yu) 價(jia) 值。因此,具備較高的業(ye) 務應用價(jia) 值,是大數據技術應用的首要條件。

2、複製性強。

如果項目選定的大數據應用場景,隻適用於(yu) 單個(ge) 或少數的產(chan) 品,不具備較強的複製性或推廣空間,很可能會(hui) 因為(wei) 項目邊界成本高難以持續。建議企業(ye) 選擇複製性強的應用場景和應用模式。如上例中,無論是100台還是更多的機加設備,基於(yu) 統一的技術架構和模型,采集各設備運行的數據,就能實現同樣的場景擴展應用,大大降低項目成本。

3、數據可支撐。

由於(yu) 大數據分析應用類項目,在早期對業(ye) 務場景、影響因素的認識很難完備,現有數據資產(chan) 可否支撐、實際分析結論與(yu) 假設是否相符等均有待隨著實施深化來驗證。這些不確定性需要在後麵的階段,通過強化數據資產(chan) (如增加數據采集點、加大現有數據采集頻率/維度等),多次迭代數據模型,並從(cong) 多個(ge) 維度去論證建模思路合理性,才有可能形成相對完備的問題理解與(yu) 目標達成。

二、八步實施法助推工業(ye) 大數據項目有序推進

企業(ye) 在確定了工業(ye) 大數據應用主要方向的前提下,具體(ti) 的實施可參考如下步驟,該步驟基於(yu) CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行業(ye) 數據挖掘應用標準流程)並補充了新的內(nei) 涵。

1、業(ye) 務理解

從(cong) 業(ye) 務角度理解項目目標,並將其轉化為(wei) 一個(ge) 可解且可達成的數據分析問題,包括厘清關(guan) 鍵因素,確定分析問題的範圍和目標等。工業(ye) 數據分析需要將專(zhuan) 業(ye) 領域的知識和數據模型有機融合,才能得到有價(jia) 值的分析結果。而數據分析師通常對工業(ye) 過程缺乏深入了解,業(ye) 務人員則對數據分析的技術方法與(yu) 思路了解不深。因此,業(ye) 務理解的過程需要企業(ye) 的業(ye) 務專(zhuan) 家和數據分析師通力合作。

2、數據理解與(yu) 數據的可采集性分析


在理解業(ye) 務的基礎上,準確建立數據和業(ye) 務間的關(guan) 聯關(guan) 係,包括需要哪些數據、這些數據是從(cong) 哪兒(er) 來,是生產(chan) 設備、智能產(chan) 品、複雜裝備等產(chan) 生的工業(ye) 物聯網數據,還是來自ERP、MES、SCM等的信息化數據,還是設備在運行過程中所處的環境數據等?是否需要線上、線下相結合的數據等。同時,確定製造企業(ye) 當前的曆史數據存量和可獲取的數據增量,即在不增加采集點、采集頻率、采集維度等的情況下,可以采集到的數據有哪些。

這一階段需要數據分析師根據經驗對數據顆粒度、數據質與(yu) 量和數據間的關(guan) 聯關(guan) 係等進行初步判斷論證,確定當前的數據是否滿足業(ye) 務場景的要求。

3、數據準備

對所需的數據進行數據加工與(yu) 治理,包括原始數據抽取、多數據源融合、數據清洗與(yu) 質量提升等。一般需要企業(ye) 成立專(zhuan) 項數據治理組織,通過數據集成和定期運維等方式保證業(ye) 務係統和線下數據準確與(yu) 完整,包括剔除掉那些假的、錯的、偏差大的、缺失的、不合理的、暫時性的髒數據等。數據準備與(yu) 預處理環節不僅(jin) 由數據分析師組成,還包括懂行業(ye) know-how的專(zhuan) 家,對於(yu) 一些不合理、不符合物理規律的數據,如燃氣燃煤加熱設備在極短時間內(nei) 出現溫度數據的急劇變化是不合理的,數據分析師很難發現,需要結合行業(ye) 專(zhuan) 家的經驗認知判斷。

4、特征提取

特征提取即借助統計學方法對數據進行轉換、映射、分析,找到數據中的規律,並進行特征提取,即最大限度地從(cong) 原始數據中提取特征以供算法和模型使用。這一步非常重要,隻有對數據特征有了清晰的認識,企業(ye) 才能更好地完成拓撲數據結構的搭建,開展數據建模。部分企業(ye) 由於(yu) 缺乏對數據的深入探索和理解,一有了原始數據就直接著手構建大數據模型,結果失敗率非常高。

值得注意的是,針對一些特定領域問題 ,特征提取應充分利用行業(ye) 已有的專(zhuan) 業(ye) 知識,不要將時間過多浪費在該領域早已熟知的行業(ye) 規律發現上。

5、小數據驗證

如果說在實施工業(ye) 大數據項目前,是通過曆史數據估算場景價(jia) 值點,來初步判斷應用場景是否合適。那麽(me) ,到了具體(ti) 的應用落地實施階段,則需要依賴現有的預處理數據,對業(ye) 務場景的價(jia) 值進行更具體(ti) 的計算,得出一個(ge) 可量化的值,從(cong) 而來驗證數據分析的價(jia) 值。

6、數據建模

基於(yu) 業(ye) 務知識和合適的算法及建模工具,輸出數據分析模型。當前,機器學習(xi) 、數據挖掘等分析理論、技術發展較成熟,也有很多明確的指導原則和豐(feng) 富的算法和建模工具,可以幫助企業(ye) 優(you) 選出合適的算法模型。因此,真正的數據建模過程在項目實施過程中花費的時間並不是最多。但值得一提的是,算法不是越複雜越先進越好,應用可解釋、較簡單的算法去解決(jue) 業(ye) 務實際問題更值得被關(guan) 注。

7、模型的驗證和評估

模型的驗證是對分析模型從(cong) 數據和技術的角度進行充分檢驗評估,確認數據分析的結果或模型是否滿足具體(ti) 工業(ye) 應用場景的使用需求;任何模型都有一定的適用前提,模型的評估即是從(cong) 業(ye) 務的角度審視模型在什麽(me) 範圍內(nei) 有效,有效程度是什麽(me) ,在什麽(me) 情形下不適用,需要分場景去驗證和評估。

8、模型上線與(yu) 迭代

模型的上線是將模型以便於(yu) 企業(ye) 使用的方式和要求重新固化,形成便於(yu) 模型服務調用的形式,如可重複使用的數據挖掘程序、模型服務程序等。同時,模型在運行過程中,還應對模型進行持續的修正、迭代和完善。

如前文所述,與(yu) 一般的信息化項目不同,工業(ye) 大數據項目的實施是一個(ge) 循環迭代、螺旋上升的過程。因此,以上8個(ge) 步驟會(hui) 存在多處循環和反複迭代,如在建模階段,假如現有的特征無法滿足模型的開發或者存在過擬合的問題,則需要返回到數據準備,甚至會(hui) 出現業(ye) 務理解的修正調整。另外,即使企業(ye) 基於(yu) 現有數據完成模型的上線後,還需進一步評估,是否需要增加現有數據量,是增加數據的采集頻率,還是增加額外數據采集點,進一步迭代模型,如此反複,從(cong) 而不斷優(you) 化模型,得到更可靠的分析結果。

三、實施案例-水泥生產(chan) 結緣大數據開啟“智控”新時代

某水泥企業(ye) 擁有兩(liang) 條日采5000噸水泥的熟料生產(chan) 線,每條產(chan) 線每年的耗電量達到約8千萬(wan) 度,耗煤約20萬(wan) 噸標煤,能耗消耗巨大。該企業(ye) 希望通過大數據優(you) 化能耗實現節能減排,降本增效。

通過初步分析,該企業(ye) 水泥產(chan) 線在工業(ye) 場景中工藝機理相對標準化,主要包括“兩(liang) 磨一燒”環節,但每一條生產(chan) 線設備、物料、操作人員習(xi) 慣不同,導致每條窯的工況都不一樣,控製參數也沒有通用標準。因此,聚焦“兩(liang) 磨一燒”的工藝優(you) 化,通過自動化的生產(chan) 控製來實現節能降耗,成為(wei) 了該企業(ye) 嚐試的解題思路。

該企業(ye) 首先結合工藝專(zhuan) 家的專(zhuan) 業(ye) 經驗獲取了現有的400多組采樣點的數據,包括來源於(yu) 生產(chan) 係統、控製係統、設備管理係統、能源係統等的質檢數據、DCS數據、熒光分析儀(yi) 數據、環境數據等,並對曆史數據進行清洗和預處理,剔除噪音數據和無效數據,補充不完整數據或缺失數據;然後,對所收集到的多維度數據進行特征提取與(yu) 數據拓撲結構搭建,並針對生料磨、水泥磨、回轉窯3個(ge) 關(guan) 鍵設備的“兩(liang) 磨一燒”工藝,建立了生料電耗優(you) 化控製模型、回轉窯能耗優(you) 化控製模型、熟料質量預測模型;待模型建立後,對生料磨及熟料燒成流程進行工藝參數推薦,並將推薦參數放在生產(chan) 線上試驗,確定模型的適用範圍,對其準確率與(yu) 效果進行驗證,包括能耗降低了多少、質量提升了多少等,再根據反饋優(you) 化工藝參數,迭代算法模型;待算法模型上線後,參數返回控製係統,自動控製生產(chan) 線,避免了人為(wei) 等因素帶來的能源消耗不同,達到節能減排穩定質量的效果。

據了解,在完成第一輪的模型上線後,該企業(ye) 在第二輪的迭代中,又增加了10多個(ge) 采集點,對算法模型進行循環迭代,如此反複。最終,該企業(ye) 實現了約3%~5%的能耗優(you) 化。

如何打好工業(ye) 大數據實施與(yu) 落地

某水泥企業(ye) 實施路線圖

四、多措並舉(ju) 讓大數據創造大價(jia) 值

工業(ye) 大數據實施路徑為(wei) 企業(ye) 提供了方法指引,但工業(ye) 大數據項目的實施落地並不是一蹴而就,現階段仍存在著部分項目投資大產(chan) 出低、項目周期長、人才缺乏、分析結果可靠性差、應用融合不深入等問題。那麽(me) ,製造企業(ye) 如何才能更有效地推進工業(ye) 大數據應用、更充分挖掘數據價(jia) 值呢?

1、自上而下形成完善的管理製度與(yu) 體(ti) 係

推進工業(ye) 大數據項目,需要企業(ye) 從(cong) 戰略層麵高度關(guan) 注和重視,從(cong) 上往下形成完善的管理製度與(yu) 體(ti) 係。首先,工業(ye) 大數據是持久性的項目,需要企業(ye) 做好打持久戰的準備,且在項目前期投資回報率難以量化,短期效益不明顯的情況下,獲得高層領導的支持與(yu) 參與(yu) 就顯得非常關(guan) 鍵。其次,工業(ye) 大數據解決(jue) 的是企業(ye) 級的應用需求,涉及多部門跨業(ye) 務的數據融合與(yu) 工作配合,某個(ge) 業(ye) 務目標的實現需通過整個(ge) 企業(ye) 乃至供應鏈上多上相關(guan) 方的大範圍協同,因此需要獲得從(cong) 管理層到業(ye) 務部門自上而下的支持,並應形成完善的管理製度與(yu) 保障體(ti) 係,以保證項目的有序推進。

2、定義(yi) 明確的項目目標,切忌貪大求全

企業(ye) 在實施工業(ye) 大數據之前,必須根據企業(ye) 自身的需求,確定解決(jue) 什麽(me) 問題,能為(wei) 企業(ye) 帶來哪些價(jia) 值。同時,在一個(ge) 項目周期內(nei) 應製定可衡量的實現目標。與(yu) 一般的信息化項目不同,如硬件項目價(jia) 值比較直觀,MES、ERP等信息化項目,已有較深的積累,可以明確確定交付邊界和交付周期,工業(ye) 大數據項目是一個(ge) 持續迭代的過程,所以項目周期和項目的邊界有時會(hui) 顯得較為(wei) 模糊。但如果在一定的項目周期內(nei) ,企業(ye) 沒有明確的主攻方向並向業(ye) 務板塊呈現價(jia) 值,項目將難逃厄運。

另外,建議企業(ye) 不要一開始就貪大求全,甚至花費巨資去構建企業(ye) 級大數據平台。可以從(cong) 總體(ti) 架構要合理、小型價(jia) 值先推行的思路出發,給予合理規劃與(yu) 論證分析,並從(cong) 啟動小的項目開始,選擇企業(ye) 所亟待解決(jue) 的問題入手,再逐步延伸到更多的應用場景。將技術探索、人才儲(chu) 備、應用落地等基礎打好後,再考慮打造和完善體(ti) 係化的大數據應用平台建設。

3、將重心放在業(ye) 務知識認知、數據治理上

從(cong) 某種角度來說,工業(ye) 大數據不是技術而是業(ye) 務,項目的落地從(cong) 工業(ye) 大數據技術起步,但同時必須與(yu) 企業(ye) 的業(ye) 務流程、工業(ye) 機理等有機結合。包括通過充分利用業(ye) 務知識,企業(ye) 可以了解數據的來源與(yu) 采集方式,判斷其是否可信,把握分析項目的主要矛盾;在數據量不夠的情況下,通過“方法降維”,從(cong) 有限的數據中分析出足夠可靠的結果;以業(ye) 務經驗指導特征提取,提高算法的求解效率,提高模型的可解釋性;更全麵客觀評估模型的適用範圍等。

另外,相比大數據量,工業(ye) 領域更注重數據的完整性和高質量。數據質量的高低直接決(jue) 定了數據模型的準確性、數據分析的可靠性。此外,數據治理不僅(jin) 在數據準備階段,為(wei) 保證模型的持續優(you) 化,還需要不斷提高數據質量,並定期對數據進行維護。

4、與(yu) 其花巨額解決(jue) 數據采集的充分性數據分析不如從(cong) 現有數據資產(chan) 出發

對於(yu) 製造企業(ye) 來說,總期望所有的重要因子數據都能被全量采集,但這是不可能的。一方麵,如果不融入領域認識去“消減”因子數量,通常是無法提供“足夠”的曆史數據去覆蓋所有組合情形 。另外,數據采集成本不低,並且還受製於(yu) 當前的技術水平以及安全/環境等因素。因此,數據準備階段企業(ye) 先盤點現有數據,而不是一開始就投入大量的資金開展數據采集,更不是在業(ye) 務需求、應用場景尚不明確的情況下,就盲目開展各類數據采集與(yu) 治理,不僅(jin) 成本高,而且很多數據可能並不是未來數據分析應用所需要的。

5、需要行業(ye) 專(zhuan) 家戰略合作夥(huo) 伴的多方協作

當前,工業(ye) 大數據項目還沒有完全可照搬的模板,技術與(yu) 應用場景的深度融合還處在不斷探索、試錯的階段,需要企業(ye) 與(yu) 來源於(yu) 高校、科研院所等的行業(ye) 專(zhuan) 家,以及工業(ye) 大數據解決(jue) 方案提供商通力合作。

例如,工業(ye) 大數據分析廠商的優(you) 勢在算法、數據洞察力以及豐(feng) 富的實踐經驗,而行業(ye) 專(zhuan) 家對行業(ye) know-how有較深的理解與(yu) 積累,高校擅長理論算法與(yu) 機理的深入研究,通過企業(ye) 、行業(ye) 專(zhuan) 家和廠商配合組隊的模式,可以幫助企業(ye) 更高效地找到合適的融合性落地方案,提高場景化數據建模與(yu) 分析效率,得到高質量的分析結果。

6、加強複合型人才培養(yang)

工業(ye) 大數據實施落地難,人才缺乏也是很重要的原因,特別是既懂IT,又熟悉業(ye) 務,還具有一定數學功底的複合型人才。另外,據了解在部分大數據項目結束後,技術實施方撤離,企業(ye) 由於(yu) 缺乏數據的管理維護、數據模型的迭代完善能力,導致數據的質量每況愈下,模型失去生命力,使得項目無法得到延續。因此,企業(ye) 需要加強麵向新一代信息技術的複合型人才培養(yang) ,以承接模型上線後對其進行持續優(you) 化迭代的能力,並為(wei) 產(chan) 業(ye) 級的大數據應用推廣儲(chu) 備人才。

總之,大數據本身並不是目的,如何通過大數據解決(jue) 企業(ye) 生產(chan) 、運營中的問題,為(wei) 企業(ye) 創造價(jia) 值,實現提質降本增效才是推進工業(ye) 大數據的核心目標。工業(ye) 大數據的落地離不開方法指引,也離不開場景選擇、業(ye) 務邏輯的深入理解,更離不開高質量的數據保障、大數據技術與(yu) 業(ye) 務流程的融合、算法模型的持續迭代和專(zhuan) 業(ye) 的戰略合作夥(huo) 伴與(yu) 人才支撐。

 - 參考文獻 - 


【1】工業(ye) 大數據白皮書(shu) (2019版)

https://vip.e-works.net.cn/pdfdocumentdetail.aspx?id=753

【2】工業(ye) 大數據如何落地,聽聽一線分析師怎麽(me) 說

https://www.cbdio.com/BigData/2016-01/06/content_4440425.htm

【3】工業(ye) 大數據分析實踐:基於(yu) CRISP-DM方法論的再認識

https://zhuanlan.zhihu.com/p/32014381

【4】工業(ye) 大數據分析技術在實踐應用中的思路與(yu) 方法

https://www.sohu.com/a/430609315_100125745

【5】工業(ye) 大數據項目實施落地的幾個(ge) 潛在挑戰

https://zhuanlan.zhihu.com/p/46904146

【6】為(wei) 什麽(me) 多數大數據項目都以失敗而告終


https://www.woshipm.com/it/37218.html

本文轉自:數字化企業(ye)


聲明:部分內(nei) 容來源於(yu) 網絡,如侵權請後台留言聯係刪除。