咨詢熱線
020-38870471
news
引言
在最近的幾年中,信息化建設(shè)可謂高潮迭起,電子政務(wù)和制造業(yè)信息化成為兩大亮點(diǎn)。在制造業(yè)信息化領(lǐng)域,鋼鐵、汽車、石化等行業(yè)的龍頭企業(yè),紛紛加大了信息化建設(shè)的力度;中型制造業(yè)企業(yè)的信息化建設(shè)穩(wěn)步推進(jìn);小型企業(yè)的信息化逐漸成為被關(guān)注的熱點(diǎn);制造業(yè)企業(yè)對信息化建設(shè)的認(rèn)識漸趨理性、務(wù)實(shí);國際制造業(yè)信息化廠商看好中國制造業(yè)信息化市場,加大了在中國的投入力度;我國制造業(yè)信息化軟件產(chǎn)業(yè)實(shí)現(xiàn)了平穩(wěn)發(fā)展,走向了務(wù)實(shí)經(jīng)營;第3方制造業(yè)信息化咨詢服務(wù)初露鋒芒;而制造業(yè)信息化技術(shù),也在競爭中實(shí)現(xiàn)了新的發(fā)展。
但是,也應(yīng)清楚地看到目前制造業(yè)信息化的建設(shè)仍有許多不盡人意之處,如:許多制造業(yè)信息化項(xiàng)目往往只注重對數(shù)據(jù)的統(tǒng)計(jì)匯總,而真正涉及到預(yù)測、決策及優(yōu)化方面的工作較少,結(jié)果只是充當(dāng)了手工勞動的替代品,并沒有充分發(fā)揮制造業(yè)信息化項(xiàng)目的效益。信息系統(tǒng)中保存的大量業(yè)務(wù)操作數(shù)據(jù)要么被閑置、要么充當(dāng)統(tǒng)計(jì)匯總時(shí)的一個(gè)基數(shù),數(shù)據(jù)中隱藏的大量有價(jià)值信息被白白地浪費(fèi)了。
從最初的各類MIS到近幾年流行的ERP、CRM、MES等,用戶的數(shù)據(jù)積累已達(dá)到了一定的程度,很多行業(yè)的用戶面對越來越激烈的市場競爭,需要對自己的數(shù)據(jù)(用戶、市場、產(chǎn)品、生產(chǎn))進(jìn)行分析,挖掘出潛在的商機(jī),降低公司的運(yùn)作成本,這成為數(shù)據(jù)挖掘技術(shù)應(yīng)用最主要的動力。而數(shù)據(jù)挖掘就是要從用戶的業(yè)務(wù)數(shù)據(jù)中挖掘出有價(jià)值的信息,并提煉成為輔助管理的知識,即智能。
1 數(shù)據(jù)挖掘技術(shù)背景
1.1 數(shù)據(jù)挖掘的發(fā)展歷程
數(shù)據(jù)挖掘(DM:Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。圖l說明了數(shù)據(jù)挖掘過去40年的發(fā)展歷程。數(shù)據(jù)挖掘是一門交叉學(xué)科,它會聚了數(shù)據(jù)庫、人工智能、統(tǒng)計(jì)學(xué)、可視化、并行計(jì)算等不同學(xué)科和領(lǐng)域。數(shù)據(jù)挖掘的技術(shù)類型主要包括發(fā)現(xiàn)型數(shù)據(jù)挖掘和預(yù)測型數(shù)據(jù)挖掘。
圖1 數(shù)據(jù)挖掘技術(shù)的發(fā)展歷程
執(zhí)行數(shù)據(jù)挖掘時(shí)使用的技術(shù)在計(jì)算上非常復(fù)雜,為了找到大型數(shù)據(jù)集內(nèi)存在的模式,必須執(zhí)行大量計(jì)算。在最近10年中,大型業(yè)務(wù)數(shù)據(jù)庫(特別是數(shù)據(jù)倉庫)使用量的增長以及對這些數(shù)據(jù)的理解和解釋的需要,再加上相對廉價(jià)的計(jì)算機(jī)的供應(yīng),導(dǎo)致數(shù)據(jù)挖掘在各種業(yè)務(wù)應(yīng)用中的使用急劇增長。
1.2 數(shù)據(jù)挖掘應(yīng)用的方法論
通常一個(gè)數(shù)據(jù)挖掘項(xiàng)目包含七個(gè)步驟,分別為:定義業(yè)務(wù)需求;定義數(shù)據(jù)模型和數(shù)據(jù)需求;數(shù)據(jù)預(yù)處理(清洗和過濾);探索型數(shù)據(jù)分析(數(shù)據(jù)探索);選擇挖掘功能并建模;解釋挖掘結(jié)果;在業(yè)務(wù)決策中運(yùn)用所獲結(jié)果和新知識。
定義業(yè)務(wù)需求是一個(gè)數(shù)據(jù)挖掘項(xiàng)目的初始階段,在這個(gè)初始階段,需明確闡述項(xiàng)目目標(biāo)和客戶業(yè)務(wù)需求,目的是明確數(shù)據(jù)挖掘問題。任務(wù)包括:明確業(yè)務(wù)目標(biāo)、定義響應(yīng)變量、對項(xiàng)目計(jì)劃做必要的調(diào)整。
在定義數(shù)據(jù)模型和數(shù)據(jù)需求這個(gè)階段要搜尋并檢查客戶數(shù)據(jù),作為以后分析挖掘時(shí)所用變量的簡略一覽表。同時(shí)從數(shù)據(jù)總體中抽樣生成訓(xùn)練集、驗(yàn)證集和測試集。任務(wù)包括:數(shù)據(jù)來源、數(shù)據(jù)映射、準(zhǔn)備數(shù)據(jù)評估、數(shù)據(jù)的必要聚合、數(shù)據(jù)抽樣。
預(yù)處理數(shù)據(jù)(清洗和過濾)階段需要對遷移到數(shù)據(jù)模型中的數(shù)據(jù)進(jìn)行預(yù)處理。任務(wù)包括異常數(shù)據(jù)清洗”、數(shù)據(jù)過濾”和數(shù)據(jù)匯總”。探索型數(shù)據(jù)分析(數(shù)據(jù)探索)是為了發(fā)現(xiàn)在g-+待選的自變量和目標(biāo)變量之間是否有任何關(guān)系。通常,圖形分析是全面理解數(shù)據(jù)的第1步,接著需要對有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,以便得到數(shù)據(jù)分布的更好知識。
選擇挖掘功能并建模是選擇最合適的挖掘技術(shù)的關(guān)鍵步驟。該步驟不僅包括對要使用的適當(dāng)技術(shù)或技術(shù)合成定義,還包括技術(shù)的應(yīng)用方式。通常嘗試不同的建模技術(shù)或結(jié)合不同數(shù)據(jù)集,并衡量模型性能的不同,選出最好的。來自最終用戶的業(yè)務(wù)領(lǐng)域知識在這個(gè)階段是非常關(guān)鍵的,因?yàn)樗麄兛梢栽u價(jià)和確認(rèn)模型的結(jié)果、理解發(fā)現(xiàn)并付諸實(shí)際行動。
解釋挖掘結(jié)果需要業(yè)務(wù)專家的參與,需要他能夠?qū)⑼诰蚪Y(jié)果解釋到業(yè)務(wù)語境中。由于大多數(shù)情況下業(yè)務(wù)專家并不是數(shù)據(jù)挖掘?qū)<?,因此將結(jié)果以相對易于解釋的方式提供給用戶是非常重要的。
在業(yè)務(wù)決策中運(yùn)用所獲結(jié)果和新知識這個(gè)階段,需要用模型的結(jié)果來幫助做出業(yè)務(wù)決定、戰(zhàn)略設(shè)計(jì)和戰(zhàn)術(shù)實(shí)施,收集實(shí)施結(jié)果反饋,為模型的退化進(jìn)行監(jiān)測,更進(jìn)一步改善模型性能。在利用模型的結(jié)果時(shí),復(fù)雜的展示層界面通常是不必要的。
2 數(shù)據(jù)挖掘技術(shù)在生產(chǎn)制造中的應(yīng)用
2.1 工業(yè)數(shù)據(jù)挖掘平臺
現(xiàn)代制造企業(yè)中大量的計(jì)算機(jī)系統(tǒng)承擔(dān)起了生產(chǎn)管理的任務(wù),扮演著MES的角色,各種各樣的傳感器將大量的實(shí)時(shí)生產(chǎn)數(shù)據(jù)傳送到MES中,隨著生產(chǎn)的持續(xù),數(shù)據(jù)越來越多,這些數(shù)據(jù)中往往隱藏著大量有價(jià)值的生產(chǎn)管理信息,但是這些信息通常不能通過直觀的方式表現(xiàn)出來,而傳統(tǒng)的生產(chǎn)管理計(jì)算機(jī)系統(tǒng)是面向功能的,對數(shù)據(jù)的分析處理較為簡單,無法勝任將這些信息提煉出來的任務(wù),因此必須將智能信息處理技術(shù)引入生產(chǎn)過程管理中,從簡單的數(shù)據(jù)處理過渡到智能的數(shù)據(jù)分析,為生產(chǎn)過程管理提供更有效的支持。數(shù)據(jù)挖掘技術(shù)無疑就成為完成這項(xiàng)任務(wù)的主要手段,為了與ERP層對應(yīng)的商業(yè)數(shù)據(jù)挖掘相區(qū)別,在本文中稱與MES層對應(yīng)的數(shù)據(jù)挖掘應(yīng)用為工業(yè)數(shù)據(jù)挖掘。
對于工業(yè)數(shù)據(jù)挖掘來說,它的應(yīng)用重點(diǎn)集中在對制造企業(yè)內(nèi)部信息資源的加工處理,指導(dǎo)企業(yè)生產(chǎn)制造的戰(zhàn)術(shù)策略的實(shí)施。具體地說,就是在以客戶的需求為價(jià)值源泉,以不同的生產(chǎn)工序?yàn)閮r(jià)值鏈的各環(huán)節(jié)進(jìn)行數(shù)據(jù)增值分析,并將分析結(jié)果迅速向鏈條的上一環(huán)節(jié)傳遞,調(diào)整鏈條上游的執(zhí)行達(dá)到改善下游環(huán)節(jié)執(zhí)行結(jié)果的目的,最終形成以客戶終端需求為導(dǎo)向的價(jià)值增值。
實(shí)際上,傳統(tǒng)業(yè)務(wù)系統(tǒng)是面向點(diǎn)的,能給出詳細(xì)的功能定義。而工業(yè)數(shù)據(jù)挖掘系統(tǒng)是面向面的,用專業(yè)術(shù)語講叫主題,因此,很難準(zhǔn)確地描述工業(yè)數(shù)據(jù)挖掘到底能實(shí)現(xiàn)哪些功能,或只能實(shí)現(xiàn)哪些主題。工業(yè)數(shù)據(jù)挖掘的確可以產(chǎn)生報(bào)表,但不是事先定義的固定報(bào)表,而是經(jīng)過分析之后的結(jié)果展現(xiàn),所以,在這里并不能精確地定義一個(gè)工業(yè)數(shù)據(jù)挖掘系統(tǒng)的功能,一個(gè)工業(yè)數(shù)據(jù)挖掘系統(tǒng)應(yīng)當(dāng)只是一個(gè)應(yīng)用平臺,將它與不同的業(yè)務(wù)系統(tǒng)相結(jié)合,可以擴(kuò)展成為不同的智能應(yīng)用系統(tǒng),如質(zhì)量分析優(yōu)化系統(tǒng)等。
2.2 工業(yè)數(shù)據(jù)挖掘的應(yīng)用范圍
工業(yè)數(shù)據(jù)挖掘在MES層的應(yīng)用有以下幾個(gè)方面:
輔助生產(chǎn)計(jì)劃調(diào)度。通過工業(yè)數(shù)據(jù)挖掘平臺可以對生產(chǎn)過程進(jìn)行建模,利用這些模型模擬生產(chǎn)過程可以幫助生產(chǎn)調(diào)度人員提前判斷—個(gè)調(diào)度計(jì)劃是否合理,避免在實(shí)際執(zhí)行時(shí)由于計(jì)劃的不合理給企業(yè)造成損失。
質(zhì)量分析優(yōu)化。通過工業(yè)數(shù)據(jù)挖掘平臺可以搭建一個(gè)產(chǎn)品質(zhì)量分析系統(tǒng),找出與產(chǎn)品質(zhì)量指標(biāo)有關(guān)的因素,分析產(chǎn)生廢次品產(chǎn)生的原因,并有的放矢地實(shí)施改進(jìn)措施,提高產(chǎn)品質(zhì)量。
設(shè)備管理維護(hù)。通過工業(yè)數(shù)據(jù)挖掘平臺建立設(shè)備維護(hù)系統(tǒng),在分析設(shè)備運(yùn)行數(shù)據(jù)的基礎(chǔ)上,建立設(shè)備運(yùn)行模型,預(yù)測設(shè)備故障時(shí)間,以便提前采取維護(hù)措施,減少因設(shè)備停機(jī)造成的損失。
生產(chǎn)工藝優(yōu)化。通過工業(yè)數(shù)據(jù)挖掘平臺構(gòu)建的生產(chǎn)成本分析系統(tǒng)、質(zhì)量分析系統(tǒng)等,可以對生產(chǎn)過程數(shù)據(jù)進(jìn)行分析、挖掘,建立生產(chǎn)成本模型或質(zhì)量模型,利用這些模型找出降低生產(chǎn)成本和提高產(chǎn)品質(zhì)量的工藝措施,優(yōu)化生產(chǎn)工藝。
生產(chǎn)資源優(yōu)化配置。通過工業(yè)數(shù)據(jù)挖掘平臺建立的生產(chǎn)資源優(yōu)化配置系統(tǒng)可以挖掘企業(yè)的物料和能源消耗數(shù)據(jù),找到生產(chǎn)資源配置的不合理之處,并提供優(yōu)化配置的分析手段。
3 質(zhì)量分析和優(yōu)化
產(chǎn)品質(zhì)量是制造企業(yè)的生命,產(chǎn)品質(zhì)量的控制和改進(jìn)一直是企業(yè)所關(guān)心的核心問題之一?,F(xiàn)代質(zhì)量管理體系提供了一整套質(zhì)量改進(jìn)方法,用于改善產(chǎn)品質(zhì)量。隨著鋼鐵企業(yè)信息化步伐的加快,企業(yè)積累了大量的生產(chǎn)工藝數(shù)據(jù),這些數(shù)據(jù)中包含了大量與產(chǎn)品質(zhì)量有關(guān)的信息,但它們并沒有被充分利用,如何從這些數(shù)據(jù)中挖掘出與產(chǎn)品質(zhì)量有關(guān)的有用信息,并利用這些信息提高產(chǎn)品質(zhì)量,優(yōu)化產(chǎn)品質(zhì)量設(shè)計(jì),加快新產(chǎn)品開發(fā)周期,是企業(yè)更為關(guān)心的問題。
冶金自動化研究設(shè)計(jì)院開發(fā)的質(zhì)量分析優(yōu)化系統(tǒng)利用數(shù)據(jù)挖掘技術(shù)在質(zhì)量缺陷分析、新產(chǎn)品質(zhì)量設(shè)計(jì)、工藝優(yōu)化、質(zhì)量預(yù)報(bào)、過程質(zhì)量分析等幾個(gè)方面為改進(jìn)產(chǎn)品質(zhì)量提供決策支持。系統(tǒng)包含了數(shù)據(jù)抽取、數(shù)據(jù)預(yù)處理、質(zhì)量分析、質(zhì)量建模、質(zhì)量設(shè)計(jì)、質(zhì)量預(yù)報(bào)、工藝優(yōu)化、機(jī)理模型修正、實(shí)驗(yàn)設(shè)計(jì)DOE等九大模塊,其中數(shù)據(jù)抽取、數(shù)據(jù)預(yù)處理模塊是基本模塊,其他模塊都可以根據(jù)需要動態(tài)增刪。質(zhì)量分析優(yōu)化系統(tǒng)提供了一套較為成形的流程,用于產(chǎn)品質(zhì)量設(shè)計(jì)和預(yù)報(bào),如圖2所示。
質(zhì)量分析優(yōu)化系統(tǒng)在應(yīng)用時(shí)可以根據(jù)具體條件采用不同的應(yīng)用架構(gòu),圖3所示為目前比較流行的一種應(yīng)用形式。
4 結(jié)論
本文介紹了數(shù)據(jù)挖掘技術(shù)的發(fā)展背景,分析了數(shù)據(jù)挖掘技術(shù)在生產(chǎn)制造中的應(yīng)用特點(diǎn),以及在不同工業(yè)領(lǐng)域的應(yīng)用方向。對數(shù)據(jù)挖掘技術(shù)在質(zhì)量分析優(yōu)化方面的應(yīng)用進(jìn)行了重點(diǎn)闡述,并介紹了冶金自動化研究設(shè)計(jì)院開發(fā)的質(zhì)量分析優(yōu)化系統(tǒng)的應(yīng)用流程和應(yīng)用架構(gòu)。