監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產品資料
X 關閉
上海OA軟件行業(yè)資訊

當前位置:工程項目OA系統(tǒng) > 泛普各地 > 上海OA系統(tǒng) > 上海OA軟件行業(yè)資訊

鋼鐵企業(yè)生產成本數(shù)據(jù)集市及數(shù)據(jù)挖掘研究

申請免費試用、咨詢電話:400-8352-114

文章來源:泛普軟件

0 引 言

近十年來 ,鋼鐵企業(yè)面臨的市場競爭環(huán)境發(fā)生了巨大的改變,客戶對鋼材的品種、規(guī)格(如板材的寬度、厚度、鍍層和機械性能指標等)需求越來越多樣化,客戶需求呈現(xiàn)多品種、小批量的特點。因此,在現(xiàn)有的市場條件下,鋼鐵企業(yè)必須在保證產品質量與交貨期的同時,大力加強成本管理,使產品在質優(yōu)價廉的情況下獲取適當?shù)睦麧?,以增強企業(yè)的市場競爭力。

鋼鐵行業(yè)的成本管理是一個復雜的系統(tǒng)工程,必須在整個企業(yè)經營范圍內對采購成本、生產成本、銷售成本、質量成本等進行全面監(jiān)控,定期獲取各種生產消耗數(shù)據(jù),如原材料中的合金料消耗、鋼鐵料消耗以及各種輔助材料的消耗(部分輔料可能需要手工歸集),實現(xiàn)實時成本的歸集和計算,以實現(xiàn)鋼鐵產品成本的事前、事中和事后控制。

通過將先進的數(shù)據(jù)挖掘技術引入到鋼鐵生產成本管理領域,可以從大量的鋼鐵生產成本歷史數(shù)據(jù)中獲得潛在的規(guī)律和發(fā)展趨勢,以指導鋼鐵生產,降低產品成本。這些潛在的信息包括:為什么某一個特定日某種材料消耗總是比較高;哪一個因素(班組、工序、設備、環(huán)境、原料配比等)是導致成本增加的主要原因;哪一個班組在成本控制方面做得更好等。

傳統(tǒng)的數(shù)據(jù)庫技術是事物驅動、面向應用的操作型數(shù)據(jù)庫系統(tǒng),而數(shù)據(jù)挖掘和決策支持需要將來自各種異種源的數(shù)據(jù)統(tǒng)一,產生高質量的、純凈的集成的數(shù)據(jù)。在這種情況下,操作型數(shù)據(jù)庫中的數(shù)據(jù)盡管很豐富,對于決策和數(shù)據(jù)挖掘還是遠遠不夠的,因此不能簡單地在一般操作數(shù)據(jù)庫上進行數(shù)據(jù)挖掘,需要建立為數(shù)據(jù)挖掘和決策分析提供支持的數(shù)據(jù)集市或數(shù)據(jù)倉庫。

1 鋼鐵生產成本分析模型

超高功率電弧爐煉鋼是一個高溫、多相、快速的冶金過程,整個過程所涉及的變量非常多,必須建立合理的煉鋼成本分析模型,才能達到提高生產率、降低成本和改善產品質量的目的。為了建立合理的成本分析模型,首先要對煉鋼工序系統(tǒng)進行分析,系統(tǒng)分析模型如圖1所示。

圖1 鋼鐵生產工序成本分析模型

有關成本的變量可以歸納為原料變量、設備變量、工藝變量3類,其中原料變量包括鐵料品種變量、合金鐵品種變量和鋼包等各種輔材的變量;設備變量包括電極參數(shù)、冶煉爐次、廢鋼預熱;工藝變量包括供電操作、冷卻水流量、目標出鋼溫度、吹氧操作等。輸出變量包括鋼水成本和冶煉時間。從鋼鐵冶煉工序系統(tǒng)各變量對成本的影響程度來看,電爐冶煉成本和LF(ladle furnace)精煉成本大概占總成本的70%左右,此外設備的運轉率對鋼水成本固定費用的降低起著重要的作用,因此,本文擬對班組成本、工序成本等進行決策分析。

2 鋼鐵生產成本數(shù)據(jù)集市的建立

數(shù)據(jù)集市按照某一特定部門的決策支持需求組織起來,是針對一組主體的應用系統(tǒng);而數(shù)據(jù)倉庫則是面向主體的、集成的、穩(wěn)定的、時間各異的數(shù)據(jù)集合。數(shù)據(jù)集市和數(shù)據(jù)倉庫相比,數(shù)據(jù)倉庫實施周期長、成本巨大、見效慢;而數(shù)據(jù)集市則是一種更小、更集中的數(shù)據(jù)倉庫,它為企業(yè)提供一條部門級的分析商業(yè)數(shù)據(jù)的廉價途徑。

在鋼鐵生產管理系統(tǒng)的基礎上,將數(shù)據(jù)挖掘和數(shù)據(jù)集市引入鋼鐵生產成本管理領域,從中獲得有效的成本決策模型,以進一步提高鋼鐵生產成本的管理水平,整個系統(tǒng)如圖2所示。

圖2 鋼鐵生產車間成本數(shù)據(jù)挖掘模型

 2.1 數(shù)據(jù)模型

數(shù)據(jù)集市的邏輯建模是數(shù)據(jù)集市實施的重要環(huán)節(jié),因為它能直接反應出業(yè)務部門的需求,同時對數(shù)據(jù)集市的物理實施有著重要的指導作用。可以用幾種方式來構建數(shù)據(jù)倉庫或數(shù)據(jù)集市,例如采用實體關系模型、匯總表、多維數(shù)據(jù)庫、星型模式和雪花模式等模型。

鋼鐵車間生產成本數(shù)據(jù)集市模型采用星型關系模式,星型關系模式的關鍵是確定事實表和各數(shù)據(jù)維之間的聯(lián)系,并針對各個維做了大量的預處理,如按照維進行預先的統(tǒng)計、分類、排序等。鋼鐵車間生產成本數(shù)據(jù)集市星型模型如圖3所示。系統(tǒng)通過物料跟蹤事實表將各數(shù)據(jù)維聯(lián)系起來,按爐號、班組、批次、工序獲得各工序的消耗信息,通過把每一爐鋼的實際成本和各工序成本分別與其相應的標準成本相比較,就可以得到相關成本差異信息。

圖3 鋼鐵生產成本數(shù)據(jù)集市星型模式圖

2.2 數(shù)據(jù)集市的實現(xiàn)過程

無論是數(shù)據(jù)倉庫還是數(shù)據(jù)集市都是服務于數(shù)據(jù)挖掘和決策支持,因此從數(shù)據(jù)源抽取數(shù)據(jù)時,一般都要經過清理、轉換、集成等處理。在構建鋼鐵車間數(shù)據(jù)集市的過程中,主要包括對數(shù)據(jù)源的數(shù)據(jù)進行聚集、轉換、導入和最后裝人數(shù)據(jù)集市等幾個過程。

2.2.1 數(shù)據(jù)聚集

數(shù)據(jù)聚集簡單地說就是對原始數(shù)據(jù)進行匯總。在聚集的過程中要考慮到數(shù)據(jù)集市的劃分粒度。粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細程度和級別,數(shù)據(jù)越詳細,粒度越小,級別越低;反之數(shù)據(jù)綜合度越高,粒度越大,級別就越高。粒度的劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類型。數(shù)據(jù)倉庫的主要功能是面向決策支持,絕大部分查詢都是基于一定綜合程度之上,只有極少的查詢涉及到細節(jié)。

2.2.2 數(shù)據(jù)轉換

數(shù)據(jù)轉換是將數(shù)據(jù)轉換為適合于數(shù)據(jù)挖掘的形式。在數(shù)據(jù)集市中,對于實際成本和標準成本的比較結果,不是采用“盈”或“虧”來存儲,而是將它們分別轉換為“1”或“0",這樣就提高了數(shù)據(jù)集市的存儲和訪問性能,增強了數(shù)據(jù)挖掘的簡便性。

2.2.3 數(shù)據(jù)導入

數(shù)據(jù)導入過程就是將數(shù)據(jù)源中一些不需要轉換而又必不可少的信息直接拷貝到數(shù)據(jù)集市中。鋼鐵生產車間原操作數(shù)據(jù)庫存儲了一些靜態(tài)的數(shù)據(jù)信息,如物料消耗信息、班組信息、工序信息和標準信息等,這些數(shù)據(jù)可直接導入數(shù)據(jù)集市。

以上3個過程并不孤立,而是相互融合,對于靜態(tài)數(shù)據(jù)的導入,一般只在這些靜態(tài)信息更新時才重新導入,而對于聚集,分別在每月的最后一天進行,同時對一些數(shù)據(jù)還需要進行必要地轉換。

3 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘的方法很多,目前比較常用的有關聯(lián)法、聚類法、相關性分析和偏差分析等。常用的技術有數(shù)理統(tǒng)計分析、神經網絡、專家系統(tǒng)、智能代理、決策樹和遺傳算法等。

利用已建立的鋼鐵生產車間數(shù)據(jù)集市,本文主要采用決策樹數(shù)據(jù)挖掘技術對成本狀態(tài)的宏觀數(shù)據(jù)進行分析。

3.1 決策樹算法

決策樹學習是以實例為基礎的歸納學習算法,它著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。決策樹學習采用自頂向下的遞歸方式,在決策樹的內部節(jié)點進行屬性值的比較,并根據(jù)不同的屬性值判斷從該節(jié)點向下的分枝,在決策樹的葉節(jié)點得到結論。所以從根到葉節(jié)點的一條路徑就對應著一條合取規(guī)則,整棵決策樹對應著一組析取表達式規(guī)則。由于決策樹用樹狀結構來表示模型,容易理解,已成為常用的數(shù)據(jù)挖掘工具。目前決策樹常用的算法有Chi-squared automatic interaction detection(CHA-ID),Classification and regression trees(CART),ID3,C4. 5,AC2,CN2等。

在決策樹的各種算法中,最有影響的是Quinlan于1979年提出的以信息嫡的下降速度作為選取測試屬性的標準的ID3算法。該算法通過在樹的每一個節(jié)點上使用信息增益度量來選取測試屬性,選取具有最高信息增益的屬性作為當前節(jié)點的測試屬性。該屬性使得對結果劃分中的樣本分類最小,并反映最小劃分中的隨機性和“不純性”。這種信息論方法使得對一個對象的分類所需的期望測試數(shù)目達到最小,并確保能夠找到一棵簡單的決策樹。

設S是s個樣本的集合,假定類標號屬性具有m個不同的值,定義m個不同的類Ci(i=1,…,m),設si是類Ci中的樣本數(shù)。對一個給定的樣本分類所需的期望信息由下式給出:

式中,Pi為任意樣本屬于Ci的概率,并用si/s估計。這里的對數(shù)以2為底,因為信息用二進制編碼。

設屬性A具有v個不同的值{a1,a2,…,av}??梢杂脤傩訟將S劃分為v個子集{S1,S2,…,Sv},其中sj包含S中的這樣一些樣本,它們在A上具有值aj。如果A選作測試屬性,則這些子集對應由包含集合S的節(jié)點生長出來的分枝。設sij是Sj子集中類Cj的樣本數(shù),根據(jù)A劃分成子集的熵或期望信息由下式給出:

項充當?shù)趈個子集的權,并且等于子集(即A值等于ai)的樣本個數(shù)除以S中的樣本總數(shù)。熵值越小,子集劃分的純度越高。對于給定的子集Sj,有。

式中,pij為Sj中的樣本屬于類Ci的概率,

,在A上分枝將獲得的編碼信息是Gain(A)=I(s1,s2,…,sm)-E(A)。

換言之,Gain(A)是已知屬性A的值而導致的熵的期望壓縮。

算法計算每個屬性的信息增益,具有最高信息增益的屬性作為集合S的測試屬性。創(chuàng)建一個節(jié)點,并以該屬性標記,對屬性的每個值創(chuàng)建分枝,并據(jù)此劃分樣本。

3.2 決策樹的應用

本系統(tǒng)將以ID3算法對某鋼鐵企業(yè)生產成本數(shù)據(jù)集市進行挖掘。

挖掘系統(tǒng)采用瀏覽器/服務器(Browser/Server,B/S)架構,數(shù)據(jù)庫管理系統(tǒng)對從其他數(shù)據(jù)源獲得的不同格式數(shù)據(jù)進行篩選、清理、冗余檢查和格式轉換等數(shù)據(jù)預處理工作。客戶端作為程序主題部分,負責確定挖掘主體,即定義挖掘目標,設置因變量屬性,選擇ID3決策樹算法生成決策樹,提取規(guī)則,然后用測試數(shù)據(jù)進行檢測,如規(guī)則合理即可輸出,否則循環(huán)此過程,直到生成滿意的決策樹為止。

某鋼鐵企業(yè)10號電爐(分為甲、乙、丙、丁4個班組)在2005年6月上半旬共生產滾珠鋼990爐,每爐鋼的成本主要包括電爐冶煉工序(0201)成本、LF精煉工序(0202)成本、鑄錠成本以及其他分配費用。

運用ID3算法,將班組以及工序作為分類屬性,將爐鋼成本差異作為挖掘目標。

初始時刻根據(jù)每一爐鋼成本差異是否符合要求分為兩類:一類是有利差異(實際成本小于標準成本);另一類是不利差異(實際成本大于或等于標準成本)。

所以初始時刻的熵值為:

如果選取班組屬性作為測試屬性,則條件熵為0.55,計算公式如下:

如果選取工序1(電爐冶煉)為測試屬性,則條件熵為0.596,計算公式如下:

如果選取工序2(LF精煉)為測試屬性,則條件熵為0.61,計算公式如下:

可以看出H(X/BZ)最小,因此Gain(BZ)=0.734-0.55=0.184。班組屬性具有最高信息增益0.184 bit,即有關班組的信息對分類有最大的幫助,提供最大的信息量,所以選擇班組屬性對決策樹進行劃分得到決策樹,如圖4所示。

圖4 鋼鐵生產成本決策樹

圖中Y表示實際成本滿足每爐鋼標準成本的要求(有利差異),N表示每爐鋼實際成本超出標準成本(不利差異),0201工序以及0202工序的有利差異和不利差異分別用F和U表示。通過決策樹可以看出,班組和工序兩個因素中,班組是影響每爐鋼實際成本超出標準成本的第1要素,而工序是第2要素。從電爐冶煉工序和LF冶煉工序對每爐鋼的成本影響程度來看,電爐工序具有較大影響,在電爐冶煉工序出現(xiàn)成本有利差異時,每爐鋼出現(xiàn)有利成本差異的概率較高,如班組甲電爐工序成本有利差異的概率為92.9%,則爐鋼有利差異的概率為82.1%, 而班組丙正好相反。當這兩道工序成本具有相同差異時,將對爐鋼成本差異具有決定性地影響,因此對這兩道工序消耗的控制是控制每爐鋼實際成本的重點。

現(xiàn)將決策樹的分類規(guī)則整理詳細敘述如下:

規(guī)則1  If工序1實際成本<標準成本AND工序2實際成本<標準成本Then爐鋼成本差異為Y。

規(guī)則2  If工序1實際成本>標準成本AND工序2實際成本>標準成本Then爐鋼成本差異為N。

規(guī)則3  If工序1實際成本<標準成本AND工序2實際成本>標準成本Then爐鋼成本差異為Y的概率較高。

規(guī)則4  If工序1實際成本>標準成本AND工序2實際成本<標準成本Then爐鋼成本差異為N的概率較高。

可以看出,加強班組成本管理意識以及工人操作水平是控制爐鋼實際成本的關鍵所在,此外還要加強對煉鋼關鍵工序消耗的分析和控制。

4 結束語

基于數(shù)據(jù)倉庫(數(shù)據(jù)集市)的挖掘是一個具有廣泛用途的領域,本文將其引入到鋼鐵生產車間成本管理領域是一個較新的嘗試,并取得了良好的效果,為數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術在車間成本管理領域的應用提供了寶貴的的經驗。(萬方數(shù)據(jù))

 

發(fā)布:2007-04-21 10:47    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:
上海OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普上海OA軟件行業(yè)資訊其他應用

上海OA軟件 上海OA新聞動態(tài) 上海OA信息化 上海OA快博 上海OA軟件行業(yè)資訊 上海軟件開發(fā)公司 上海門禁系統(tǒng) 上海物業(yè)管理軟件 上海倉庫管理軟件 上海餐飲管理軟件 上海網站建設公司