隨著數據庫技術、網絡技術的不斷發展及數據庫管理系統的廣泛應用,數據庫中存儲的數據量急劇增大。然而,如何有效地使用這些數據卻成為一個問題,因為往往是數據豐富而知識缺乏,人們目前所使用的數據庫技術無法將隱藏在數據背后的重要信息挖掘出來利用,所以如何迅速、準確、有效且適量地提供用戶所需的信息,發現信息之間潛在的聯系,支持管理決策就是數據挖掘和數據倉庫要解決的課題,同時也是客戶關系管理系統產生的必要條件和最終目的。
一、數據倉庫與數據挖掘技術分析
1.1 數據倉庫
數據倉庫是一個在企業管理和決策中面向主題的(Subject-Oriented)、集成的(Integrated)、反映歷史變化的(TimeVariant)、相對穩定(Non-Volatile)的數據集合。我們可以從兩個層次加以理解:首先,數據倉庫用于支持決策,面向分析型數據處理,它不同于企業現有的操作型數據庫;其次,數據倉庫是對多個異構的數據源有效集成,集成后按照主題進行了重組,并包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。數據倉庫不是靜態的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業務經營的決策,信息才能發揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時提供給相應的管理決策人員,是數據倉庫的根本任務。因此,從產業界的角度看,數據倉庫建設是一個工程,是一個過程。
整個數據倉庫系統是一個包含源個層次的體系結構,具體如下:
1、數據源:是數據倉庫系統的基礎,是整個系統的數據源泉。通常包括企業內部信息和外部信息。內部信息包括存放于RDBMS中的各種業務處理數據和各類文檔數據。外部信息包括各類法律法規、市場信息和競爭對手的信息等。
2、數據的存儲與管理:是整個數據倉庫系統的核心,數據倉庫的組織管理方式決定了它有別于傳統數據庫,同時也決定了其對外部數據的表現形式。要決定采用什么產品和技術來建立數據倉庫的核心,則需要從數據倉庫的技術特點著手分析,針對現有各業務系統的數據,進行抽取、清理,并有效集成,按照主題進行組織。
3、OLAP服務器:對分析需要的數據進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發現趨勢。其具體實現可以分為:ROLAP、MOLAP和HOLAP。ROLAP 基本數據和聚合數據均存放在RDBMS 之中曰MOLAP 基本數據和聚合數據均存放于多維數據庫中曰HOLAP 基本數據存放于RDBMS 之中,聚合數據存放于多維數據庫中。
4、前端工具:主要包括各種報表工具、查詢工具、數據分析工具、數據挖掘工具以及各種基于數據倉庫或數據集市的應用開發工具。其中數據分析工具主要針對OLAP服務器,報表工具、數據挖掘工具主要針對數據倉庫。
數據倉庫要求數據量大,數據正確全面,所以數據在進入數據倉庫前必須經過提取、轉換與集成,把數據按主題分類,形成多維數據模型。它以多維數據模型為基礎,實現數據的分析處理,主要用于支持管理決策。數據進入數據倉庫后,一般會被長期保存,基本不會進行修改和刪除操作,主要實現數據的查詢。
數據倉庫與傳統關系型數據庫不同,主要區別在于數據倉庫打破了關系數據庫中數據的規范性,實現了數據的重組,增加了數據冗余度;其次傳統關系型數據庫為了實現數據處理的及時性,要求數據盡量少,而數據倉庫為了更有效的實現數據查詢,要求存儲的數據盡量多,實現海量存儲。
1.2 數據挖掘技術
數據挖掘技術,是近幾年國內外迅速發展起來的一門交叉學科,涉及到數據庫、統計學、人工智能與機器學習等多個領域,并在金融、商業零售、電信以及生物醫學和基因分析等領域得到廣泛應用。
1.2.1 數據挖掘的概念
數據挖掘(Data Ming),是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,提取的知識一般可表示為概念(ConcePts)、規則(Rules)、規律(Regularities)、模式(Patterns)等形式。
數據挖掘是知識發現的過程,是將未加工的數據轉換為有用信息的整個過程。該過程包含一系列的步驟:確定業務對象、數據準備、數據挖掘、模式評估和知識表示。
1.2.2 數據挖掘的技術與方法
數據挖掘方法是以數據庫為對象,基于機器學習、科學計算、統計分析等技術,形成了數據挖掘方法和技術。一般,數據挖掘常用的技術與方法可以分為以下幾個方面:
1)決策樹方法
決策樹方法是利用信息論的原理建立決策樹,主要用于分類和預測。決策樹是一種簡單的知識表示方法,它將事例逐步分類成代表不同的類別。由于分類規則比較直觀,易于理解,實用效果好,影響較大,因而得到廣泛應用。決策樹最早的算法是Quinlan 提出的ID3 算法,最流行的是其改進版的C4.5 算法。
2)聚類方法
聚類分析是直接分析樣本,按照各樣本數據間的距離遠近將樣本數據分成若干個不同的類。一般,同一類中的對象相似度很高,不同類中的對象相似度很差。聚類分析屬于無監督的分類方法。
3)統計分析方法
統計分析方法是通過統計學中的技術方法實現數據庫的數據分析,發現數據間的關系和規律。常用的方法有:回歸分析、相關分析、主成分分析等。
4)關聯規則
關聯規則通過對給定數據集中的數據進行關聯分析,描述一個事物中某些屬性頻繁同時出現的條件,發現隱藏在其中的有趣的聯系或規律。一旦建立起數據項間的關聯規則,則其中某一項的屬性值就可以依據其他屬性值進行預測。
5)可視化技術
可視化數據分析技術在傳統圖表功能基礎上進行了拓展,為用戶提供交互式的數據瀏覽,幫助用戶更清楚地剖析數據。當所要識別的不規則事物是一系列圖形而不是數字表格時,人的識別速度是最快的。
二、數據倉庫與數據挖掘技術在客戶關系管理中的應用
2.1 客戶關系管理
客戶關系管理淵CRM冤關注的是企業與客戶之間實時、方便的信息交互,通過與客戶多渠道的接觸、交流和溝通,實現從野接觸管理冶到野客戶關懷冶的角色轉變,企業的經營中心也從產品或市場轉變為客戶。客戶關系管理最核心的任務是對企業運營過程中所得到的各種數據進行分析,進而為企業經營決策提供支持和依據。
從功能上來看,CRM系統可分為三種類型:
1)操作型CRM
操作型CRM 也稱為流程型CRM,主要用于客戶信息的自動集成過程,實現企業各部門對客戶信息的協同合作。
2)分析型CRM
分析型CRM 用于分析操作型CRM 中產生的各種數據,使用數據倉庫和數據挖掘技術產生商務智能,為企業決策提供支持。
3)合作型CRM
合作型CRM用于企業與客戶的合作服務系統,包括電話、呼叫系統、電子郵件等,它能實現客戶信息的全面收集。
2.2 數據倉庫的形成
數據倉庫是CRM 的中央存儲系統。在這個信息爆炸的時代,各個企業經過長期經營,收集了大量的客戶數據。而這些海量、異構的數據被分散在不同部門,沒有得到充分合理的利用。因此,首先要做的是對這些海量分散的數據進行清洗、集成和轉換,建立一個整合的、標準化、結構化的數據模型,形成全面、一致和面向決策的數據,即數據倉庫。對已形成的數據倉庫,按照不同的主題,產生多個對應的數據處理模塊,如普通客戶數據模塊,Vip 客戶數據模塊,團體客戶數據模塊等,這種多數據模塊的建設有利于分析不同客戶的行為特點。
2.3 數據挖掘技術的應用
使用數據挖掘技術對企業客戶信息進行分析,從而挖掘出對企業發展有價值的信息,如:新客戶開發、交叉銷售及預測、客戶信用分析、客戶細分、客戶類別分析等客戶關系管理功能,為企業決策者提供更有效的的決策支持,最大程度地發揮企業CRM 的作用。近年來,隨著市場競爭的加劇,企業要想獲得一個新客戶,所花費的開銷往往是爭取留住老客戶的幾倍。有統計數據表明:
1)公司一般每年平均流失10%的老客戶;
2)企業留住5%的老客戶,利潤提升100%;
3)開發新客戶的成本是留住老客戶成本的5-8 倍;
4)一個公司如果將其客戶流失率降低5%,其利潤就可能增加25-85%。
因此保持老客戶就顯得更有價值。那么,如何才能預防、減少客戶的流失呢?一個非常重要的工作就是要找出顧客流失的原因。我們可以通過數據挖掘技術實現這一目標。
現以電信公司判斷用戶離網的可能性來做分析,首先進行數據準備,抽取一定量的用戶信息,提取的信息主要包括:用戶號碼、用戶類型、用戶狀態、話費性質(長話/市話)、欠費情況、投訴次數等,利用這些數據,我們來建立判斷用戶離網可能性的模型。
在數據準備和適當的預處理之后,我們采用決策樹中的C4.5算法建立決策樹模型。這里,我們引入了信息論中的信息增益率的概念并以此作為屬性選擇的標準,其核心是在決策樹的各級節點上選擇屬性時用信息增益率作為屬性選擇標準。通過計算這些屬性的信息增益率,找出野投訴次數冶屬性作為決策樹的根節點。擴展決策樹節點,進行分枝,其他中間節點也是選擇各節點檢測屬性增益最大的屬性,同級的預選屬性的增益相同時,規定選擇屬性值個數較少的屬性作為當前節點的分枝,最后,我們可以生成一棵決策樹。生成的決策樹還需要進行進一步驗證,才能最終得到可用的分類模型。選擇一些具有共同特征的已離網用戶作為測試數據,輸入屬性值進行離網判斷,檢驗模型的正確性,生成最終的決策樹模型。使用生成的決策樹模型,對比用戶的信息是否貼近離網用戶的特征屬性值,能大致預測出該用戶的離網可能性,對離網可能性高的用戶,根據其特征屬性進行挽留工作,從而預防、減少客戶的流失。
三、結束語
在企業客戶關系管理系統中有效利用數據倉庫和數據挖掘技術,可以為企業高層決策者提供準確的客戶分類、忠誠度、贏利能力及潛在用戶等有用信息,指導他們制訂最優的企業營銷策略、降低銀行運營成本、增加利潤,加速企業的發展。相信未來會有更多的行業加入使用客戶關系管理的行列中,通過數據倉庫和數據挖掘技術挖掘出對自身發展有用的信息,也必使客戶關系管理的目標得到更好的實現。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.lukmueng.com/
本文標題:論企業客戶關系管理系統CRM/ERP中數據倉庫與數據挖掘的作用
本文網址:http://www.lukmueng.com/html/consultation/1082069184.html