數據挖掘在旅遊業的應用
A. 數據挖掘的應用現狀
數據挖掘的應用現狀
數據挖掘所要處理的問題,就是在龐大的資料庫中找出有價值的隱藏事件,並且加以分析,獲取有意義的信息,歸納出有用的結構,作為企業進行決策的依據。其應用非常廣泛,只要該產業有分析價值與需求的資料庫,皆可利用數據挖掘(DM)技術進行有目的的發掘分析。
常見的應用案例多發生在零售業、財務金融保險、製造業、通訊及醫療服務行業:
1、零售商從顧客購買商品中發現一定的關系,提供打折購物券等,提高銷售額;
2、保險公司通過數據挖掘建立預測模型,辨別出可能的欺詐行為,避免道德風險,減少成本,提高利潤;
3、在製造業中,半導體的生產和測試中都產生大量的數據,就必須對這些數據進行分析,找出存在的問題,提高質量;
4、電子商務的作用越來越大,可以用數據挖掘對網站進行分析,識別用戶的行為模式,保留客戶,提供個性化服務,優化網站設計。
B. 大數據時期對旅遊業最大的幫助體現在哪拜託各位了 3Q
「不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。」如今,從矽谷到中關村,「大數據」是一個熱門話題,一個大規模生產、分享和應用數據的時代正在開啟。在這一背景下,包括旅遊業在內的以終端消費者作為服務目標市場的行業,迎來了新的發展機遇。 「大數據」時代到來了 北京網友leio_wb最近想去迪拜旅遊,便在手機的googlemap(谷歌地圖)下載迪拜的離線地圖,當他3月20日登陸google+(類似facebook、人人網的社交網站)時,卻意外地發現個人主頁上多了不少有關迪拜旅遊的賬戶推薦。這讓leio_wb大為感慨:為什麼google+會知道自己的需求呢? 答案是「大數據」挖掘。 「大數據」被視為雲計算之後的又一科技熱點。對於「大數據」,目前還沒有比較准確的定義,但是一般認為「大數據」就是指無法用現有的軟體工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的數據集合。 隨著信息技術尤其是互聯網的發展,人們生產數據的能力越來越強。寬頻普及帶來的巨量日誌和通訊記錄,社交網路每天不斷更新的個人信息,非傳統IT設備產生的數據信息,以及持續增加的各種智能終端產生的圖片及信息,這些爆炸性增長的數據充斥整個網路。 中國旅遊研究院政策所副研究員唐曉雲說,除了數據量大之外,「大數據」不同於傳統數據地方更在於即時性、非結構化。這就使得傳統數據處理部門無法進行傳統意義上的存儲、管理和分析。 難道這些數據真的一文不值的嗎?不。人們發現通過一定的方法,可以在這些紛繁復雜的數據中發現價值。 首都經濟貿易大學旅遊管理系副教授李雲鵬說,「大數據」之大,並不僅僅在於其容量之大,更多的意義在於,人類可以「分析和使用」的數據在大量增加,通過這些數據集的交換、整合和分析,人類可以發現新的知識,創造新的價值,知識的邊界在不斷延伸。 前景廣闊超越傳統 提到「大數據」在旅遊行業的應用,不得不提到一家名為Hopper的旅遊網站。據了解,Hopper通過「大數據」技術的應用,為遊客提供最佳的旅遊景點推薦。截至目前,Hopper聲稱自己已經抓取了「超過5億頁旅遊數據」,而這一數字有望在今年年底達到10億。 除Hopper外,社交旅遊網站Tripl、酒店整合搜索引擎De-alAngel、酒店聲譽管理公司Ol-ery、基於互動式地圖的一站式旅遊解決方案Georama、有關餐廳質量檢驗的數據收集平台HD-Scores、行程記錄和體驗分享平台Esplorio等均已在「大數據」應用領域開始了一定的嘗試。 隨著「大數據」的應用熱潮,國內旅遊行業也開始重視「大數據」的應用。記者在采訪旅遊企業、旅遊研究機構、旅遊管理部門的過程中,也發現不少人已經開始關注、研究和應用「大數據」了。 「智游啦」是一家基於「大數據」挖掘、為遊客提供「微攻略」的旅行規劃服務網站。記者在網站上看到,只要遊客點擊想要去的地方,便會自動彈出相關的吃住行游購娛產品,這些產品不是簡單的列表,而是基於網路評價的好壞篩選出來的精品。 「智游啦」網站創始人兼CEO汪博介紹,當用戶面對一堆旅行目的地,而又不知道如何去規劃自己的行程時,只需要選擇自己喜歡的旅行風格,系統便為其量身定製出一個最合理的旅行計劃。 除「智游啦」之外,記者還了解到,攜程、藝龍、去哪兒等平台型旅遊企業也已經開始應用「大數據」,改進自己的產品體系,為企業發展提供數據支持。 攜程創始人之一、董事會副主席兼總裁范敏說,整個世界已經進入了「大數據時代」,到了可以通過數據挖掘、數據的整合營銷從而產生巨大產業收益的時候了。這一時代不光給旅遊服務企業,也給了很多 相應以終端消費者作為服務目標市場的行業挖金、掘金的可能性。 除在線旅遊企業之外,旅遊行政主管部門也是運用「大數據」的積極嘗試者。山東省旅遊局信息中心主任閆向軍說,該中心已經跟網路合作,通過網路的數據准確的反映山東旅遊的客源市場在哪裡、哪些產品是消費者關注的……這就為精準營銷提供了重要的數據支撐。 據了解,山東省旅遊局對「大數據」的應用還不僅限於營銷。目前,山東省旅遊局已經開展旅行社團隊跟蹤監測、景區人數監測,並與公安部門合作獲取了公安住宿聯網數據,這些數據對於山東旅遊行業管理提供了重要的決策依據。 「旅遊行業是『大數據』應用前景最廣闊的行業之一。」閆向軍說,有了「大數據」,可以准確預知客流趨向,進而採取相應的措施疏導客流;有了「大數據」,可以知道遊客喜歡什麼樣的產品,進而開發建設適銷對路的產品;有了「大數據」,還可以知道遊客需要什麼樣的公共服務,進而改進旅遊公共服務……這些都是具體的方面。 唐曉雲說,旅遊行業沒有作為一個獨立的產業列入國家產業目錄,這就造成了全國統一、標准化的統計數據相對欠缺。無論是政府決策、學術研究,還是企業經營,都會面臨數據相對缺乏的困境。但是,如果能夠應用「大數據」,那麼旅遊行業就不愁沒數據了! 閆向軍認為,「大數據」對旅遊行業的影響不是某個企業或某個領域,而是全方位的,是整個行業管理決策模式的轉變。 首都經貿大學旅遊管理系副教授李雲鵬表示,隨著大數據所蘊含價值的不斷釋放,旅遊業大數據應用的未來必定是豐富多彩的,也會為旅遊業的發展注入一股新的朝氣和活力,發展前景廣闊而且具有超越傳統旅遊業發展的特殊價值。 北京第二外國語大學旅遊管理學院教授李宏表示,就旅遊行業來講,如果一個企業能夠在大數據的應用方面先行一步,那麼在未來的競爭中就能佔得先機。 數據收集分析是難題 雖然「大數據」是個好東西,在旅遊行業的應用前景也非常廣闊,但是整個行業對於大數據的應用,仍存在較大的障礙。這些障礙來自於數據的收集,更來自於數據的分析和挖掘。 「大數據時代缺的不是數據,而是方法。」中國旅遊研究院楊彥鋒說,在數據極大豐富的時代,每個人都會產生巨大的數據,但是這些數據如何收集、挖掘、利用才是問題的根本。 史道發是北京某旅遊規劃設計院的一名規劃師,他告訴記者,規劃行業是最需要數據支撐的,但是現在的數據收集是個難點。「要是旅遊規劃應用了大數據,那就更能貼近市場、貼近遊客了。」 大數據時代,數據是海量的,但是掌握這些數據的機構卻不是開放的。目前,「大數據」的最主要來源是互聯網,但是隨著人們對「大數據」價值的認識,越來越多的平台將數據看做是重要的資產。因此要獲得這些數據,必須要獲得許可。 山東省旅遊局是較早開展「大數據」收集和應用的行業管理機構,他們在收集「大數據」時也面臨類似的問題。閆向軍告訴記者,他們通過與網路公司合作獲取了其免費提供的數據,但是這些數據對於普通機構來說,必須要付出一定的成本。此外,在獲取住宿數據的時候更是大費周折。「由於各部門之間的系統都是相互獨立的,不能彼此聯網,要想獲得另一個領域的數據非常困難,更何況相關企業或研究機構了。」 正如許多「大數據」研究者所說,「大數據」研究的重要條件是「數據開放」,但目前我國的數據開放程度遠不能達到應用的要求。 「大數據」技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。 李雲鵬說,由於數據是非系統化的,且不具有一致性和可靠性,因此企業很難有效地對數據進行操作。 在采訪中,記者也發現,雖然多數人看好「大數據」的應用前景,但是在面對如何應用時多少會有點兒茫然。這種茫然主要是因為「大數據」的復雜。 據統計,現在計算機處理的大多是結構化數據,但這些信息只佔互聯網上流動信息的約10%。其他90%數據是非結構化數據,它們存儲在音頻、視頻、社交媒體、網路日誌等中,不直接以結構化模式儲存。管理和分析這些非結構化的數據,讓多數人感到有心無力。 閆向軍說,大數據應用的根本在於從不相關的數據中找到相關性,如何分析紛繁復雜的數據至關重要,這就需要懂行業、又懂數據的人進行專業化的分析。但是目前「懂數據的人不懂旅遊,懂旅遊的人不懂數據。」 李宏認為,目前「大數據」研究主要在IT領域,旅遊行業對於「大數據」的研究很少。如果要應用「大數據」,如何分析這些復雜的數據是一個難題。 此外,隱私也是大數據時代不得不面對的一大難題,甚至有不少人喊出了「大數據時代沒有隱私」。正如一名網友在微博上所說,你在瀏覽網頁時,你的瀏覽偏好可能被記錄;你在下載手機應用時,你的需求偏好也可能被記錄;甚至,旅行時對旅行社、旅遊景區、酒店的偏好都可能被記錄……而這一切,有個冠冕堂皇的理由:為了給您提供更好的服務。 從數據化入手 從記者采訪的情況看,旅遊行業普遍對於「大數據」仍顯陌生,多數企業也不知道該如何應用「大數據」。 對此,楊彥鋒說,目前旅遊行業對「大數據」還停留在認識階段,基本談不上應用,即便是應用也僅在在線旅遊企業。目前只有攜程、藝龍、去哪兒等大的平台型互聯網企業才能掌握足夠大的數據。 李宏表示,現在討論的所謂旅遊企業「大數據」應用,更多的是「數據挖掘」的概念。 雖然目前旅遊行業在「大數據」的應用上還存在較大的障礙,但是這並不代表可以不關注「大數據」。 「大數據」時代,每一個行業或企業都應該未雨綢繆,為以後「大數據」的應用做准備。 李雲鵬說,對於旅遊管理部門來講,需要對遊客旅遊過程中產生的所有數據、旅遊企業經營活動中產生的所有數據、旅遊管理和目的地促銷活動中產生的所有數據進行深入挖掘分析,為旅遊決策提供可靠的依據和支撐,從而進一步提高效益,促進行業轉型升級;對於旅遊企業來講,需要逐步通過對大量數據的分析和挖掘,指導和管理工作,如酒店更加精準地根據顧客特徵和偏好推薦有吸引力的旅遊產品和服務、旅遊景區更好地進行客流疏導和調控、旅行社更方便地整合信息資源而開發出更有針對性和個性化的旅遊產品等。 對於如何著手「大數據」的應用工作,李宏建議,旅遊企業從企業內部管理系統著手,增強企業內部的數據化程度,進而改造優化內部管理流程。在客戶管理方面則應該加強客戶信息的收集,注重客戶數據的積累,而不是簡單地把這些數據放棄。 「雖然大數據的概念十分熱,但是對於很多實體企業與傳統行業而言,還是要扎扎實實地完成企業自身業務的數據化。」某知名網站主編何川說,短期內,多數企業還是要把重點聚焦在企業自身的業務模式上。 史道發說,「大數據」不僅僅是一個資料庫的概念,但是卻離不開資料庫。因此旅遊行業要應用「大數據」必須先從數據積累做起,藉助目前智慧旅遊平台的建設,注重遊客數據的收集,進而建立一個相對完善的旅遊資料庫,為以後「大數據」的應用打好基礎。 對此,李雲鵬還建議,旅遊管理機構應該有計劃地公布旅遊業運行的原始數據,鼓勵技術公司開發基於原始數據的應用平台,服務於遊客和旅遊企業及旅遊管理部門。 另外一種「大數據」應用方式則是購買第三方服務。目前,谷歌、網路、攜程、藝龍、去哪兒等大型平台型網路都掌握著海量的數據。 「如果第三方大數據服務價格較低,『大數據』確實有價值,企業完全可以通過購買數據服務來提升自身素質。」武漢大學信息管理學院教授沈陽說,微博就是「大數據」產生的一個重要平台,旅遊行業要利用「大數據」不妨從微博的數據收集入手。
C. 數據挖掘的應用領域有哪些
數據挖掘的應用非常廣泛,只要該產業有分析價值與需求的資料庫,皆可利用數據挖掘工具進行有目的的發掘分析。常見的應用案例多發生在零售業、製造業、財務金融保險、通訊及醫療服務:
(1)商場從顧客購買商品中發現一定的關聯規則,提供打折、購物券等促銷手段,提高銷售額;
(2)保險公司通過數據挖掘建立預測模型,辨別出可能的欺詐行為,避免道德風險,減少成本,提高利潤;
(3)在製造業中,半導體的生產和測試中都產生大量的數據,就必須對這些數據進行分析,找出存在的問題,提高質量;
(4)電子商務的作用越來越大,可以用數據挖掘對網站進行分析,識別用戶的行為模式,保留客戶,提供個性化服務,優化網站設計;
一些公司運用數據挖掘的成功案例,顯示了數據挖掘的強大生命力:
美國AutoTrader是世界上最大的汽車銷售站點,每天都會有大量的用戶對網站上的信息點擊,尋求信息,其運用了SAS軟體進行數據挖掘,每天對數據進行分析,找出用戶的訪問模式,對產品的喜歡程度進行判斷,並設特定服務,取得了成功。
Reuteres是世界著名的金融信息服務公司,其利用的數據大都是外部的數據,這樣數據的質量就是公司生存的關鍵所在,必須從數據中檢測出錯誤的成分。Reuteres用SPSS的數據挖掘工具SPSS/Clementine,建立數據挖掘模型,極大地提高了錯誤的檢測,保證了信息的正確和權威性。
Bass Export是世界最大的啤酒進出口商之一,在海外80多個市場從事交易,每個星期傳送23000份定單,這就需要了解每個客戶的習慣,如品牌的喜好等,Bass Export用IBM的Intelligent Miner很好的解決了上述問題。
D. 目前,數據挖掘技術在我們身邊的具體應用有哪些大家可以在線交流交流......
數據挖掘系統的其它應用還有:
♦ 在對客戶進行分析方面:銀行信用卡和保險行業,利用數據挖掘將市場分
成有意義的群組和部門,從而協助市場經理和業務執行人員更好地集中於
有促進作用的活動和設計新的市場運動。
♦ 在客戶關系管理方面: 數據挖掘能找出產品使用模式或協助了解客戶行為,
從而可以改進通道管理 (如銀行分支和6等) 。 又如正確時間銷售就是基於顧客生活周期模型來實施的。
♦ 在零售業方面:數據挖掘用於顧客購貨籃的分析可以協助貨架布置,促銷活動時間,促銷商品組合以及了解滯銷和暢銷商品狀況等商業活動。通過
對一種廠家商品在各連鎖店的市場共享分析,客戶統計以及歷史狀況的分
析,可以確定銷售和廣告業務的有效性。
♦ 在產品質量保證方面:數據挖掘協助管理大數量變數之間的相互作用,並
能自動發現出某些不正常的數據分布,揭示製造和裝配操作過程中變化情
況和各種因素,從而協助質量工程師很快地注意到問題發生范圍和採取改
正措施。
♦ 在遠程通訊方面:基於數據挖掘的分析協助組織策略變更以適應外部世界
的變化,確定市場變化模式以指導銷售計劃。在網路容量利用方面,數據
挖掘能提供對客戶聚集服務使用的結構和模式的了解,從而指導容量計劃
人員對網路設施作出最佳投資決策。
♦ 在各個企事業部門,數據挖掘在假偽檢測及險災評估、失誤迴避、資源分
配、市場銷售預測廣告投資等很多方面,起著很重要作用。例如在化學及
制葯行業,將數據挖掘用於巨量生物信息可以發現新的有用化學成分;在遙感領域針對每天從衛星上及其它方面來的巨額數據,對氣象預報、臭氧
層監測等能起很大作用。
E. 什麼是數據挖掘,簡述其作用和應用。
數據挖掘是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。
數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統和模式識別等諸多方法來實現上述目標。
人們迫切希望能對海量數據進行深入分析,發現並提取隱藏在其中的信息,以更好地利用這些數據,正是在這樣的條件下,數據挖掘技術應運而生。
數據挖掘有很多合法的用途,例如可以在患者群的資料庫中查出某葯物和其副作用的關系。這種關系可能在1000人中也不會出現一例,但葯物學相關的項目就可以運用此方法減少對葯物有不良反應的病人數量,還有可能挽救生命。
(5)數據挖掘在旅遊業的應用擴展閱讀
目前數據挖掘的演算法主要包括神經網路法、決策樹法、遺傳演算法、粗糙集法、模糊集法、關聯規則法等。
根據信息存儲格式,用於挖掘的對象有關系資料庫、面向對象資料庫、數據倉庫、文本數據源、多媒體資料庫、空間資料庫、時態資料庫、異質資料庫以及internet等。
數據挖掘過程是一個反復循環的過程,每一個步驟如果沒有達到預期目標,都需要回到前面的步驟,重新調整並執行。不是每件數據挖掘的工作都需要這里列出的每一步。
F. 大數據技術在垂直旅遊搜索中的應用
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。由此可知:大數據就是指非結構化的數據,包括圖片、視頻、音頻以及設備數據。大數據本身是一個現象而不是一種技術,伴隨著大數據的採集、傳輸、處理和應用的相關技術就是大數據處理技術,是系列使用非傳統的工具來對大量的結構化、半結構化和非結構化數據進行處理,從而獲得分析和預測結果的一系列數據處理技術。大數據的核心是預測結果。智慧旅遊是指以雲計算、物聯網、互聯網、下一代通信網路、高性能信息處理、智能數據挖掘等技術廣泛的運用於旅遊中,達到旅遊信息基礎架構與高
度整合的旅遊基礎設施的完美融合使得政府旅遊管理部門、相關旅遊企業和旅遊者等可以做出更明智決策的旅遊方式。
二.智慧旅遊數據具備大數據的典型特質
(一)大數據的四個特質
大數據具備「4V」的特質,即:大數據的4個「V」,或者說特點有四個層面:第一,數據體量巨大。從TB(萬億位元組,TB是Terabyte 的縮寫,n.萬億位元組)級別,躍升到PB(PB是Petabyte 的縮寫,Petabyte是一種資訊計量單位,現今通常在標示網路硬碟總容量,或具有大容量的儲存媒介之儲存容量時使用。)級別;第二,數據類型繁多。包括網路日誌、視頻、圖片、地理位置信息等等。第三,價值密度低,商業價值高。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。1秒定律。最後這一點也是和傳統的數據挖掘技術有著本質的不同。因此,「大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)」就是「大數據」的顯著特徵,或者說,只有具備這些特點的數據,才是大數據。
(二)智慧旅遊數據分析
目前,旅遊微博、微信、視頻網站、社交網站等都產生以億計的數據。這其中既包括在線旅遊預訂網站中用戶的預訂頻率、價位,也包括旅遊攻略網站中用戶對酒店床墊軟硬的評價、對旅遊景點公共服務設施是否齊全的描述,這些信息可能是文字,也可能是圖片或視頻音頻。還有景區、酒店自己內部管理所有的信息系統、視頻監控系統、感知系統等所有智慧旅遊系統所產生的大量數字、文字、視頻數據。根據這些數據來源主要分為外部數據和內部數據,如下圖:
智慧旅遊大數據來源—外部數據
智慧旅遊大數據來源—內部數據
綜合以上可知:智慧旅遊數據具備典型的大數據特質。旅遊業經過多年的信息化戰略發展,產生了體量巨大的結構化和非結構化的數據,這些數據類型繁多,價值密度低。
三.大數據技術在智慧旅遊中的應用
相對於傳統的資料庫應用,大數據分析具有數據量大、類型多、價值密度低、處理速度快等特點。大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。如果把大數據比作一種產業,那麼這種產業實現贏利的關鍵,在於提高對數據的加工能力,通過「加工」實現數據的「增值」。智慧旅遊的發展離不開大數據,依靠大數據提供足夠有利的資源,智慧旅遊才能得以「智慧」發展。由於智慧旅遊的「智慧」體現在「旅遊服務的智慧」、「旅遊管理的智慧」和「旅遊營銷的智慧」。所以大數據技術在智慧旅遊中的應用主要也在這三個方面。
G. 數據挖掘專業有哪些應用啊,這是個什麼樣的專業,發展前景怎樣
數據挖掘是一門交叉學科,隨著計算機技術和數據倉庫的發展,在電信、銀行、保險等許多商業行業得到廣泛的應用,下面我說幾個典型的應用,如
1、客戶細分:人以類聚,客戶細分或客戶分群是現代營銷的基礎,通過聚類分析的方法,對客戶進行劃分,獲得各個客戶群不同的特徵,從而對客戶群進行針對性的營銷,或者面向特定細分群開發特定產品,從而達到提高產品銷量,提升客戶忠誠度的目的。例如,銀行業將客戶分成不同的群體,向其提供不同的個性化投資產品。
2、客戶流失預測:研究表明,保留老客戶的成本遠低於獲取新客戶的成本。但是,對所有的客戶進行挽留營銷不切實際並且非常昂貴,通過對客戶行為模式的挖掘,客戶流失預測僅找出那些可能會流失的客戶,對這些客戶進行針對性的挽留,可降低營銷成本,提高產品收入,這對於有大量客戶的電信、銀行、保險等行業非常必要。
3、客戶價值分析:客戶對企業的貢獻不同,一般來說遵循「20-80」原則,少數客戶對企業的貢獻佔大都分比例,那麼,哪些客戶是企業最好的客戶?僅僅是最近奉獻收入最多的群體嗎?哪些是潛在的好客戶?通過客戶價值分析,發現企業的最好客戶,把有限的資源使用在能帶來最大的價值客戶的身上。
4、異常發現:通過對數據進行分析,找出其中的異常點,例如,信用卡是當今廣泛使用的金融產品,隨著競爭的加劇,各銀行競相大力推廣信用卡,有少數不法分子趁機使用假資料申請信用卡,騙取錢財。通過數據挖掘對申請資料進行學習評分,可以發現信用欺詐的申請者,避免損失;通過對稅務數據的分析,發現偷稅漏稅行為等。
5、交叉營銷:通過對商品和服務組合營銷模式的分析,能夠發現商品之間的搭配銷售模式。利用這些模式,能夠設計交叉銷售策略。例如,在零售業進行客戶購物搖籃分析,根據結果對貨架重新擺放,從而提高銷售量;電台通過對館長觀看習慣的分析,重新編排節目,提高收視率;零售業巨頭沃爾瑪使用數據倉庫和數據挖掘技術分析客戶的購買模式,用於對庫存的管理和銷售機會的把握。
6、個性化服務:對每個人的消費進行分析,發現其餘眾不同的消費習慣,可有針對性地提供服務或進行促銷。例如,在電子商務中,網站會根據過往購買記錄項向客戶推薦新到商品;根據大多數人購買商品的行為,向客戶推薦當前所買商品的關聯關系。
7、資料庫直銷:一般來說,向客戶隨機發出大量直銷郵件,可能僅有不到5%的客戶會做出響應。根據小規模郵件直銷的結果反饋,數據挖掘建立一個模型,找出潛在最有可能做出響應的客戶,將響應率提高到15%,從而削減了成本,提高了銷量。
8、 改進工作效率:通過對日常工作或業務數據分析,找到優化的模式,從而改進工作效率或業務流程,例如,NBA使用一套數據挖掘工具,分析球員的運動,以幫助教練找到最優組織進攻和防守的方法;通過對製造廠商供應鏈日常活動的分析,找出供應鏈的最優運作方式;通過對生產計劃及生產效率等數據的分析,找到最有效的排班方式;通過對生產工藝和質量數據的關系的分析,發現好的生產工藝流程等。
9、科學發現:通過對大量科學實驗數據進行分析,發現其中隱藏的模式,可導致新的科學發現的產生。例如,通過對天文數據的數據挖掘分析,發現新的星體;通過對生物信息數據的分析,發現新的基因和蛋白質折疊;識別具有良好葯物特性的分子,以用於製造新葯;通過對醫療數據的分析,發現葯物和疾病之間的關系等。
10、預警:通過對數據中趨勢的分析,對將要可能發生的事件提出預警。例如,在電信行業,通過對以往預警數據的分析,發現有哪些常規報警可能是重大問題的前兆,並提出預警,阻止事故的發生;對工廠生產數據的分析,識別重大質量問題的前兆,已採取必要措施,避免產品質量試過的發生。
等等很多,是一門很有發展的學科。
H. 數據挖掘對旅遊業的影響
旅遊業的數據好象很難收集吧
I. 數據挖掘的應用有哪些
數據挖掘目前在中國的尚未流行開,猶如屠龍之技;數據挖掘本身融合了統計學、資料庫、機器學習、模式識別、知識發現等學科,並不是新的技術。
數據挖掘之所以能夠應用不是因為演算法,演算法是以前就有的。數據挖掘應用的原因是大數據和雲計算。比如阿爾法狗的後台有上千台計算機同時運行神經網路演算法;
數據初期的准備工作,也稱Data Warehousing。通常占整個數據挖掘項目工作量的70%左右。在前期你需要做大量的數據清洗和欄位擴充的工作。數據挖掘和報告展現只佔30%左右;
數據挖掘技術更適合業務人員學習(相比技術人員學習業務來的更高效)。
目前國內的數據挖掘人員工作領域大致可分為三類
1)數據分析師:在擁有行業數據的電商、金融、電信、咨詢等行業里做業務咨詢,商務智能,出分析報告;
2)數據挖掘工程師:在多媒體、電商、搜索、社交等大數據相關行業里做機器學習演算法實現和分析;
3)科學研究方向:在高校、科研單位、企業研究院等高大上科研機構研究新演算法效率改進及未來應用。
你自己的定位與學習
基於以上的介紹,你大概可以明確你需要努力的方向。如果你不是致力於科研方向,那麼你需要掌握如下的技能:
1. 需要理解主流機器學習演算法的原理和應用。按照需要解決的問題,主要分為三大類,見下圖:
2. 需要熟悉至少一門編程語言。如R,Python,SPSS Modeler,SAS,WEKA等。
關於軟體,有三個原則:只要能達到目標的軟體就是好軟體;你研究的領域啥軟體好用就用啥軟體;不要妄想用一個軟體解決所有問題。
3. 需要理解資料庫基本原理,能夠熟練操作至少一種資料庫,如MySQL,OracelDB2等。
4. 熟悉數據挖掘常見的運用場景。如客戶生命周期管理、客戶畫像和客戶分群、客戶價值預測模型構建、推薦系統設計等,這些需要依託於不同行業。
5.經典圖書推薦:《數據挖掘:概念與技術》、《數據挖掘導論》、《機器學習實戰》、《資料庫系統概論》、《R語言實戰》。