数据挖掘在旅游业的应用
A. 数据挖掘的应用现状
数据挖掘的应用现状
数据挖掘所要处理的问题,就是在庞大的数据库中找出有价值的隐藏事件,并且加以分析,获取有意义的信息,归纳出有用的结构,作为企业进行决策的依据。其应用非常广泛,只要该产业有分析价值与需求的数据库,皆可利用数据挖掘(DM)技术进行有目的的发掘分析。
常见的应用案例多发生在零售业、财务金融保险、制造业、通讯及医疗服务行业:
1、零售商从顾客购买商品中发现一定的关系,提供打折购物券等,提高销售额;
2、保险公司通过数据挖掘建立预测模型,辨别出可能的欺诈行为,避免道德风险,减少成本,提高利润;
3、在制造业中,半导体的生产和测试中都产生大量的数据,就必须对这些数据进行分析,找出存在的问题,提高质量;
4、电子商务的作用越来越大,可以用数据挖掘对网站进行分析,识别用户的行为模式,保留客户,提供个性化服务,优化网站设计。
B. 大数据时期对旅游业最大的帮助体现在哪拜托各位了 3Q
“不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。”如今,从硅谷到中关村,“大数据”是一个热门话题,一个大规模生产、分享和应用数据的时代正在开启。在这一背景下,包括旅游业在内的以终端消费者作为服务目标市场的行业,迎来了新的发展机遇。 “大数据”时代到来了 北京网友leio_wb最近想去迪拜旅游,便在手机的googlemap(谷歌地图)下载迪拜的离线地图,当他3月20日登陆google+(类似facebook、人人网的社交网站)时,却意外地发现个人主页上多了不少有关迪拜旅游的账户推荐。这让leio_wb大为感慨:为什么google+会知道自己的需求呢? 答案是“大数据”挖掘。 “大数据”被视为云计算之后的又一科技热点。对于“大数据”,目前还没有比较准确的定义,但是一般认为“大数据”就是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。 随着信息技术尤其是互联网的发展,人们生产数据的能力越来越强。宽带普及带来的巨量日志和通讯记录,社交网络每天不断更新的个人信息,非传统IT设备产生的数据信息,以及持续增加的各种智能终端产生的图片及信息,这些爆炸性增长的数据充斥整个网络。 中国旅游研究院政策所副研究员唐晓云说,除了数据量大之外,“大数据”不同于传统数据地方更在于即时性、非结构化。这就使得传统数据处理部门无法进行传统意义上的存储、管理和分析。 难道这些数据真的一文不值的吗?不。人们发现通过一定的方法,可以在这些纷繁复杂的数据中发现价值。 首都经济贸易大学旅游管理系副教授李云鹏说,“大数据”之大,并不仅仅在于其容量之大,更多的意义在于,人类可以“分析和使用”的数据在大量增加,通过这些数据集的交换、整合和分析,人类可以发现新的知识,创造新的价值,知识的边界在不断延伸。 前景广阔超越传统 提到“大数据”在旅游行业的应用,不得不提到一家名为Hopper的旅游网站。据了解,Hopper通过“大数据”技术的应用,为游客提供最佳的旅游景点推荐。截至目前,Hopper声称自己已经抓取了“超过5亿页旅游数据”,而这一数字有望在今年年底达到10亿。 除Hopper外,社交旅游网站Tripl、酒店整合搜索引擎De-alAngel、酒店声誉管理公司Ol-ery、基于互动式地图的一站式旅游解决方案Georama、有关餐厅质量检验的数据收集平台HD-Scores、行程记录和体验分享平台Esplorio等均已在“大数据”应用领域开始了一定的尝试。 随着“大数据”的应用热潮,国内旅游行业也开始重视“大数据”的应用。记者在采访旅游企业、旅游研究机构、旅游管理部门的过程中,也发现不少人已经开始关注、研究和应用“大数据”了。 “智游啦”是一家基于“大数据”挖掘、为游客提供“微攻略”的旅行规划服务网站。记者在网站上看到,只要游客点击想要去的地方,便会自动弹出相关的吃住行游购娱产品,这些产品不是简单的列表,而是基于网络评价的好坏筛选出来的精品。 “智游啦”网站创始人兼CEO汪博介绍,当用户面对一堆旅行目的地,而又不知道如何去规划自己的行程时,只需要选择自己喜欢的旅行风格,系统便为其量身定制出一个最合理的旅行计划。 除“智游啦”之外,记者还了解到,携程、艺龙、去哪儿等平台型旅游企业也已经开始应用“大数据”,改进自己的产品体系,为企业发展提供数据支持。 携程创始人之一、董事会副主席兼总裁范敏说,整个世界已经进入了“大数据时代”,到了可以通过数据挖掘、数据的整合营销从而产生巨大产业收益的时候了。这一时代不光给旅游服务企业,也给了很多 相应以终端消费者作为服务目标市场的行业挖金、掘金的可能性。 除在线旅游企业之外,旅游行政主管部门也是运用“大数据”的积极尝试者。山东省旅游局信息中心主任闫向军说,该中心已经跟网络合作,通过网络的数据准确的反映山东旅游的客源市场在哪里、哪些产品是消费者关注的……这就为精准营销提供了重要的数据支撑。 据了解,山东省旅游局对“大数据”的应用还不仅限于营销。目前,山东省旅游局已经开展旅行社团队跟踪监测、景区人数监测,并与公安部门合作获取了公安住宿联网数据,这些数据对于山东旅游行业管理提供了重要的决策依据。 “旅游行业是‘大数据’应用前景最广阔的行业之一。”闫向军说,有了“大数据”,可以准确预知客流趋向,进而采取相应的措施疏导客流;有了“大数据”,可以知道游客喜欢什么样的产品,进而开发建设适销对路的产品;有了“大数据”,还可以知道游客需要什么样的公共服务,进而改进旅游公共服务……这些都是具体的方面。 唐晓云说,旅游行业没有作为一个独立的产业列入国家产业目录,这就造成了全国统一、标准化的统计数据相对欠缺。无论是政府决策、学术研究,还是企业经营,都会面临数据相对缺乏的困境。但是,如果能够应用“大数据”,那么旅游行业就不愁没数据了! 闫向军认为,“大数据”对旅游行业的影响不是某个企业或某个领域,而是全方位的,是整个行业管理决策模式的转变。 首都经贸大学旅游管理系副教授李云鹏表示,随着大数据所蕴含价值的不断释放,旅游业大数据应用的未来必定是丰富多彩的,也会为旅游业的发展注入一股新的朝气和活力,发展前景广阔而且具有超越传统旅游业发展的特殊价值。 北京第二外国语大学旅游管理学院教授李宏表示,就旅游行业来讲,如果一个企业能够在大数据的应用方面先行一步,那么在未来的竞争中就能占得先机。 数据收集分析是难题 虽然“大数据”是个好东西,在旅游行业的应用前景也非常广阔,但是整个行业对于大数据的应用,仍存在较大的障碍。这些障碍来自于数据的收集,更来自于数据的分析和挖掘。 “大数据时代缺的不是数据,而是方法。”中国旅游研究院杨彦锋说,在数据极大丰富的时代,每个人都会产生巨大的数据,但是这些数据如何收集、挖掘、利用才是问题的根本。 史道发是北京某旅游规划设计院的一名规划师,他告诉记者,规划行业是最需要数据支撑的,但是现在的数据收集是个难点。“要是旅游规划应用了大数据,那就更能贴近市场、贴近游客了。” 大数据时代,数据是海量的,但是掌握这些数据的机构却不是开放的。目前,“大数据”的最主要来源是互联网,但是随着人们对“大数据”价值的认识,越来越多的平台将数据看做是重要的资产。因此要获得这些数据,必须要获得许可。 山东省旅游局是较早开展“大数据”收集和应用的行业管理机构,他们在收集“大数据”时也面临类似的问题。闫向军告诉记者,他们通过与网络公司合作获取了其免费提供的数据,但是这些数据对于普通机构来说,必须要付出一定的成本。此外,在获取住宿数据的时候更是大费周折。“由于各部门之间的系统都是相互独立的,不能彼此联网,要想获得另一个领域的数据非常困难,更何况相关企业或研究机构了。” 正如许多“大数据”研究者所说,“大数据”研究的重要条件是“数据开放”,但目前我国的数据开放程度远不能达到应用的要求。 “大数据”技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。 李云鹏说,由于数据是非系统化的,且不具有一致性和可靠性,因此企业很难有效地对数据进行操作。 在采访中,记者也发现,虽然多数人看好“大数据”的应用前景,但是在面对如何应用时多少会有点儿茫然。这种茫然主要是因为“大数据”的复杂。 据统计,现在计算机处理的大多是结构化数据,但这些信息只占互联网上流动信息的约10%。其他90%数据是非结构化数据,它们存储在音频、视频、社交媒体、网络日志等中,不直接以结构化模式储存。管理和分析这些非结构化的数据,让多数人感到有心无力。 闫向军说,大数据应用的根本在于从不相关的数据中找到相关性,如何分析纷繁复杂的数据至关重要,这就需要懂行业、又懂数据的人进行专业化的分析。但是目前“懂数据的人不懂旅游,懂旅游的人不懂数据。” 李宏认为,目前“大数据”研究主要在IT领域,旅游行业对于“大数据”的研究很少。如果要应用“大数据”,如何分析这些复杂的数据是一个难题。 此外,隐私也是大数据时代不得不面对的一大难题,甚至有不少人喊出了“大数据时代没有隐私”。正如一名网友在微博上所说,你在浏览网页时,你的浏览偏好可能被记录;你在下载手机应用时,你的需求偏好也可能被记录;甚至,旅行时对旅行社、旅游景区、酒店的偏好都可能被记录……而这一切,有个冠冕堂皇的理由:为了给您提供更好的服务。 从数据化入手 从记者采访的情况看,旅游行业普遍对于“大数据”仍显陌生,多数企业也不知道该如何应用“大数据”。 对此,杨彦锋说,目前旅游行业对“大数据”还停留在认识阶段,基本谈不上应用,即便是应用也仅在在线旅游企业。目前只有携程、艺龙、去哪儿等大的平台型互联网企业才能掌握足够大的数据。 李宏表示,现在讨论的所谓旅游企业“大数据”应用,更多的是“数据挖掘”的概念。 虽然目前旅游行业在“大数据”的应用上还存在较大的障碍,但是这并不代表可以不关注“大数据”。 “大数据”时代,每一个行业或企业都应该未雨绸缪,为以后“大数据”的应用做准备。 李云鹏说,对于旅游管理部门来讲,需要对游客旅游过程中产生的所有数据、旅游企业经营活动中产生的所有数据、旅游管理和目的地促销活动中产生的所有数据进行深入挖掘分析,为旅游决策提供可靠的依据和支撑,从而进一步提高效益,促进行业转型升级;对于旅游企业来讲,需要逐步通过对大量数据的分析和挖掘,指导和管理工作,如酒店更加精准地根据顾客特征和偏好推荐有吸引力的旅游产品和服务、旅游景区更好地进行客流疏导和调控、旅行社更方便地整合信息资源而开发出更有针对性和个性化的旅游产品等。 对于如何着手“大数据”的应用工作,李宏建议,旅游企业从企业内部管理系统着手,增强企业内部的数据化程度,进而改造优化内部管理流程。在客户管理方面则应该加强客户信息的收集,注重客户数据的积累,而不是简单地把这些数据放弃。 “虽然大数据的概念十分热,但是对于很多实体企业与传统行业而言,还是要扎扎实实地完成企业自身业务的数据化。”某知名网站主编何川说,短期内,多数企业还是要把重点聚焦在企业自身的业务模式上。 史道发说,“大数据”不仅仅是一个数据库的概念,但是却离不开数据库。因此旅游行业要应用“大数据”必须先从数据积累做起,借助目前智慧旅游平台的建设,注重游客数据的收集,进而建立一个相对完善的旅游数据库,为以后“大数据”的应用打好基础。 对此,李云鹏还建议,旅游管理机构应该有计划地公布旅游业运行的原始数据,鼓励技术公司开发基于原始数据的应用平台,服务于游客和旅游企业及旅游管理部门。 另外一种“大数据”应用方式则是购买第三方服务。目前,谷歌、网络、携程、艺龙、去哪儿等大型平台型网络都掌握着海量的数据。 “如果第三方大数据服务价格较低,‘大数据’确实有价值,企业完全可以通过购买数据服务来提升自身素质。”武汉大学信息管理学院教授沈阳说,微博就是“大数据”产生的一个重要平台,旅游行业要利用“大数据”不妨从微博的数据收集入手。
C. 数据挖掘的应用领域有哪些
数据挖掘的应用非常广泛,只要该产业有分析价值与需求的数据库,皆可利用数据挖掘工具进行有目的的发掘分析。常见的应用案例多发生在零售业、制造业、财务金融保险、通讯及医疗服务:
(1)商场从顾客购买商品中发现一定的关联规则,提供打折、购物券等促销手段,提高销售额;
(2)保险公司通过数据挖掘建立预测模型,辨别出可能的欺诈行为,避免道德风险,减少成本,提高利润;
(3)在制造业中,半导体的生产和测试中都产生大量的数据,就必须对这些数据进行分析,找出存在的问题,提高质量;
(4)电子商务的作用越来越大,可以用数据挖掘对网站进行分析,识别用户的行为模式,保留客户,提供个性化服务,优化网站设计;
一些公司运用数据挖掘的成功案例,显示了数据挖掘的强大生命力:
美国AutoTrader是世界上最大的汽车销售站点,每天都会有大量的用户对网站上的信息点击,寻求信息,其运用了SAS软件进行数据挖掘,每天对数据进行分析,找出用户的访问模式,对产品的喜欢程度进行判断,并设特定服务,取得了成功。
Reuteres是世界著名的金融信息服务公司,其利用的数据大都是外部的数据,这样数据的质量就是公司生存的关键所在,必须从数据中检测出错误的成分。Reuteres用SPSS的数据挖掘工具SPSS/Clementine,建立数据挖掘模型,极大地提高了错误的检测,保证了信息的正确和权威性。
Bass Export是世界最大的啤酒进出口商之一,在海外80多个市场从事交易,每个星期传送23000份定单,这就需要了解每个客户的习惯,如品牌的喜好等,Bass Export用IBM的Intelligent Miner很好的解决了上述问题。
D. 目前,数据挖掘技术在我们身边的具体应用有哪些大家可以在线交流交流......
数据挖掘系统的其它应用还有:
♦ 在对客户进行分析方面:银行信用卡和保险行业,利用数据挖掘将市场分
成有意义的群组和部门,从而协助市场经理和业务执行人员更好地集中于
有促进作用的活动和设计新的市场运动。
♦ 在客户关系管理方面: 数据挖掘能找出产品使用模式或协助了解客户行为,
从而可以改进通道管理 (如银行分支和6等) 。 又如正确时间销售就是基于顾客生活周期模型来实施的。
♦ 在零售业方面:数据挖掘用于顾客购货篮的分析可以协助货架布置,促销活动时间,促销商品组合以及了解滞销和畅销商品状况等商业活动。通过
对一种厂家商品在各连锁店的市场共享分析,客户统计以及历史状况的分
析,可以确定销售和广告业务的有效性。
♦ 在产品质量保证方面:数据挖掘协助管理大数量变量之间的相互作用,并
能自动发现出某些不正常的数据分布,揭示制造和装配操作过程中变化情
况和各种因素,从而协助质量工程师很快地注意到问题发生范围和采取改
正措施。
♦ 在远程通讯方面:基于数据挖掘的分析协助组织策略变更以适应外部世界
的变化,确定市场变化模式以指导销售计划。在网络容量利用方面,数据
挖掘能提供对客户聚集服务使用的结构和模式的了解,从而指导容量计划
人员对网络设施作出最佳投资决策。
♦ 在各个企事业部门,数据挖掘在假伪检测及险灾评估、失误回避、资源分
配、市场销售预测广告投资等很多方面,起着很重要作用。例如在化学及
制药行业,将数据挖掘用于巨量生物信息可以发现新的有用化学成分;在遥感领域针对每天从卫星上及其它方面来的巨额数据,对气象预报、臭氧
层监测等能起很大作用。
E. 什么是数据挖掘,简述其作用和应用。
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。
人们迫切希望能对海量数据进行深入分析,发现并提取隐藏在其中的信息,以更好地利用这些数据,正是在这样的条件下,数据挖掘技术应运而生。
数据挖掘有很多合法的用途,例如可以在患者群的数据库中查出某药物和其副作用的关系。这种关系可能在1000人中也不会出现一例,但药物学相关的项目就可以运用此方法减少对药物有不良反应的病人数量,还有可能挽救生命。
(5)数据挖掘在旅游业的应用扩展阅读
目前数据挖掘的算法主要包括神经网络法、决策树法、遗传算法、粗糙集法、模糊集法、关联规则法等。
根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及internet等。
数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。不是每件数据挖掘的工作都需要这里列出的每一步。
F. 大数据技术在垂直旅游搜索中的应用
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。由此可知:大数据就是指非结构化的数据,包括图片、视频、音频以及设备数据。大数据本身是一个现象而不是一种技术,伴随着大数据的采集、传输、处理和应用的相关技术就是大数据处理技术,是系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理技术。大数据的核心是预测结果。智慧旅游是指以云计算、物联网、互联网、下一代通信网络、高性能信息处理、智能数据挖掘等技术广泛的运用于旅游中,达到旅游信息基础架构与高
度整合的旅游基础设施的完美融合使得政府旅游管理部门、相关旅游企业和旅游者等可以做出更明智决策的旅游方式。
二.智慧旅游数据具备大数据的典型特质
(一)大数据的四个特质
大数据具备“4V”的特质,即:大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB(万亿字节,TB是Terabyte 的缩写,n.万亿字节)级别,跃升到PB(PB是Petabyte 的缩写,Petabyte是一种资讯计量单位,现今通常在标示网络硬盘总容量,或具有大容量的储存媒介之储存容量时使用。)级别;第二,数据类型繁多。包括网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。因此,“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。
(二)智慧旅游数据分析
目前,旅游微博、微信、视频网站、社交网站等都产生以亿计的数据。这其中既包括在线旅游预订网站中用户的预订频率、价位,也包括旅游攻略网站中用户对酒店床垫软硬的评价、对旅游景点公共服务设施是否齐全的描述,这些信息可能是文字,也可能是图片或视频音频。还有景区、酒店自己内部管理所有的信息系统、视频监控系统、感知系统等所有智慧旅游系统所产生的大量数字、文字、视频数据。根据这些数据来源主要分为外部数据和内部数据,如下图:
智慧旅游大数据来源—外部数据
智慧旅游大数据来源—内部数据
综合以上可知:智慧旅游数据具备典型的大数据特质。旅游业经过多年的信息化战略发展,产生了体量巨大的结构化和非结构化的数据,这些数据类型繁多,价值密度低。
三.大数据技术在智慧旅游中的应用
相对于传统的数据库应用,大数据分析具有数据量大、类型多、价值密度低、处理速度快等特点。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。如果把大数据比作一种产业,那么这种产业实现赢利的关键,在于提高对数据的加工能力,通过“加工”实现数据的“增值”。智慧旅游的发展离不开大数据,依靠大数据提供足够有利的资源,智慧旅游才能得以“智慧”发展。由于智慧旅游的“智慧”体现在“旅游服务的智慧”、“旅游管理的智慧”和“旅游营销的智慧”。所以大数据技术在智慧旅游中的应用主要也在这三个方面。
G. 数据挖掘专业有哪些应用啊,这是个什么样的专业,发展前景怎样
数据挖掘是一门交叉学科,随着计算机技术和数据仓库的发展,在电信、银行、保险等许多商业行业得到广泛的应用,下面我说几个典型的应用,如
1、客户细分:人以类聚,客户细分或客户分群是现代营销的基础,通过聚类分析的方法,对客户进行划分,获得各个客户群不同的特征,从而对客户群进行针对性的营销,或者面向特定细分群开发特定产品,从而达到提高产品销量,提升客户忠诚度的目的。例如,银行业将客户分成不同的群体,向其提供不同的个性化投资产品。
2、客户流失预测:研究表明,保留老客户的成本远低于获取新客户的成本。但是,对所有的客户进行挽留营销不切实际并且非常昂贵,通过对客户行为模式的挖掘,客户流失预测仅找出那些可能会流失的客户,对这些客户进行针对性的挽留,可降低营销成本,提高产品收入,这对于有大量客户的电信、银行、保险等行业非常必要。
3、客户价值分析:客户对企业的贡献不同,一般来说遵循“20-80”原则,少数客户对企业的贡献占大都分比例,那么,哪些客户是企业最好的客户?仅仅是最近奉献收入最多的群体吗?哪些是潜在的好客户?通过客户价值分析,发现企业的最好客户,把有限的资源使用在能带来最大的价值客户的身上。
4、异常发现:通过对数据进行分析,找出其中的异常点,例如,信用卡是当今广泛使用的金融产品,随着竞争的加剧,各银行竞相大力推广信用卡,有少数不法分子趁机使用假资料申请信用卡,骗取钱财。通过数据挖掘对申请资料进行学习评分,可以发现信用欺诈的申请者,避免损失;通过对税务数据的分析,发现偷税漏税行为等。
5、交叉营销:通过对商品和服务组合营销模式的分析,能够发现商品之间的搭配销售模式。利用这些模式,能够设计交叉销售策略。例如,在零售业进行客户购物摇篮分析,根据结果对货架重新摆放,从而提高销售量;电台通过对馆长观看习惯的分析,重新编排节目,提高收视率;零售业巨头沃尔玛使用数据仓库和数据挖掘技术分析客户的购买模式,用于对库存的管理和销售机会的把握。
6、个性化服务:对每个人的消费进行分析,发现其余众不同的消费习惯,可有针对性地提供服务或进行促销。例如,在电子商务中,网站会根据过往购买记录项向客户推荐新到商品;根据大多数人购买商品的行为,向客户推荐当前所买商品的关联关系。
7、数据库直销:一般来说,向客户随机发出大量直销邮件,可能仅有不到5%的客户会做出响应。根据小规模邮件直销的结果反馈,数据挖掘建立一个模型,找出潜在最有可能做出响应的客户,将响应率提高到15%,从而削减了成本,提高了销量。
8、 改进工作效率:通过对日常工作或业务数据分析,找到优化的模式,从而改进工作效率或业务流程,例如,NBA使用一套数据挖掘工具,分析球员的运动,以帮助教练找到最优组织进攻和防守的方法;通过对制造厂商供应链日常活动的分析,找出供应链的最优运作方式;通过对生产计划及生产效率等数据的分析,找到最有效的排班方式;通过对生产工艺和质量数据的关系的分析,发现好的生产工艺流程等。
9、科学发现:通过对大量科学实验数据进行分析,发现其中隐藏的模式,可导致新的科学发现的产生。例如,通过对天文数据的数据挖掘分析,发现新的星体;通过对生物信息数据的分析,发现新的基因和蛋白质折叠;识别具有良好药物特性的分子,以用于制造新药;通过对医疗数据的分析,发现药物和疾病之间的关系等。
10、预警:通过对数据中趋势的分析,对将要可能发生的事件提出预警。例如,在电信行业,通过对以往预警数据的分析,发现有哪些常规报警可能是重大问题的前兆,并提出预警,阻止事故的发生;对工厂生产数据的分析,识别重大质量问题的前兆,已采取必要措施,避免产品质量试过的发生。
等等很多,是一门很有发展的学科。
H. 数据挖掘对旅游业的影响
旅游业的数据好象很难收集吧
I. 数据挖掘的应用有哪些
数据挖掘目前在中国的尚未流行开,犹如屠龙之技;数据挖掘本身融合了统计学、数据库、机器学习、模式识别、知识发现等学科,并不是新的技术。
数据挖掘之所以能够应用不是因为算法,算法是以前就有的。数据挖掘应用的原因是大数据和云计算。比如阿尔法狗的后台有上千台计算机同时运行神经网络算法;
数据初期的准备工作,也称Data Warehousing。通常占整个数据挖掘项目工作量的70%左右。在前期你需要做大量的数据清洗和字段扩充的工作。数据挖掘和报告展现只占30%左右;
数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)。
目前国内的数据挖掘人员工作领域大致可分为三类
1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告;
2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析;
3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。
你自己的定位与学习
基于以上的介绍,你大概可以明确你需要努力的方向。如果你不是致力于科研方向,那么你需要掌握如下的技能:
1. 需要理解主流机器学习算法的原理和应用。按照需要解决的问题,主要分为三大类,见下图:
2. 需要熟悉至少一门编程语言。如R,Python,SPSS Modeler,SAS,WEKA等。
关于软件,有三个原则:只要能达到目标的软件就是好软件;你研究的领域啥软件好用就用啥软件;不要妄想用一个软件解决所有问题。
3. 需要理解数据库基本原理,能够熟练操作至少一种数据库,如MySQL,OracelDB2等。
4. 熟悉数据挖掘常见的运用场景。如客户生命周期管理、客户画像和客户分群、客户价值预测模型构建、推荐系统设计等,这些需要依托于不同行业。
5.经典图书推荐:《数据挖掘:概念与技术》、《数据挖掘导论》、《机器学习实战》、《数据库系统概论》、《R语言实战》。