2009 Data Miner Survey
HIGHLIGHTS:
- 本次调查在上半年开始,以在线问卷方式进行;总共调查40个题目,其中部分题目为交互式问答
(2008年为34个题目)
(2007年为27个题目))
- 来自58个国家地区的710位受访者,参加了2009年的调查
(2008年, 44个国家地区的348位受访者)
(2007年, 35个国家地区的314位受访者)
- 在提示的众多算法中,分类树、回归分析以及集群分析仍是最常使用的算法,这项结果与2007年以及2008年相同
- 数据探勘在组织内部扮演了一项重要的角色;
- 半数的资料探勘研究人员表示,他们分析出来的结果,正在帮助组织建立战略决策以及作业流程
- 58%的受访者表示,正在增加数据探勘技术的知识基础
- 60%的受访者表示,建模后的成果总是或者在大多数时间已经部署在实际的工作上面
- 大多数的资料探勘研究人员认为,2008年的金融海啸带来的全球性经济危机并不会带给他们在工作上面的负面影响
- 几乎一半来自工业背景的资料探勘研究人员认为,如果企业内部人员具备分
析能力,将可以引导企业高于产业平均水平甚至更好的程度;但是,有19%
的受访者认为他们的企业内部,仅仅具备基础(甚至没有)的分析能力
- 从事资料探勘的研究人员,最大的挑战来自于数据来源本身的杂乱、如何向
他人解释数据探勘的应用,以及数据链路上的困难;然而在今年的调查中,
「认为与前一年相比,数据质量与数据链路将带来困扰」的人数减少了
- 大多数的受访者表示,IBM SPSS Modeler (SPSS Clementine)、STATISTICA以及
IBM SPSS Statistics (SPSS Statistics)是他们主要的工具
- 开源型工具如Weka与R,在今年排名上有实质的提升,并且大量的用
户来自于学校以及营利组织
- 在数据探勘工具选择上,SAS Enterprise Miner今年的排名下降
- 在用户的使用满意度上,IBM SPSS Modeler、STATISTICA以及Rapid Miner是最满意的数据探勘软件
- 领域与行业:资料探勘无所不在! 最常实践的领域是客户关系管理与营销
(CRM/Marketing)、学校、金融服务,以及信息科技与电信(IT / Telecom);针
对那些来自营利组织的受访者,最常实践的是营销与销售部门,以及研发部门