数据分析也好,统计分析也好,数据挖掘也好、商业智能也好都需要在学习的时候掌握各种分析手段和技能,特别是要掌握分析软件工具!学习数据分析,一般是先学软件开始,再去应用,再学会理论和原理!没有软件的方法就不去学了,因为学了也不能做,除非你自己会编程序。
SPSS、SAS都是用于统计分析,围绕统计学知识的一些基本应用,包括描述统计,方差分析,因子分析,主成分分析,基本的回归,分布的检验等等。SPSS用于市场研究较多,SAS银行金融和医学统计较多,有一些难度。
R语言像是综合性较强的一类数据分析工具,集统计分析、数据挖掘,数据可视化。
展开来,讲讲数据分析~
这些数据分析工具的使用还是看需求,每个企业应用的选择和方式都不同。数据分析的概念很广,站在IT的角度,实际应用中可以把数据分析工具分成两个维度:
第一维度:数据存储层——数据报表层——数据分析层——数据展现层
第二维度:用户级——部门级——企业级——BI级
1、数据存储层
数据存储设计到数据库的概念和数据库语言,这方面不一定要深钻研,但至少要理解数据的存储方式,数据的基本结构和数据类型。SQL查询语言必不可少,精通最好。可从常用的selece查询,update修改,delete删除,insert插入的基本结构和读取入手。
Access2003、Access07等,这是最基本的个人数据库,经常用于个人或部分基本的数据存储;MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;
SQL Server2005或更高版本,对中小企业,一些大型企业也可以采用SQL Server数据库,其实这个时候本身除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;
DB2,Oracle数据库都是大型数据库,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,一般大型数据库公司都提供非常好的数据整合应用平台;
BI级别,实际上这个不是数据库,而是建立在前面数据库基础上的,企业级应用的数据仓库。Data Warehouse,建立在DW机上的数据存储基本上都是商业智能平台,整合了各种数据分析,报表、分析和展现,BI级别的数据仓库结合BI产品也是近几年的大趋势。
2、报表/BI层
企业存储了数据需要读取,需要展现,报表工具是最普遍应用的工具,尤其是在国内。过去传统报表大多解决的是展现问题,如今像帆软报表FineReport也会和其他应用交叉,做数据分析报表,通过接口开放功能、填报、决策报表功能,能够做到打通数据的进出,涵盖了早期商业智能的功能。
Tableau、Qlikview、FineBI这类BI工具,可分在报表层也可分为数据展现层,涵盖了数据整合、数据分析和数据展现。FineBI和Tableau同属于近年来非常棒的软件,可作为可视化数据分析软件,可常用FineBI从数据库中取数进行报表和可视化分析。相对而言,可视化Tableau更优,但FineBI又有另一种身份——商业智能,所以在大数据处理方面的能力更胜一筹。
3、数据分析层
这个层其实有很多分析工具,当然我们最常用的就是Excel。
Excel软件,首先版本越高越好用这是肯定的;当然对excel来讲很多人只是掌握了5%Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析工作!但是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
SPSS软件:当前版本是18,名字也改成了PASW Statistics;我从3.0开始Dos环境下编程分析,到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始越来越重视商业分析,现在已经成为了预测分析软件;
SAS软件:SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来讲,SAS比较难学些,但如果掌握了SAS会更有价值,比如离散选择模型,抽样问题,正交实验设计等还是SAS比较好用,另外,SAS的学习材料比较多,也公开,会有收获的!
JMP分析:SAS的一个分析分支
XLstat:Excel的插件,可以完成大部分SPSS统计分析功能
4、表现层
表现层也叫数据可视化,以上每种工具都几乎提供了一点展现功能。FineBI和Tableau的可视化功能上文有提过。其实,近年来Excel的可视化越来越棒,配上一些插件,使用感更佳。
PPT:办公常用,用来写数据分析报告;
Xmind&百度脑图:梳理流程,帮助思考分析,展现数据分析的层次;
Xcelsius软件:Dashboard制作和数据可视化报表工具,可以直接读取数据库,在Excel里建模,互联网展现,最大特色还是可以在PPT中实现动态报表。
下面详细介绍一下7款广泛流行的数据分析软件平台,帮助企业实施数据收集、数据管理、数据分析、数据挖掘,使企业根据数据做出很好的决策,主要包括SPSS数据分析软件,SAS分析软件,Minitab软件,Stata统计软件,JMP数据探索、挖掘、分析软件,Crystal Report报表软件, AnyReport数据分析平台。
SPSS数据分析软件
SPSS 英文全称是 Statistical Product and Service Solutions,是世界上最早数据统计软件,在1968年由美国斯坦福大学的三位研究生研发,
现今被IBM收购,并命名IBM SPSS,广泛应用于商业数据分析。IBM SPSS是一款预测性分析软件,包括整个分析流程:规划、数据收集、分析、
报告和部署,它提供统计学分析和报告,预测建模、数据挖掘、决策管理与部署以及大数据分析等功能,
应用行业:银行业、零售及消费品行业、保险业、能源与公用事业、旅游与运输业等。
SAS分析软件
SAS 英文全称是Statistical Analysis System, 由美国北卡罗来纳州立大学开发的统计分析软件,它是一个模块化、集成化的大型应用软件系统,
它由数十个专用模块组成,主要的功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告设计、运筹学方法、计量经济学与预测等。
SAS系统大概可以分为四大部分:SAS数据库部分;SAS核心分析工具;SAS开发展现工具;对分布模式的支持及其数据仓库设计部分。
SAS系统主要实现了以数据为中心的四大功能:数据访问、数据管理、数据呈现、数据分析。
应用行业:制造业、保险业、医疗保健、汽车行业、银行业、公用事业、高科技制造业、教育等。
Minitab软件
Minitab 是现代质量管理统计的领先者,由美国的宾夕法尼亚州州立大学研发,它供数据分析所需要的全部工具,
通过引导你选择正确的分析方法并提供清晰的输出报告结果。
它也提供了便捷的功能,例如简化的工作流, 使用全面的统计量来探索数据的方法,以及可视化的图形报表。
应用行业:金融、保险行业、电子、电信行业、电器、机械行业、运输、物流行业、教育行业等。
Stata统计软件
Stata统计软件由美国计算机资源中心(Computer Resource Center)1985年研发,是一款数据分析、数据管理以及绘制专业图表的统计分析软件,
并与SAS、SPSS一起被称为三大权威软件,其特点具有数据管理、统计分析、绘制图表、矩阵计算和程序语言,
其图表主要包括直方图、条形图、百分条图、饼图、散点图、散点图矩阵、星形图等
JMP数据探索、挖掘、分析软件
JMP是SAS旗下业务部门之一,由1989年推出一款统计发现软件,在桌面环境上创造了交互式的可视化功能和分析功能,
JMP涵盖了工业统计中的所有主题:统计质量控制、可靠性及实验设计(DOE)。 JMP的DOE最初作为附加产品的形式出现,
用于创建经典设计,之后逐渐发展成为丰富的集成环境,用于设计试验,以期实现现有资源的最高使用效率,
JMP致力于开发各种创新功能,以帮助用户更快地将数据可视化并理解数据,采用适当的分析并实现统计发现。
数据导入和处理从此变得轻松简单
Crystal Report报表软件
Crystal Report是一个功能强大的、比较流行的报表工具,一款商务智能(BI)软件,主要用于设计及产生报表,
它有Crystal Report Designer、Crystal Report Viewer、Crystal Report Engine等重要的组件,
支持多种报表样式:普通行列报表、主子报表,交叉表,图形报表,支持20多种图形:柱形图、股票图,漏斗图,条形图,饼图,
曲线图,甘特图,雷达图,气泡图等
AnyReport数据分析平台
AnyReport 是一款Java开发的报表软件,跨平台,主要的功能包括数据收集、数据管理、业务流程、图表设计、数据统计分析。
支持ppt、word、excel、pdf等office文件输出,其特点可以通过浏览器在线设计报表、在线浏览报表,收集数据流程化,支持数据钻取、挖掘、分析。
评论
查看更多