如今,大数据日益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对。众多新的统计软件工具的出现成为了深入大数据洞察研究的重要助力。下面是几款比较常用的统计分析工具。
一、SPSS
SPSS(Statistical Product and Service Solutions)是全球领先的统计分析与数据挖掘产品。成立于1968年,是世界上应用非常广泛的专业统计和数据模型软件之一。2009年IBM全资收购了SPSS公司,正式更名为“IBM SPSS”。SPSS Statistics是一款统计分析软件,它使您能够更快速、更深入地挖掘数据,这使其成为比电子表格、数据库或标准多维工具更高效的分析工具,SPSS Statistics擅长理解复杂的模式和关联数据;使用户能够得出结论并进行预测。它能够快速处理数据操作和统计程序等任务,需要的时间仅为许多非统计程序的三分之一。
SPSS突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要适当的练习,就能够掌握简单的操作分析,因此SPSS特别受非统计专业数据分析人员的青睐。
迄今SPSS软件已有30余年的成长历史,全球约有25万家产品用户,它们分布在通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用极为广泛的专业统计软件。
二、Stata
Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。
统计功能
Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。
作图功能
Stata的作图模块,主要提供如下八种基本图形的制作:直方图(histogram),条形图(bar),百分条图(oneway),百分圆图(pie),散点图(two way),散点图矩阵(matrix),星形图(star),分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某些图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
矩阵运算功能
矩阵代数是多元统计分析的重要工具,Stata提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、Cholesky分解、Kronecker內积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
三、Minitab
Minitab软件是现代质量管理软件的领先者,全球六西格玛实施的共同语言,以无可比拟的强大功能和简易的可视化操作深受广大质量学者和统计专家的青睐。Minitab 1972年成立于美国的宾夕法尼亚州州立大学(Pennsylvania State University),到目前为止,已经在全球100多个国家,4800多所高校被广泛使用。
Minitab功能菜单包括:基础和高级统计工具:
假设检验(参数检验和非参数检验)
回归分析(一元回归和多元回归、线性回归和非线性回归)
方差分析(单因子、多因子、一般线性模型等)
时间序列分析
图表(散点图、点图、矩阵图、直方图、茎叶图、箱线图、概率图、概率分布图、边际图、矩阵图、单值图、饼图、区间图、Pareto、Fishbone、运行图等)
蒙特卡罗模拟和仿真
分布分析
灵活的数据导入、导出和实时监控
SPC(Statistical Process Control—统计过程控制)
DOE(全因子、部分因子设计、响应曲面设计、田口设计、混料设计等)
MSA(交叉、嵌套、量具运行图、类型I量具研究等)
可靠性分析(分布拟合、检验计划、加速寿命测试等)
多变量分析
功效样本量
强大的宏语言
Minitab软件是为质量改善、教育和研究应用领域提供统计和服务的先导。是全球领先的质量管理和六西格玛实施软件工具,更是持续质量改进的良好工具软件。