生物统计分析软件GraphPad Prism 9已正式发布!Prism 9将您的分析和图形扩展到更高的维度。
更高维度的数据!
Prism 9对多变量数据进行了许多重大改进。使用标准结构探索更大的数据集,并通过以下改进执行新的和改进的分析:
增加的数据限制—在每个数据表中至多输入1024列数据
自动识别变量类型—将多变量数据表中的变量识别为连续值,分类或标签值
数据表中的文本信息—直接以文本形式输入数据。无需编码“0”和“1”之类的变量,只需直接在数据表中输入“Male”和“Female”
自动变量编码—输入您的数据,让Prism负责其余的工作。Prism会自动将分类文本变量编码为数字“虚拟”变量
通常,在研究中,我们会发现自己拥有大量有关实验中不同变量的信息。举一个简单的例子,想象一下在给个体服用旨在降低血压的实验药物或安慰剂后测量他们的血压,除了记录的血压测量值之外,您还可能记录了有关每个受试者的年龄,身高,体重,性别,种族以及许多其他潜在变量的大量信息。
设计了许多统计技术来分析这类“多变量”数据,例如多元线性回归和多元逻辑回归。使用这些类型的“多个变量”分析意味着您可以探索感兴趣的结果而不会浪费任何可能有用的信息。为了促进这种增强的数据信息密度,Prism提供了我们的多变量数据表以将数据容纳在标准数据结构中,该数据结构几乎被其他统计软件普遍使用并打包在那里(例如R,SPSS和MATLAB)。在这种格式下,每一列代表一个不同的变量,而每一行代表一个不同的主题(每个主题的每个变量的测量值将放入该主题所在行的相应列中)。
注意:上图以二维形式显示了PCA的可视示例。Prism中的PCA可以对数百个变量执行!
主成分分析(PCA)
有时,收集的变量数量远远超过可供研究的学科数量。考虑基因表达研究,其中从分为两组的受试者中测量了成百上千不同基因的表达水平:治疗组和对照组。可能仅仅是变量太多而无法使模型适合数据。但是,选择一些要从分析中排除的变量只会丢掉可能有用的信息!PCA是一种“降维”技术,可用于减少所需变量的数量,同时从数据中消除尽可能少的信息。
PCA中可用的其他功能包括:
通过平行分析(以及Kaiser方法,总方差阈值方法等)选择组件
碎石图,分数图和双线图的生成
自动准备PCA结果,以进一步用于多元线性回归(主成分回归)
向图形添加新尺寸
直接从原始数据,符号位置(X和Y坐标),大小和填充颜色的编码变量创建气泡图。请注意,可以使用分类(分组)或连续变量来定义符号颜色和符号大小。
在此图上,有100多个国家/地区显示为单个圆圈。每个圆圈的X坐标代表该图的GDP(PPP),而Y坐标代表出生时的平均预期寿命。每个符号的大小与其所代表的国家的人口成比例(两个大的符号分别代表中国和印度)。然后,每个符号的颜色代表该国家所在的大陆。在这种情况下,此终变量(颜色)是分类变量,但气泡图中的颜色也可以由连续变量定义。
在该图中,符号的X坐标,Y坐标和大小与以前相同。但是,现在该符号的颜色以连续比例表示该国家每1000个人的出生率。Prism现在还具有内置的半透明配色方案,以便可以更清晰的看到重叠的符号。
自动将多个比较结果添加到图形
只需执行多个成对比较的适当分析即可。然后单击一次以将这些结果自动添加到图形中。要自定义这些行和星号,只需再次单击工具栏按钮。调整数据或分析,图形上显示的结果将自动更新。但是请记住,P值只是故事的一部分。别忘了报告估算值(例如,均值差异为95%置信区间!)。
添加P值以证明均值差异的95%CI与P值之间的关系。如果95%CI包括零,则P值将小于0.05。观察95%CI比单独使用P值更具参考价值。
使用估计图更好的可视化T测试结果
在测试中执行,Prism现在将自动创建结果的估计图。在此图上,两组的原始数据都将绘制在左侧的Y轴上。在右边的Y轴上,将绘制组均值的差及其95%CI置信区间。该可视化提供的信息比单独的P值还多,因为它不仅显示了95%CI是否包含零,还显示了95%CI的宽度(如果95%CI包含零,则P值将大于0.05.如果95%CI不包括零,则P值将小于0.05)。
新的功能
主成分分析(PCA),一种通过大化每个新维度的方差将高维空间中的数据投影到低维空间中的方法。PCA主要用作探索性数据分析和建立预测性模型的工具。它通常用于可视化群体之间的遗传距离的相关性。
PCA生成的新图形类型
Scree图:Scree图用于显示主成分分析(PCA)中标识的每个主成分(PC)的原始特征值
Score plots:Score plots提供了一种在两个指示的PC(通常将PC1作为水平轴,将PC2作为垂直轴)的新(缩小)维空间中查看原始数据的方法。
Loading plots:Loading plots提供了一种可视化两个选定主成分系数的方法
Biplots:Biplots是Score plots和loading plots的组合
方差图的比例:该图类似于上述的Scree图,但使用的解释风格略有不同
多变量图以多变量数据表中的数据位图
制作气泡图,其中符号大小由数字或分类变量编码
使用其他变量编码符号颜色和连接线的外观
全部这些选择都是在外观经过改进的全新“格式图”对话框上进行的
气泡图的新半透明配色方案
估算图,这是一种直观的方式来表示两个样本的比较测试(例如t检验)的结果。该图包含原始数据以及分析结果摘要的目的是强调效应大小和置信区间的重要性,同时不再强调“重要性”概念。
图形上的成对比较,这是可视化的自动生成,该可视化将用户数据与假设检验期间进行的成对比较的结果相结合(即,将有意义的星标自动添加到图形中)。
功能改进
非线性回归
很大了提高了用户定义方程式评估的性能和准确性
与其他任何参数一样,为微分方程定义X0
创建五个残查图(包括新的Actual vs Predicted图)。以前,每个分析只能生成一张图
重新排列并重新标记了“NLR参数”对话框的“置信度”选项卡上“不稳定的参数和模棱两可的拟合”部分的选项
多元线性/逻辑回归
选择具有自动参考级别规范的分类自变量的模型
指定基于数据的“自动”参考级别规范的方法(第一或最后一个级别,频繁或不频繁的级别)
通过MLR参数对话框的“参考级别”选项卡中的“定义类别顺序”选项,指定分类变量级别结果的顺序
改进的模型控制(树形视图),可以更好的表示分类变量和交互
对话框中的简化模型表示
使用数据表中的数据或参数对话框中每个预测变量的指定值对结果(因变量)的值进行插值(仅适用于多个线性回归)
改进的相关矩阵输出,因此可以生成结果的热图
多重两个样本测试分析(多重t检验分析)现在包括以下选项:
具有Welch校正的多个未配对t检验
多重配对t检验
多重比率配对t检验
多个非参数不成对的Mann-Whitney检验
多个非参数配对的Wilcoxon检验
多个非参数非配对Kolmogorov-Smirnov检验
行统计分析
允许计算具有自定义置信区间水平的均值
允许计算具有“无错误”,“四分位数”,“max/min”,“百分位数”的中位数
允许计算具有“无误差”,“几何SD”,“CI”的几何平均数
双向方差分析:仅主效果模型
在双向ANOVA中仅对主要效果模型(无相互作用项)进行重复数据处理
仅对主要效果模型,允许在双向ANOVA中组合缺失因子水平
对于未经复制的双向方差分析,不允许进行“简单效果”多重比较
使用分析常量名称而不是值来生成带有链接参数的标准转换的默认标题
在“参数:非线性回归”对话框的“置信度”选项卡中将默认值更改为不稳定选项
更新了可对多变量表执行的分析行为,以正确处理不同的变量选项
创建相关矩阵时,选择忽略缺少或排除任何值的行。选择此选项后,矩阵中的全部相关系数均从同一组行计算得出
允许“选择和转换”分析在绿色多变量结果 表中定义变量的类型
(Mac)添加了警报“您正在尝试分析单个列。如果要执行单样本t检验,请使用一个样本t和Wilcoxon测试分析。t检验需要两组(均在Y列中;X列将被忽略)”
非数学功能改进
新数据限制
取消了1024个数据集[字母A...AMJ]和512个子列的数据表限制
提升了图形限制,可以绘制1024个数据集
多个可变数据表
在Prism的多变量数据表中定义变量类型的功能
实现了在Prism的多变量数据表中定义量类型的功能
特殊符号和Unicode
在“插入”主菜单中添加了“字符>Unicode符号...”命令,该命令将打开标准系统的“字符映射”对话框,并允许输入更多种类的特殊符号
(Windows)升级了Prism的“插入字符对话框”,并用与Unicode兼容的字符替换了将Symbols字体用于希腊语/数学/欧洲字符的旧方法,从而实现了跨平台的第三方应用程序的无缝兼容性。
右键单击任何图纸类型(包括图形和布局)时,将“导出”命令添加到在导航器中打开的上下文菜单中。
如果删除生成这些图形的父分析,Made Prism也会删除图形,但是当分析将曲线添加到现有数据图形时,Made Prism不会删除图形。
在主“更改-配色方案”和“更改颜色”工具栏的下拉菜单中添加了具有半透明配色方案的新部分。
数据表和结果中图形或图形上数据点的格式
(Windows)使用数据表中的“格式化点”上下文菜单,可以将条形图,误差条和线选项应用于带有条形图的散点图
(Windows)可以使用数据表中的“格式点”上下文菜单来应用“误差线”和“线”选项,以散布成组的图形
(Windows)可以使用“格式化点”上下文菜单将数据表中的“行”和“四分位数”格式应用于小提琴图
(Windows)可以使用数据表中用于叠加散点图的“格式点”上下文菜单来应用“误差线和线”选项
(Windows)可以格式化绿色结果表中图形上的数据点。案例1056514
(Windows)从数据表的“格式点”上下文菜单启用了小提琴图上所选符号的格式
(Windows)在“Violin plot only”(仅小提琴图)图中启用了小提琴的格式设置上下文菜单,方向相反
(Mac)启用了“格式化点”上下文菜单中的“线”部分,以便能够使用数据表中的均值和中值来格式化图形上的数据
在“欢迎”对话框中,示例数据文件的浮动注释中的URL已更新,以指向Prism 9用户指南(而不是早期版本的指南)
(Windows)Prism现在可以将Excel中的“True”或“False”布尔值分别作为“1”和“0”导入Prism的多变量数据表中
(Windows)Made Prism在系列导航器面板中打开的“删除工作表”对话框中显示该系列的全部工作表
(Windows)将系统要求更新为Windows7。添加了在Prism在Vista上启动时敦促更新Windows的警报
(Mac)删除了“列”/“分组”/“偶发性”/“多个变量”/“全部数据”表中每个单独列顶部的“Y”标签
(Mac)Prism会记住上一次使用的窗口的大小,并将其用作新窗口的默认大小
(Mac)启用了“整个图的一部分”的“更改”和上下文菜单中将“反向数据设置顺序”命令重命名为“反向类别顺序”
性能改进
将“相关矩阵”分析的性能提高了20倍以上
(Windows)使用残差计算将拟合样条线/LOWESS分析的性能提高了约10倍
(Windows)将“简单逻辑回归”分析的性能提高了1.5倍以上
(Windows)将“转换”分析的性能提高了约4倍
(Windows)将“修剪行”分析的性能提高了约3倍
(Windows)改进了模拟具有大量值的XY数据的性能,并且多次复制的速度超过10倍
(Windows)改进了当源数据包含多于3x的行时切换到分组图形表的性能
(Windows)略微提高了“规范化”分析的性能
(Windows)当源数据表多次包含从其他分析链接的数据时,改进了“蒙特卡洛”分析的性能
(Mac)将“转换”分析的性能提高了约2.5倍
(Mac)将“修剪行”分析的性能提高了10倍以上
(Mac)改进了当源数据包含多于2x的行时切换到分组图形表的性能
(Mac)将“规范化”分析的性能提高了5倍以上
基础设施
(Windows)Prism 9仅适用于64位Windows。没有Windows的32位的Prism
(Mac)Prism 9需要macOS 10.12(Sierra)或更高版本
分析错误已修复
修复了在使用t检验模式对大数据执行提取和重新排列分析时发生崩溃的问题
修复了使用特殊的不适当语法尝试执行自定义方程式分析时发生崩溃的问题
修复了如果未分析全部数据集的情况,单向方差分析结果表的“已分析数据集”上中显示错误的列字母的问题
(Windows)修复了取消选中“绘制一阶导数”选项后,显示空白结果表以进行“绘制”分析的问题
图形错误已修复
修复了应用于条形图上某些条形的应用于全部数据集的图案填充丢失的问题
修复了如果在“定义配色方案”对话框的“数据集”部分中选择了“全部”项时,颜色设置为应用于图形的问题
修复了以下问题:如果源数据表包含大量行,则某些数据点超出了分组散点图上的轴限制
修复了在选择“散点图”或“对齐点图”外观后,在“格式图”对话框的“样式”部分中将“中位数”意外更改为“平均值”的问题
修复了克隆图形并更改数据表格式以显示错误值后X值的排除属性似乎丢失的问题
修复了在执行“应用数据集格式”上下文命令后,无法使用数据表上的“格式点”上下文菜单来格式化XY图上的数据点的问题
(Windows)修复了以下问题:尝试在图形上格式化单个小提琴时,它会意外更改整个数据集的全部小提琴
(Windows)修复了以下问题:添加新数据并单击X轴后,如果无法显示条,则行标题在分组图上损坏
(Windows)修复了对两个带星号的图形括号执行“分组”命令后,图形从工作表中消失的问题
(Windows)修复了在图表中添加另一种阴影后自定义轴线之间的阴影丢失的问题
(Windows)修复了复制图形族后结果图形上的点未保留颜色格式的问题
(Mac)修复了如果第二条的值设置为零,则交错图形上的条会重叠的问题
其他错误修复
修复了“格式对象”对话框中的“设置为默认”选项不适用于文本对象的问题
修复了如果绘制了一组数据并显示点的情况下,在分组或嵌套的小提琴的“更改图形类型”对话框中意外显示了“图”下拉列表和“显示截断的小提琴图”复选框的问题
在“参数分析”对话框和结果中使用Šídák代替Sidak
(Windows)修复了在取消Magic步骤2后调用图形的“格式轴”后发生的崩溃
(Windows)修复了在全局更改奇数数据集的“格式图”对话框中图形外观时的崩溃问题
(Windows)修复了尝试重命名导航器的“家庭窗格”的图库视图中的多个图纸时崩溃的问题,这些图纸已被删除并恢复以用于带有剩余图的分析
(Windows)修复了如果将数据表中的多个数据集事先替换为单个数据集,则将Scatter转换为Violin图时会发生崩溃的问题。
修复了在数据表中包含大量值(∽500000)的数据集导致大量子列(Prism 8超过178,Prism 9超过238)时崩溃的问题
(Windows)修复了以下问题:如果任何数据集包含大量值,则使全部子列都变大以使子列数据变大
(Windows)修复了当更改具有大量子列和行和数据表的重复编号时出现意外警报的问题
(Windows)修复了在插入超出支持的至大列数的数据时未出现警告的问题
修复了以下问题:未添加值并且尝试向带有很多子列的数据表中添加大量值时出现意外警报
(Windows)修复了删除数据表中的另一行后,仅多行行标题的第一行可见的问题
(Windows)修复了无法格式化结果表好数据点的问题
(Windows)修复了拉伸时“欢迎”对话框左上角控件未对齐的问题
(Windows)解决了在“替换数据集”对话框的“提示”部分中,在包含数字的数据集标题旁边显示意外字符的问题。
(Windows)解决了在图形上没有图例或没有图例时“反向图例顺序”命令意外可用的问题
(Windows)修复了当图表上没有错误栏时,数据表和“格式化”上下文菜单中的错误栏部分没有变暗的问题
(Windows)修复了以下问题:在通过“结束”键导航到数据集底部时,该数据表的一部分不可见,该键具有大量值
(Windows)解决了在“信息说明”和“信息表”中选择撤销操作后Prism会崩溃的问题
(Mac)修复了Prism在尝试切换到具有256个数据表和26个重复项的模拟XY数据表时将冻结的问题
(Mac)修复了无法创建或打开包含大量数据(256个数据集,256个重复,500行)的Prism文件的问题
(Mac)修复了热图的“格式图”对话框的“间隙”选项卡中折断线的“Also画线”下拉菜单,以提高线条的清晰度
(Mac)修复了工具栏上“突出显示所选单元格”图标中缺少黄色的问题