ILLMO:互动统计新平台
统计专家的科学家和研究人员依赖于统计分析,从他们收集的数据中得出结论,以便验证其研究产出。通常,他们使用现有的统计程序,例如SPSS和R,提供广泛的数据分析技术和流程。然而,这些程序取决于用户对统计方法和术语的熟悉程度,并提供了对统计模型和技术如何实际工作以及缺乏其结果的假设的知识。
Jean-Bernard Martens博士,荷兰埃因霍温理工大学工业设计系的全部教授开发了Illmo(交互式日志似然建模),这是一个统计建模工具,提供了一个提供直观和互动的互动环境统计互动方法。
什么是统计和统计如何工作
Martens教授在他自己的人力计算机互动(HCI)中的应用领域,他在申请心理学界中汲取了他的经验。他解释了科学界如何理解统计数据的相关性,尽管动机可以是外在的,因为它是建模定量数据,并将其发布。他还观察到这些研究人员似乎有混淆“关于统计实际上(或不做),因为几乎不了解统计工作方式”。这可能导致在解释统计结果,或在更严重的情况下统计焦虑的情况下陷入困惑和不确定性 - 在统计内容或问题接触到统计内容或问题时,逮捕一些个人经验的感觉,或者在收集,处理和解释数据时.
常见问题
许多研究人员不会将自己描述为统计专家,对统计结果及其解释都缺乏信心。马滕斯教授对缺乏理解也可能导致错误使用统计方法进行了反思。尽管大多数研究人员理解拒绝零假设意味着什么,但许多人挣扎于备择假设的概念,以及一旦他们拒绝了零假设他们应该做什么。此外,人们还混淆了效应大小(两个变量之间关系强度的量化测量)和统计能力(统计检验检测实际存在差异的概率)的概念,然而,美国心理协会风格指南要求其作者在公布显著性水平的同时,还要公布效应大小。
许多统计技术,尽管它们看起来不同,实际上可以从一些基本原则推导出来。
研究人员经常诉诸于使用标准参数检验,包括学生t检验和方差分析(ANOVA),在他们不一定合适的情况下,如分析顺序李克特量表数据。此外,许多经验研究人员似乎没有意识到这些方法假定数据分布是连续的高斯分布,即正态分布。此外,为了确保所选择的方法适合收集的数据而对假设的验证常常被忽略。
用户体验视角
这种具有统计实践的现状是与推动Chi社区的技术经验视角的明显鲜明对比,其中“技术应该支持人们享受他们的活动,帮助他们对他们产生的工作充满信心”。除了illmo计划之外,Prof Martens还通过互动和直观的统计数据开发了Chi课程“对实验数据”,以帮助消除周围统计数据的一些神话。他展示了多少统计技术,尽管它们看起来不同,可以源自几个基本原理。
本课程中的参与者还有机会在illmo计划提供的互动统计环境中练习这种新方法,在那里他们发现如何执行常用统计任务,包括假设测试,线性回归和聚类,更直观和交互办法。Illmo提供的广泛的可视化对新手用户来说是特别的帮助,帮助他们掌握各种统计概念。
单一的统计问题的一种方法
许多对实证研究和数据科学感兴趣的非统计学家发现统计术语如显著性和统计权力令人困惑。有鉴于此,马滕斯教授利用最近的多模型比较理论提供了另一种解释,该理论解释了如何在统计模型中平衡拟合优度和自由度的数量。他描述了ILLMO如何使用单一方法解决广泛的统计问题。ILLMO对连续数据采用对数似然准则,对离散数据采用Cressie-Read收敛准则来度量原始数据与模型分布之间的拟合优度。ILLMO在估计模型参数(如平均值和标准差)时将此标准最小化。其中,这意味着ILLMO使用统一的方法来分析连续和离散的数据。
假设检验
Martens教授演示了Illmo如何使用多模型比较来执行假设测试。在这里,输出是两个模型的可能性。对于正在测试的两个条件具有相同的平均值,类似于零假设。另一个有条件之间不同的平均值,类似于替代假设。当可能性高的比率高,即大于20时,用户只能得出结论,在另一个模型中明显优选。
日志似然配置文件是显示日志似然标准或CRessie读取的会聚标准的变化的图表。Illmo使用它来确定已由数据确定的参数的准确性。该参数的置信区间可以在日志似然简档和预定义值的交叉点找到。这可以用于对该参数与假设值不同的统计推断。
回归
ILLMO还可以使用多模型比较来执行线性和多元回归。多模型比较输出是线性回归时自变量不同的回归模型,或多元回归时自变量个数不同的回归模型的似然值。
图形界面
ILLMO的图形界面允许用户轻松修改统计模型,以描述和分析他们的数据集。该界面旨在鼓励用户尝试不同的模型,并在视觉上与默认模型进行比较。默认模型采用传统统计方法中的高斯分布。ILLMO可以进行多模型比较,并为所考虑的每个备选模型赋予可能性。
ILLMO项目广泛的可视化对新手用户特别有帮助,帮助他们掌握各种统计概念。
视觉鉴定范围
ILLMO将其统计分析的所有方面集成在一个接口中。它以文本和图形的形式显示模型规范和数据分析结果。此外,ILLMO提供了大约60种图的选择,以说明统计模型所产生的信息。它们可以描述观察到的直方图和模型分布之间的关系,以及统计推断所需的置信区间等信息。
比较结果
ILLMO便于将其对数似然建模的结果与依赖于特定高斯分布假设的缺省模型产生的结果进行比较,如方差分析、回归分析和t检验。
经验似然
illmo包括实证可能性,执行非参数统计的相对较新的方法。经验似然是一种估计方法,其需要较少的错误分布的假设。当数据不能通过已知的参数分布近似时,它提供了优雅的解决方案。
软件可用性和支持材料
Martens教授创建了illmo,为广泛的用户提供用户友好的互动统计数据。他提供了可以从项目网站下载的Illmo程序的Mac OS和Microsoft Windows版本(http://illmoproject.wordpress.com.),并附上相关资料。这包括关于ILLMO可以完成的范围广泛的统计分析的详细描述和教学视频。马滕斯教授目前正在开发包括机器学习在内的ILLMO平台的扩展版本。这样,远远超出(线性)回归模型的验证性数据分析将变得可行。
个人反应
是什么启发你开发ILLMO平台?