刚开始接触项目反应理论的时候,可能很多人会对各种模型的来源不清楚,云里雾里,很多书籍里面对这部分也并没有写的很详细。有的甚至直接给出一个模型告诉你这个模型就是长这样,和原来的有什么不同。这在第一步就让很多人退却了,如果了解了某些数学模型是怎么来的,可能就豁然开朗了。
作者最近在学习时候,想到怎么由经典测验理论(CTT)变成IRT比较感兴趣,因为一直没有得到解惑。而翻阅国内的一些资料,发现还真有学者对这个问题有过研究,北京语言大学的张凯教授曾经专门写过一篇文章《Rasch模型考辨》,里面对于rasch模型的推导以及相关争议做了梳理,本文并不对里面的争议做太多介绍,只是根据里面的信息将rasch模型现有的样子如何推导的过程厘清一下,如有偏颇可留言探讨。
基于数学家与统计学家的视角都是考虑将现实中的情景将其抽象化为数学公式模型来解决一些问题。首先考虑的是怎么同时定义作答者(被试)能力和试题难度,也就是通过公式将难度和能力建立起联系。
Rasch假设一种情况:两个作答者能力之间比值为1:2,同时两个试题难度之间的比值也是1:2。
ξ1=2ξ2且δ1=2δ2
则可得ξ1/δ1=ξ2/δ2
ξ/δ将能力与题目关系通过比值的关系确定下来,解释为能力为ξ的作答者(被试)在难度为δ的题目上的概率。无论ξ和δ取何值,这个比率都是固定的。这里只是考虑了两者之间的关系,但是要通过一个函数式来表示可能需要思考其他问题。一般的函数是y=f(x),这里的y是作答者在题目上的作答概率,也就是现在项目反应模型看到的P,
(1)P值根据现实情况,要在0~1之间。
(2)f(x)里面肯定是包含ξ/δ,令 ξ/δ=ζ,则ζ的值在0至无穷大之间,使得P在0~1之间。需要注意的是,这时候的ξ和δ并不是现在的θ和b,能力和难度都是还很朴素的理念,应该还未有负数的概念。所以ξ/δ是0至无穷大之间的范围。
到这里的话,那就回到了初等函数的部分,是否能够找到一种函数表达式,Rasch找到一种形式,就是y=x/(1+x)的这种函数形式。
这里我回顾一下初等函数知识,必须说明的是y=x/(1+x),如果未给定义域做一个界限,则定义域为不等于-1的任何实数,值域为不等于1的任何实数。图像如下图所示:
但是由于上面所述条件的限制,x实际上是ζ,范围在0至无穷大之间,只用到了红色方框框住的部分,保证了值域范围在0到1之间(当x=0,y=0;但是取不到y=1的值)。
可得函数表达式为:
P=ζ/(1+ζ)=(ξ/δ)/(1+ξ/δ)=ξ/(δ+ξ)
这就是最初的rasch模型的雏形,大家可以发现能力和难度不是现在rasch模型里面的θ和b的符号,说明中间还有一个过程。这就是后面wright的推导公式了。
这里的过程,主要是对δ和ξ的值做更进一步的推导。我在看这部分内容的时候,给我的感觉是初等函数的知识还是非常重要的,如果以前没学好数学抓紧补补)。个人感觉wright是将能力和难度值从原来的0到正无穷大的范围推广到负无穷大到正无穷大,也就是覆盖了正态分布曲线中的x轴的所有值。那这里如何将0到无穷到扩展到负无穷大到正无穷大,涉及到的初等函数是指数函数。如下图所示,当y=a^x,a>1时,定义域从负无穷到正无穷,值域为0到正无穷大,而指数函数常用的底为e,则可使:
θ=exp(ξ),b=exp(δ)
将上述等式代入到P=ξ/(δ+ξ),可得:
P=exp( θ-b)/(1+exp( θ-b))
这就是目前看到的rasch模型的样子。
这部分内容是个人在看该文推导过程结合初等函数做的理解,如有错误地方,可留言交流学习。
个人在学习这部分的体会是,很多根源性的内容都是最基础的,有必要将初等数学的知识再捡起来。统计模型根本上就是函数公式,函数无论再复杂都是从初等基本函数开始的。因为时间的久远或者当时基础掌握不牢,导致很多问题也就觉得复杂了。
文章来源:
本文转自知乎专栏作者鉴人,已得到作者授权,微信平台首发,如有兴趣,欢迎关注