找回密码
 注册入学

QQ登录

只需一步,快速开始

查看: 1035|回复: 0

褚鑫06

[复制链接]
 楼主| 发表于 2013-5-15 09:49:41 | 显示全部楼层 |阅读模式


自适应分层问卷:学习风格的自适应分层问卷[/B]
摘要:[/B]
     
当在自适应教育超媒体系统中提供学习风格自适应时,学生们最关心的是需要回答多少问题。大多数时候,可使用的自适应材料会把一些类别区分成各个学习风格维度。所以,我们只需要考虑学生的一般倾向,而不需要考虑在每个维度中得到的特殊分数。在本文中,我们介绍了适应性分层问卷,它是一种新方法,能用最少的题目分类学生的学习风格。其目的是尽管提供了准确的分数,还是基于Felder-Sliverman学习风格模型,将学生归类到不同类别中。在对330名学生的研究案例中得到的结果是很有前景的。它使得用较少的题目更准确地预测学生的学习风格偏好成为可能。

关键词:[/B]  自适应超媒体  学习风格  用户建模

1[/B]、简介[/B]
为了提供自适应性,自适应超媒体系统需要储存用户信息,建立用户模型。建立用户模型意味着收集用户信息,并将这些信息转化到模型中。许多系统使用问卷调查用户特征,而其他一些系统尝试从用户与系统的交互中推断出用户特征。
在自适应教育超媒体领域,为了自适应的目的,经常用到的其中一个学生特征是他们的学习风格。我们意识到每个人都有不同的学习方式,研究团队和技术都已经得到发展,尝试当满足不同的学习风格偏好时,将个体的变化分类。
Felder和Sliverman创建了一个学习风格模型,已经广泛应用于技术增强型学习。它描述了从偏好的四个维度上区分的几种学习风格(活跃型/沉思型,感悟型/直觉型,视觉型/言语型,序列型/综合型)。关于这些偏好的信息可以从相应的问卷中得到,其中包含了44道问题。我们使用了以往的文章中关于Felder -
Sliverman学习风格模型和学习风格问卷的有关内容。
即使学习风格信息在使教育材料适应每一个学生时非常有用,但是回答学习风格问卷中的44个问题是一件耗时且枯燥的任务。如果系统需要从学生那儿得到更多的信息,而不仅仅是学习风格的信息,这个问题就尤为重要了。
然而,自适应教育超媒体系统用来仅从一些类别中区分成各个学习风格维度,因此,只需要考虑学生的一般倾向,而不需要考虑在每个维度中得到的特殊分数。本文中,我们提出了一个方法,以减少决定每个学生的学习风格倾向所需的题目数量。
特别是,我们开发了一个叫做自适应分层问卷的自适应测试,它是在学习风格问卷的基础上进行的。自适应分层问卷能够通过尽可能少的问题,决定每个学生在每个学习风格维度上的一般倾向。得到的学生模型只代表学生偏好的倾向,不是准确的分数。但是,经验显示,很多时候这个信息已经足够支持自适应教育超媒体系统的自适应性。而且,即使当需要更准确的信息时,自适应问卷的结果能够用来作为学生模型的初始设置,考虑在与系统交互时的用户行为,自适应问卷的结果也可以作为可以动态改善的学生模型的初始设置来使用。
下一章详细介绍研究目标,第三、四章解释如何进行研究,第五章展示结果,第六章介绍一些相关文章,第七章说明结论。

2、研究目标[/B]
目前,大多数基于学习风格提供自适应性的自适应教育超媒体系统,都是使用学习风格问卷获得每个学生的学习风格模型。学习风格问卷得到了学习风格在四个维度上的信息,每个维度有11道问题。用相反类别的答案数减去与这一类别相关的答案数,就得到了这个分数。通过这种方式,从测试中得到的最终结果是四个分数(从-11到11的奇数),每个维度上有一个分数。也就是说每个维度有12种可能不同的结果。
这个信息提供了许多自适应的机会,因为只考虑学习风格模型的一个维度,自适应教育超媒体系统能够实现12种不同版本的教育材料。不好的一面是,适应学习风格需要学生回答与他/她的偏好有关的44道问题,这一点很多时候被认为是一种额外的负担。
但是,大多数时候并不是针对每一种可能的问卷值都有一个不同的课程版本,但是聚集在班里面的学生会包含不同的问卷值。例如,Felder 和Soloman建议在每个维度上将学生分为五类。如果一个学生在某个维度上的得分在1到3之间,则他/她对学习风格有轻微的偏好,但是他/她的学习风格是均衡的。不同的是,如果分数在5到7之间,则这个学生有中度的偏好,并且会在支持这一维度的教学系统中学习的更容易。最后,如果这个学生的分数在9到11之间,那么,当他/她通过不支持这个偏好的系统学习时会有困难。
在自适应课程的过往经历中,我们发现,作者常常喜欢在每个维度上将学生分为三类:低,中,高。在这中国情况下,例如,在给定维度上得分在-11到-5之间的学生将被提供自适应课程的相同版本,得分在-3到3之间的学生将接受课程的第二种版本,得分在5到11之间的学生将接受课程的第三种版本。
在本文中,系统只需要知道这个给定的学生在每个维度上的分类,而不需要准确的值。因此,该系统不需要向学生询问学习风格问卷中的11个问题,只需要足够的问题来区分他/她的分类。问题是,在11道问题中,哪些题目能够提供足够的关于这个学生学习风格的信息呢?
这个问题是与项目反应理论相关的一般问题的一个变体。项目反应理论是将个体的测试表现与其能力水平相关联的一组数学模型,它使研究者能够估计出测验题目和测验受试者的统计特性。通过这种方式,项目反应理论用来估计学生的知识水平,以此决定下一个呈现的题目及何时结束测验。
我们的目标是使自适应教育超媒体系统能够通过尽可能少的问题,对给定学生的学习风格分类。最后,我们试图得到一种能够对不同学生提出不同问题的算法,即考虑到这个学生到目前为止所给出的答案,计算出下一个要提的问题(图1)。必须强调的是,我们不是尝试提出新问题来找到学生的学习风格,而是从学习风格问卷中为每个学生选择最相关的问题。

06"  TITLE="褚鑫 06" />

分类是数据挖掘技术的一个主要目标。一般来说,这些技术是通过观察已经分类的实例学习分类模型。一旦学会了这个模型,就能用它对未知类别的新实例分类。
本文展现了如何使用分类技术了解对每个学生应该问哪些问题,以减少对他/她的学习风格分类所需要回答的题目数量。

3、数据收集[/B]
数据挖掘技术基于对样本的分析,以发现数据中的模式。这个知识可以用来分类新实例,考虑样本中相似模式的分类。
属于三个不同人群的学生样本被用来产生本文呈现的结果。
样本1:来自中学的42名学生。
样本2:来自大专院校的80名学生,他们学习的是视听技术。
样本3:来自马德里大学计算机科学与工程专业的200名学生。
结果,该研究是基于年龄在15到30岁的330名学生对学习风格问卷的回答进行的。在文章的剩余部分,术语“样本”将会涉及所有的学生,考虑上面提到的三个样本的集合。
图2展现了每个样本在学习风格问卷中每个维度的频率。维度1到维度4分别对应着活跃型/沉思型、感悟型/直觉型、视觉型/言语型、序列型/综合型。这些频率不符合正态分布,但幸运的是,这不是分析数据的技术所必需的。不必惊讶,这个数据分布和在之前的实验中用相同的群体得到的分布非常吻合。考虑到性别间的分布,群体中包括101名女性,229名男性。

06"  TITLE="褚鑫 06" />

4[/B]、研究方法[/B]
对数据进行处理,将学生分为三类:高(5到11分),中(-3到3分),低(-11到-5分)。这个数据集是使用数据挖掘算法的Weka工作平台分析的。
分类算法学习了基于数据集的实例的模型,每个实例被描述成特性的集合。这样,一个实例就由一个给定学生的数据形成了,包括他/她对每一道学习风格问卷中的问题的回答,以及分配给每个学习风格维度的类别。
考虑到这篇文章的目标,决策树是很方便的工具。决策树中的结点包含测试一个要被分类的实例的特性。依靠这个特性,生成相应的派生分支。这个过程递归的应用直到叶子。通常,每个叶子有一个标签,上面有到达这个叶子的实例所分配到的类别。因此,沿着每一条从根到他们可能用到的叶子的路径,实例中的不同特性被分类。
下一部分提供了一些关于建立分类树方法的技术细节,4.2章解释了这个做法如何支持我们的目标。

4.1.
C4.5算法
为了建立决策树,本文使用C4.5算法,目的是从学习风格问卷中识别出最相关的问题。C4.5使用信息熵的概念从一系列训练数据中建立决策树。这个概念是与随机变量相关的不确定性的测量。在本文中,它是对平均信息量的测量。当随机变量的值未知时,受试者会有遗漏。给定一个实例的集合S,每个实例有它所属的类别,Entropy(S)被认为是对在S中类别分布随机程度的测量。
信息增量是一种对特性a的测量。特性a能够将S分成几个子集Sa1,Sa2,Sa3,…,San。a的信息增量就是Entropy(S) -Entropy(Sa1)-Entropy(Sa2)-…-Entropy(San)。换句话说,a的信息增量测量出,对于一个给定的实例,通过了解特性a的值,平均获得了多少关于这个实例类别的信息。
通过这种方式,C4.5检测出为分离数据选择了这个特性而得到的标准化信息增量。信息增量最高的特性就是用来做决定的那个特性。之后,这个算法在更小的子结点上循环。通常,当表中所有的样本都属于相同类别时,循环停止。一旦出现这样的情况,它会为决策树简单地创建一个叶子结点,告诉实例的分类已经到达此点。如果所有的特征都没给出任何信息增量,C4.5使用类别的期望值创建一个更高于树的决策结点。
当构建分类模型时,需要重点考虑的是避免过度拟合,也就是说,建立只用训练数据提供好的结果而建立的模型。为了这个目的使用十折交叉验证。这个方法估计了用与训练组不同的数据建立的模型的预测行为。运用这个方法得到的结果呈现在第五章。

4.2. 决策树的属性
用之前章节提到的分类算法建立的决策树有两种与本文目标相适合的属性:
l
选择下一个将被用来分离数据的特性的标准是将信息增量最大化。换句话说,对于给定的样本子集,他们选择最相关的特性。
l
决策树提供了分类模型的外显表示,使动态测试的建设基于树使用的特性。

5[/B]、研究结果[/B]

06"  TITLE="褚鑫 06" />

表1展示了考虑到达每个叶子的训练实例的数量,对于每个维度在分类树中从根到叶子的平均路径。也就是说,每个长度代表在自适应教育超媒体系统中,在能够为学生在某一维度上分类之前需要询问的期望问题数量。
对每个学生提出的问题是根据为每个维度产生的分类树迅速选择出来的。例如图3展示的由C4.5算法从样本中产生的在感悟型/直觉型维度上的分类树。

06"  TITLE="褚鑫 06" />


06"  TITLE="褚鑫 06" />


06"  TITLE="褚鑫 06" />

[/url]
[url=http://photo.blog.sina.com.cn/showpic.html#blogid=c095cca70101agbb&url=http://s7.sinaimg.cn/orignal/c095cca7gd859df074446]


06"  TITLE="褚鑫 06" />

    图3到图6分别展示了在维度1(活跃型/沉思型)、维度2(感悟型/直觉型)、维度3(视觉型/言语型)、维度4(序列型/综合型)上的决策树。这些树是自顶向下解释的。这些问题是通过循环(Q xx)来表示的,并且根据学生对a或b的回答总是有两种不同的路径,其中xx是学习风格问卷中题目的序号。当一个特定的回答将学生分类时,就产生了叶子。这些叶子可能是高等(H xx,六边形)、中等(N xx,五边形)、低等(L xx,四边形),xx是在群体中分类的学生数量。
即使样本中所有的实例都被很好的分类,当对新实例分类时,也会认为分类者出错了。为了估计预测的分类误差,使用十折交叉验证。表2展示了在每个维度上估计的预测误差。

06"  TITLE="褚鑫 06" />

需要注意的是,发生分类错误是因为学生的值在类的边界上。例如,有时在给定维度上值为-5的学生被错误地分配到中等类别,而不是低等类别。这类错误不严重,因为值为-5的学生可能得到教育材料的中等版本的帮助。
在数据分析中也能观察到,用更少的实例训练分类产生了更大的误差和从根到叶子更长的路径。即使有意义的更大的样本可能产生更短的、具有同一信任水平的树,但是开发出来的测验似乎没有表明这点。
当单独分析三个原始样本时,描述结果是很有趣的。即使期望误差增长了,学习算法大多为树的更高部分选择同样的特性(问题)。这说明了两件事情:
(1)问题的相关性不会因为学生的年龄明显变化。
(2)这些树似乎聚集在一个共同的树上,从原始样本中独立出来,或者至少聚集成一个共同的问题子集。

6[/B]
相关文献[/B]
即使使用问卷通常能提供准确的信息,但是非常耗时。许多文章已经研究过使用贝叶斯网络、行为模式、用户—鼠标交互、前馈神经网络,从教育网站中用户行为的信息开始检测学习风格(完成任务、花费时间、得到分数)。但是,并不是在学习风格模型中描述的所有特征行为都能在特定的学习系统中从行为中找到并识别出来。
之前的文章试图根据频率分析,识别出在学习风格问卷的每个维度上最代表性的五个问题。然而,他们研究的是这些问题和由这些问题建立的语义组之间的关系,而不是试图减少学习风格问卷中的问题数量。比较它们的等级和我们的决策树,我们发现,在Graf这篇文章中的相关问题在树的四个最高水平。

7[/B]、讨论[/B]
本文中介绍了基于学习风格问卷项目的自适应测试“自适应分层问卷”。通过提出尽可能少的问题决定在每个学习风格维度上每个学生的一般偏好。得到的学习模型只代表学习偏好的倾向,而不是准确的分数。
案例研究结果显示,学习风格问卷中的一些问题比其他问题更相关,在某种意义上讲,它们提供了在相应维度上关于学生一般倾向的更多信息。尤其是,用330名学生的样本,我们能够建立分类树,树的建立需要平均4到5个问题为每个学生分类一个学习风格维度。结果是很有前途的,因为得到的预测准确性很高(根据维度在95.71%到98.64%之间)。
即使不同的样本能够产生不同的分类树,考虑到每个树只和11个问题有关,样本容量足够用来考虑分类树不会和其他实例有很大不同。事实上,三个样本显示出它们在分布上非常小的差异,为每个实例建立的分类树倾向于使用相同区分度的问题。
即使这样,试图使用可能最好的问题序列分类学生的学习风格的作者,可以从目标人群中,根据样本建立起分类树。但是,如果样本不足够大,这些特殊的树会比一般的树出现更大的误差。
关于研究样本可能的偏见是男性与女性的比例(超过2:1)。然而,案例研究结果显示,男女性别在学习风格问卷结果中不存在显著性差异。况且,分类树没有使用性别作为辨别的特性。换句话说,知道学生的性别并没有提供关于他/她的学习风格的信息。
经验显示,很多时候,这三个类别在适应性教育超媒体系统中足够支持自适应性。但是,为每个维度创建更多的类也是可能的,例如Felder和Silverman提出的五个类别。在这种情况下,需要提问更多的问题以改善分类。除此之外,还需要额外的实例以使更多类别达到更好的准确水平。
另外,如果需要更准确的信息,自适应问卷的结果能够用来作为学生模型的初始设置,考虑在与系统交互时的用户行为,自适应问卷的结果也可以作为可以动态改善的学生模型的初始设置来使用。
我们计划从不同组的学生中收集和分析数据来扩展我们的研究。另外,最后我们打算将从与选择信息的类型、已经完成的行动、各自的时间消耗、鼠标动作等相关的学习风格问卷中提取的信息组合起来。
[/B]
致谢[/B]
本项目是由西班牙科学与教育部门资助。
[/B]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册入学

本版积分规则

联系我们|Archiver|小黑屋|手机版|滚动|柠檬大学 ( 京ICP备13050917号-2 )

GMT+8, 2025-8-22 15:03 , Processed in 0.039362 second(s), 15 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表