基于用户画像和数据挖掘的学习行为思考

发布时间:2022-07-11 19:51:15 论文编辑:vicky

本文是一篇计算机论文,本研究通过K-means聚类方法,对Mit6.00课程的学习者进行了分类,构建了基于学习投入特征、教学交互特征、课程完成度特征、学习成绩特征四个维度的学习者画像,使学习行为研究更加多层次和系统化,而不是只是根据学生考试和作业成绩对学习者进行简单粗略的划分。

第一章 绪论

第一节  研究背景

一、在线教育发展

与传统线下教育相比,在线教育能够充分利用互联网、信息技术进行教学活动,互联网和信息技术的发展,很大程度上决定了在线教育普及程度。在线教育改善了传统教育教学效率不高、课程资源固定等特点,使教师教学效率更高,学习者准入门槛低,备选教学资源丰富 [1]。在线教育提供的课程主要以异步或同步学习的形式提供。以“时间距离”和“参与者数量”两个维度进行划分,将在线教育课程分为四类:MOOC(大规模开放在线课程):学习者数量不受限制,学习者能够按照自己的进度异步学习;SMOC(同步大规模在线课程):学习者数量不受限制,学习者需实时同步地参加;SPOC(小型私人在线课程):学习者参与人数受限,学习以异步方式进行;SSOC(同步小型在线课程):学习者参与人数受限,要求参与者实时上课。

中国教育部于本世纪初开展了精品课程分批建设工作,组织建设了一批一流示范课程。2013年,在Coursera、Udacity、edX三大慕课平台蓬勃发展的潮流引领下,我国在线教育的在线教育发展迎来了春天,以清北两所大学为首的中国高校推出了在线教育平台“中国大学MOOC”和“学堂在线”,更多的在线教育平台如雨后春笋般涌出 [2]。除高校以外,以百度、阿里、腾讯为代表的企业也开始进军在线教育领域,不少老牌教育机构如好未来教育、乂学教育、新东方教育等也均在大力发展在线教育。

第二节  研究目的与研究意义

一、研究目的

在中国的高校教育背景下,高质量、个性化的学校在线教育资源相对较少,难以满足不同群体学习者的个性化需求[5],以MOOC为首的在线教育平台能够较好地补充。以Coursera、Udacity、edX为首的三大在线教育平台,面向各阶层、各群体的广大学习者,学习者的知识背景、学历、年龄、所属国家地区等因素参差不齐,故更需要注重教学的多样性,更关注不同学习者的学习情况。为了更好地对学习者进行学习干预,在线教育平台用户的学习行为会被记录,用以矫正学习行为、推荐个性化课程与学习路径,并对学习者画像进行分析[4]。本文以edX数据集中的《计算机导论》类课程为例,将此课程的学习者划分为4类不同的群体,构建出4类群体的学习者画像,并根据不同学习者的特点,从知识领域、知识点的层面,对学习效果不理想的学习者进行不同课程的定制,满足学习者个性化的学习需求。

二、研究意义

2015年国务院发布了《统筹推进世界一流大学和一流学科建设总体方案》,鼓励和支持不同类型的高水平大学和学科差别化发展[6]。建设高水平大学和一流计算机学科,就需要研究国内外高水平高校《计算机导论》类课程的优劣,借以推动我国计算机教育与《计算机导论》类课程的教学改革进程。

《计算机导论》类课程在计算机专业教育中非常重要,它是计算机专业众多课程的“知识图谱”。该类课程在计算机专业教育中处于“引领”位置,对学生的专业理论培养和实践技能训练具有“奠基”作用。因此,《计算机导论》类课程的教学与研究在国内外计算机教育界得到了广泛重视。本文基于ACM和IEEE计算机学会2013年公布的计算机专业课程体系,从知识领域和知识点的角度对一流高校的《计算机导论》类课程进行研究,并根据edX数据集中的《计算机导论》类课程学习者画像对不同类型的学习者群体进行课程选择的指导。本研究有以下三点意义:(1)学习者方面,能够帮助学习者直观地发现学习过程中存在的弊端,清晰地了解自身学习成绩的定位,从而发挥主观能动性,提高学习效率;(2)施教者方面,有助于教师快速、准确地分析学习者的群体定位,进而在教学实践中帮助学习者制定个性化学习方案;(3)国家人才培养方面,可以打牢计算机科学与技术专业的基础,培养在国际领域更有竞争力的“接班人”。

第二章 相关概念及研究基础

第一节  相关概念界定

一、在线学习行为

国内研究者一般从教育学领域阐述在线学习行为的含义,国外研究者更注重利用观察、测量、收集到的在线学习行为数据进行实证研究。本研究认为,在线学习行为是学习者以不同终端为媒介,利用丰富多样的教学资源,为达成某种学习目的产生的网络学习痕迹的总和。因此,在线学习行为分析的最终对象是一系列学习者的于在线教育平台的操作[18]。

二、用户画像

(一)用户画像

用户画像(User Profile)的概念最初是由Alan Cooper在《The prisoner Are Running The Asylum》一书中提出的[19]。商业领域中,用户在各种社交媒体、网站的操作痕迹、社会关系被记录,利用推荐系统向潜在用户推荐合适的产品。用户画像随着互联网的发展又被重新定义,即根据用户在数据库中存储的个人信息构建用户标签体系,“标签”能对用户进行某一维度特征的表示[20],商业领域用户画像的构建流程如图2.1所示。

计算机论文怎么写

第二节  理论基础

一、成人学习相关理论

二十世纪七十年代,成人教育学家诺尔斯提出要将成人学习和未成年人的学习区别对待的观点。诺尔斯认为成人学习和普通教育学最大的不同在于,成人学习从本质上讲是社会性的,学习者之间的交互、学习者与学习工具的交互、学习活动本身等因素之间的交互组成了成人学习的特征[38]。目前,随着成人学习理论的深入,成人学习理论更加频繁地和其他领域交叉,形成更多交叉学科领域[39]。

二、自我导向学习理论

自我导向学习一般来说是指学习者自主能动地建立自我学习目标,统筹安排学习路径,自发寻找学习资源,筛选学习方法并对学习效果进行自我评价的过程。诺尔斯曾指出,自我导向学习是针对成人学习者最自然的学习方式。自我导向学习具有时间安排灵活、不拘泥于固定学习地点、学习安排遵照学习者个人意愿等特点[40]。自我导向学习理论成为研究者对成人学习活动进行分析的重要方式。以诺尔斯、塔夫、霍尔等为首的成人教育研究者,从学习动机、学习形态、自我导向学习模型等视角对自我导向学习进行了研究应用,并做出了一定的研究成果[41]。

三、学习分析相关理论

在互联网+教育的时代,“学习分析”已然成为一个新兴领域,并在在线教育环境中广泛运用。学习管理系统的使用可以方便地访问学生的活动的数据,以便教与学的利益相关者快速、正确地做出决策 [42]。George Siemens提出学习分析可以用来为学习者提供学情预警与学习建议[43]。Slade等人认为在收集分析学习者的相关数据后,学习分析能够为学习者提供自我认知、学习管理的功能[44]。Martin等人以可视化等手段将学习者的学习数据呈现,目的是实现学习者学习环境的优化与个性化[45]。Elias认为学习分析应与其他领域如商务智能、数据挖掘领域相融合,并取相关领域之长处[46]。Macfadyen等人认为必须结合不同的学习理论、行为理论、知识社区等方面的知识,才能对学习者数据进行解读[47]。

第三章 基于CS 2013视角的导论类课程比较研究 ............. 14

第一节  在线教育平台研究对象的选取 .............................. 14

一、美国两校课程 ............................... 14

二、中国两校课程 .............................. 15

第四章 数据分析及学习者画像案例研究 ..................... 25

第一节  基于edX数据集的数据分析 ................................ 25

一、数据集来源 ..................................... 25

二、数据集分析 ......................... 26

第五章 总结与展望 ....................................... 52

第一节  研究总结 ................................ 52

一、研究成果 .......................... 52

二、创新点 .................................... 53

第四章 数据分析及学习者画像案例研究

第一节  基于edX数据集的数据分析

一、数据集来源

2014年,哈佛大学和麻省理工学院联合发布了基于edX平台学习者数据的第一个大规模Mooc开放数据集。edX开放数据集包括2012-2013学年两所高校在edX平台开设的所有课程的课程数据和学习者数据 [53]。本文将数据集中的描述列项分为了四类,分别为课程信息、学习者人口学信息、学习者类型信息、学习行为信息[54],表4.1给出了edX数据集中列名及对应的列项描述。

计算机论文参考

第五章 总结与展望

第一节  研究总结

一、研究成果

本研究为了解决在线教育平台学习者辍学率高、流失性大的现状,以如何对学习积极性不高、学习路径存在问题的学习者进行课程定制为主要研究目标,围绕着用户画像和数据挖掘技术展开了深入的讨论和研究,得到了以下三个研究成果:

1.以CS 2013课程体系为指导,从知识点和知识领域的角度对中美四所一流高校的计算机导论类课程进行比较研究,发现国内2门课程属于“广度优先”模型,主要针对非计算机专业学习者设计,该类课程通常提供更广泛的计算机概念介绍、侧重讲授理论知识而不是集中在程序设计方面;美国2门课程属于以“程序设计”为重点的入门课程,主要面向计算机专业学习者实施。

为满足不同教育起点和背景的受众入门计算机科学的教育需求,计算机教育工作者需要研究和设计因计算机科学技术与应用的变化而变化、与时俱进的多种类型《计算机导论》课程。

2.通过K-means聚类方法,对Mit6.00课程的学习者进行了分类,构建了基于学习投入特征、教学交互特征、课程完成度特征、学习成绩特征四个维度的学习者画像,使学习行为研究更加多层次和系统化,而不是只是根据学生考试和作业成绩对学习者进行简单粗略的划分。四类学习者的学习者画像可视化,更能够帮助教与学的利益相关者厘清身份定位,满足不同的个性化需求,对后续的教学实践起到指导的作用。

利用多元线性逐步回归模型,将学习投入特征、教学交互特征、课程完成度特征三类学习行为特征,按其对学习成绩的影响显著程度大小由大到小地逐个引入回归方程,准确地计量三种特征和学习成绩之间的相关程度,识别出对学习成绩影响最大的学习行为特征,为下文课程定制提供理论基础。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。