基于机器学习的流动儿童问题行为的预测探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:vicky 点击次数:
论文字数:25545 论文编号:sb2021101610550638817 日期:2021-11-10 来源:硕博论文网

本文是一篇教育论文,本文利用机器学习建立流动儿童问题行为的预测模型是可行的且预测能力较强的,主要体现在通过三种不同的算法模型可以得出较为一致且较高的预测性能。 

1  文献综述

1.1  问题行为的研究综述
1.1.1  概念界定
(1)流动儿童
根据教育部《2019 年全国教育事业发展统计公报》,流动儿童(又称进城务工人员随迁子女)是指户籍登记在外省(区、市)、本省外县(区)的乡村,随务工父母到输入地的城区、镇区(同住)并接受义务教育的适龄儿童少年。
(2)问题行为
问题行为(Problem Behaviors)指个体所表现出的会妨碍其社会适应的异常行为(林崇德,杨治良,黄希庭,2003),还有学者吕勤,陈会昌和王莉(2003)认为儿童问题行为是指偏离、不符合常态标准的行为,是阻碍儿童身心正常和健康发展的行为。由此可知,问题行为都是对儿童身心发展不利的行为。问题行为又可分为内化问题行为与外化问题行为,内化问题行为主要涉及情绪方面的困扰障碍、或者失调,如抑郁、焦虑、孤僻、退缩等情绪问题,外化问题则是指行为的失调或障碍,主要包括各种形式的品行障碍、过失、攻击以及违法违纪行为(Achenbach, Mcconaughy, & Howell, 1987)。本研究将主要探讨流动儿童的外化问题行为。
1.1.2 理论基础
(1)相对剥夺理论(Relative Deprivation Theory)
相对剥夺理论认为弱势群体的自我感觉与参考群体有十分重要的关系,且这种感觉通常是源于自己与他人的比较(Schulze & Krätschmer-Hahn, 2014),如流动儿童在流动所在地感知到的歧视知觉与当地居民就有极大的关联。该理论源于 Stouffer 等人的“美国士兵”研究,后来 Merton 等人在其基础上将剥夺的相对性与参考群体的概念联系起来(Merton  &  Kitt, 1950),正式提出了相对剥夺理论,即倘若个体与其他人进行比较时,发现自己处于不利地位,个体就会产生被剥夺感。而这种剥夺又会带来一系列消极情绪(如不满和抑郁)以及问题行为(如暴力行为和物质滥用)。后续也有研究发现:当人们发现自己与他人之间的差异时,就会产生积极或消极的情感反应和行为(Buunk, Collins, & Taylor, 1999; Smith, 2000),如有研究发现长期的歧视知觉将会导致个体产生自卑心理(Lippert-Rasmussen, 2013)。
(2)—般压力理论(General Strain Theory)
Agnew(1992)的一般压力理论认为个体与家庭、学校和邻居的负面/不利关系所产生的压力,在达到一定阈值水平后,将会对个体的犯罪行为产生累积影响,即十分强调负面经历对个体所产生的压力,为应对或缓解这种压力进而导致个体易产生问题行为。并且,随着这种累积的影响,问题行为所产生的消极后果将变得更加严重。Agnew(2006)后来的研究也表明较低社会阶层的个体与高社会阶层相比,可能会经历更多的压力,从而导致更多的犯罪活动.
........................

1.2  机器学习在心理健康领域的研究综述
1.2.1 概念界定
机器学习(Machine Learning)是通过发现大量已有数据中的潜在规律,从而对新的、未知的数据做出自动的分析、判断或预测的过程(Cabitza & Banfi, 2018; Senders et al., 2018)。机器学习之父汤姆•米切尔对机器学习的形式化定义是:假设使用 P(Performance)来评估某个计算机程序在某个任务 T(Task)上的性能,若该程序通过利用 E(Experience)在 T 任务上获得了 P 性能上的改善,则认为该程序对 E 进行了学习(Mitchell, 1997)。
1.2.2 机器学习的算法
机器学习算法大致可分为三类:(1)监督学习;(2)半监督学习;(3)无监督学习。监督学习是通过训练而获得有特征(预测变量)和标签(结果变量)的数据间的关系,从而判断新的数据。使用具有标签的数据训练模型,该模型可以预测新数据的标签,例如,通过使用边缘性人格障碍患者和成功治愈边缘性人格障碍患者的 fMRI 脑成像数据让机器学习模型做出自动的识别,以预测正患有边缘性人格障碍个体的治疗效果(Schmitgen,  Niedtfeld,  & Schmitt,  2019)。其次,在监督学习又分为分类算法和回归算法。分类的算法一般包括决策树(Decision Tree)、朴素贝叶斯(Naïve Bayes)、支持向量机(Support Vector Machine)、K近邻(K-Nearest Neighbor)、逻辑回归(Logistic Regressive)、随机森林(Random Forest)等。回归的算法一般包括岭回归和 Lasso 回归等。
半监督学习是介于监督学习和半监督学习之间的,其是通过在有或无标签的数据中执行有监督或无监督的学习任务,以发现的数据间的关系,从而判断新的数据。半监督学习的常用算法有半监督支持向量机等。
无监督学习是通过训练而获得无特征和标签的数据间的关系,从而判断新的数据,即通过对无标签数据进行聚类,从而发现数据中新的潜在集群。例如在社交论坛中广泛收集有关心理疾病的话题并进行分析,以发现可能存在的有用信息,如话题中最常见的带有预测性内容(Thorstad & Wolff, 2019)。无监督学习的常用算法是 K 均值(K-means Clustering Algorithm)和神经网络(Neural Networks)等。
...............................

2  问题提出

2.1  现有研究的局限
从研究内容看,已有多数研究主要关注一个或多个变量对流动儿童问题行为的预测作用,如有研究者探讨情绪调节对青少年问题行为的影响,发现情绪调节的异常或困难是造成儿童问题行为的主要原因(Heleniak, Jenness, Vander, McCauley, & McLaughlin, 2016);还有研究探讨了学校适应对流动儿童问题行为的影响,其发现流动儿童问题行为与学校适应存在显著的负相关,并且学校适应的各个维度都在一定程度上对流动儿童问题行为有负向的预测作用(王中会,石雪玉,2015)。而面对多个预测变量时,常常关注流动儿童问题行为影响因素的作用机制和边界调节的问题,研究方法常包括中介或调节效应、结构方程模型及多元回归,如有研究建立了一个有调节的中介模型以考察同伴侵害在儿童问题行为和父亲的拒绝教养方式之间的中介作用,同时也考察了该过程是否会有冲动的调节作用(黄林辉等,2019)。
然而,预测流动儿童问题行为的因素众多,如何从众多因素中选出更具有关键性的影响因素,以便基于关键影响因素进行更有针对性、实效性的心理辅导和干预,这是众多研究者不断探索的核心问题之一。
机器学习方法为解决该问题提供了有益的路径。以往的研究方法和技术(如多元回归分析等),能探讨的变量有限,无法研究太多的变量,当超过十个以上的变量时就难以处理,模型也会变得十分复杂(Jun et al., 2019;王衍鲁,张利会,张淑洁,石洁茹,王鹏,2017)。且传统的心理统计方法建立在数据正态分布假设基础之上,假设变量之间是线性关系,这可能会丢失数据的真实信息。本研究中的问题行为在青少年群体中则属于偏态分布,因此基于正态分布的假设检验方法则是不合适的。同时,样本群体的显著性检验通常是在两种可能的结果(零假设和备择假设)之间做决定,如此的话只是在回答一个孤立的统计问题(Randal, William, Zairah, Varik, & Moore, 2018),而且基于 P 值的显著性检验正面临重复危机,即研究结果的不可复制性(Dwyer, Falkai, & Koutsouleris, 2018),并且通过显著的群体差异并不能建立预测模型。由于较低的效果量,具有统计意义的变量并不一定对预测有作用。当与其他变量结合使用时,一些研究证明不显著的变量也可能会变得很重要(Dinga et al., 2018)。
..........................

2.2  本研究的改进
(1)本研究使用机器学习技术可以实现对问题行为的准确预测,机器学习技术旨在进行预测和建立预测模型,因此,已有大量研究证明机器学习的预测的准确率比传统统计方法更高。同时,机器学习的交叉验证技术能够减少“重复危机”的威胁;并且使预测模型具有更强的泛化能力,从而使模型的更加稳健和可靠。
(2)本研究利用机器学习技术可处理更多的预测变量,即使是多维相关数据也可处理,如对问题行为产生影响的变量之间有的可能是存在多重共线性的;并且机器学习对数据集的假设较少,如正态性和线性假设,即使是非线性数据也能够很好地进行处理。
理论意义:对研究和了解流动儿童问题行为的产生机制将会有极大的帮助,充实有关儿童问题行为的理论研究,扩展有关儿童问题行为的理论基础,从而了解到问题行为可能是一个复杂的多因素共同作用的结果。同时,还能够为后续实践工作中,流动儿童问题行为的预防和干预提供科学的理论指导。
实践意义:就社会而言,建立流动儿童的问题行为预测模型,能够及时发现流动儿童问题行为的存在,从而采用有关措施来进行提前干预,以减少未来可能产生的社会冲突和违法犯罪行为,对和谐社会的构建也具有重大意义。就家庭和学校而言,能够起到及时的预防和干预作用,从而在最大程度上避免流动儿童问题行为的发生和发展,对于创造良好的生活和学习氛围以及和谐的人际关系具有重要实践意义。就流动儿童个体而言,及早的识别和干预可能存在的问题行为,对维护流动儿童自身的身心健康发展也具有重要意义。 

表 2  问题行为及预测变量的描述统计表
表 2  问题行为及预测变量的描述统计表

...................................

3  研究方法 ................................................... 12
3.1  研究对象 ....................................................... 12
3.2  研究工具 ........................................... 12
4  结果 .................................................. 17
4.1  共同方法偏差检验 .................................................. 17
4.2  各变量的总体状况分析 ............................................ 17
5  讨论 ......................................... 26
5.1 各变量的总体状况分析 ............................................. 26
5.2 机器学习的预测分析 ........................................ 28
5.3 研究的局限与不足 ...................................... 30 

6  教育建议

6.1 家庭层面
在家庭层面,由于不可抗因素导致的流动的经历或许不可避免,但良好的亲子关系和家庭氛围却是能够主动创造的,因此,学校和教师可通过家校合作等形式,及时发现流动儿童的不适应性行为,可在最大程度上减少流动儿童的问题行为。
(1)可通过开展一系列知识科普和简单的培训工作,让家长充分了解流动儿童身心发展规律,来到流入地可能产生哪些心理不适的情况以及家长应如何应对。
(2)告知家长应同学校的老师互相保持密切的联系,从而获得更多儿童在家校的学习和生活情况,以期最早的发现问题和解决问题。
(3)学校可通过定期开展家长会、家长开放日和家访等活动,使家长更加了解流动儿童的校园生活,进一步拉近与流动儿童的距离,增进亲子关系,缓解流动儿童的校园适应不良。

图 1 问题行为在年级上的特点
图 1 问题行为在年级上的特点

................................

7 结论


(1)流动儿童问题行为的影响因素是多方面和多因素的,其中重要因素包括生活压力事件中的人际关系、家庭压力和学习压力维度、消极情感、师生关系中的亲密性和冲突性维度、主观家庭支持、孤独感中的纯孤独感和同伴地位维度、家庭社会经济地位、积极情感。
(2)利用机器学习建立流动儿童问题行为的预测模型是可行的且预测能力较强的,主要体现在通过三种不同的算法模型可以得出较为一致且较高的预测性能。
参考文献(略)


上一篇:农村义务教育学校信息化建设的探讨——以陕西省Y县和山东省D区为例
下一篇:义务教育阶段特岗教师归属感调查探讨——以合浦县为例