我国人工智能教育研究综述

作者
作者

摘 要:在社会信息化的推动下,人工智能技术在教育领域应用的热度也在不断加深。从文献来源、关键词聚类分析两个角度,通过 Citespace、SATI、UCINET 三个可视化分析软件对中国知网中文数据库中自 1984 年至今约 25 年有关「人工智能教育」的期刊文献进行分析。研究发现我国对于人工智能教育研究的范围逐渐扩大,但在教育领域的应用研究尚且不足。

关键词:人工智能;人工智能教育

中图分类号:G4 文献标识码:A doi:10.19311/j.cnki.1672-3198.2020.11.093

人工智能(Artificial Intelegence,AI)最早于 1956 年在达特茅斯会议中被提出,至今已有 60 余年历史。从 2016 年 google 公司的 alphago 在与世界顶级围棋手李石世的人机比赛中取得胜利,到 2018 年 OpenAI five 在 DOTA 2 游戏中战胜人类 5 团,人工智能技术在当下信息化和全球化的时代正在不断强化,逐步脱离弱人工智能的标签、超越技术的局限,渐进深入到越来越广泛的领域。我国当代对人工智能的发展有着高度重视:2017 年,「两会」首次将 AI 写入政府工作报告,这是人工智能上升为国家战略的重要标志。

国家的兴盛与否取决于教育,信息化的社会必然对教育信息化有迫切要求。由于人工智能对教育资源分配,实现个性化学习、精准学习和终身学习方面起着重要支撑,因此近年来人工智能教育的相关研究也在不断加深。本文通过结合 Citespase、SATI 和 UCINET 三个文献可视化分析软件近 25 年来关于「人工智能教育」的中文文献进行分析,以期用更直观的方式展示国内人工智能教育研究的热点、发展历史和研究现状。

1 数据来源与研究方法

1.1 数据选择

通过对中国知网(CNKI)的中文期刊文献搜索发现:国内与「人工智能教育」直接相关的文献较少,文以「人工智能教育」为关键词进行篇名搜索,在中国知网的期刊中除去不相关文献共筛选出有效期刊文献 780 篇。

1.2 研究方法

本文利用 Citespace、SATI 和 UCINET 三款软件对文献进行可视化分析,通过生成聚类图谱、关键词频次表、中介中心性矩阵、共现矩阵等方式,对作者、关键词、来源等进行可视化分析,直观展示该研究热点和发展趋势。

对于 Citespace 软件的使用,由于只能掌握近 25 年左右的相关文献,所以将时间按照一年为一段进行切割;由于分析期刊数量并未达到千篇以上,所以直接应用 term、type、links、selection criteria、visualization 选项的默认值,对于 TOP N 的选择也使用了默认值 50,即只聚类分析每个时区排名前 50 位的节点。受文献数量限制本文也没有对产生的聚类图谱进行 pruning 网络裁剪操作。Citespace 聚类图谱中的 Q 值(模块值)和 S 值(平均轮廓值)是两个对效果评判的重要指标。一般来说,Q 值处于 0~1 的区间内,当 Q>0.3 时意味着所划分的社团结构是显着的;当 S 值高于 0.5 时被认为聚类是合理的,当 S 值为 0.7 时,聚类是高效率且令人信服的。

2 文献来源统计分析

2.1 年发布量

将主题为「人工智能教育」的期刊文献进行转码后导入 SATI 软件,勾选「年份」选项后进行字段抽取和频次统计,生成相关文献在 1984 年到 2020 年发布量统计图,转换为折线图后如图 1 所示。

从图 1 中的年发布量变化中可以看出:「人工智能教育」的相关研究总体呈上升态势。其中在 2008 年前涉及量较少,直到 2015 年左右相关主题文献年发布量呈现出急剧增长的势头,尤其以 2017 年到 2018 年的增长幅度最大。截至到 2020 年 2 月相关文献继续保持增长趋势。

20 世纪 30 年代「人工智能」之父图灵提出自动机理论,促进了人工智能的研究;在这个背景下,西方人工智能在 20 世纪 50、60 年代得到了高度重视和发展,而当时的中国受苏联思想的影响较深,20 世纪 70 年代左右中苏关系恶化。因此,在 20 世纪 80 年代前苏联对人工智能的态度使得当时的中国对人工智能几乎没有研究。

20 世纪 80 年代初,钱学森等主张开展人工智能领域的研究,但是受批判主义的影响,人工智能早期在中国的发展非常艰难;因此 1984 年前关于人工智能领域的文献发布量少之又少;1981 年中国人工智能学会正式成立,1984 年邓小平指示「计算机普及要从娃娃抓起」,自此国内对于人工智能的境遇开始好转,相关文献发布量也略有提升。

21 世纪后很多人工智能课题获得 863 计划、973 计划、国家自然科学基金重点等项目的大力支持,人工智能在教育领域应用的相关研究和文献也呈上升态势;2015 年至今,「人工智能教育」相关的文献研究发布量表现出突破性剧增是因为 2014 年习近平总书记在中科院院士大会上的重要讲话和 2015 年李克强总理在十二届全国人大会议中都时对人工智能给予了高度评价。近年来国家不断出台对人工智能发展的引导和支持政策,这对开展人工智能研究起了重要推动作用;2017 年,在国务院发布的《新一代人工智能发展规划》中确立了我国人工智能「三步走」的战略目标;2018 年潘云鹤院长在上海召开的世界人工智能大会上指出人工智能将进入 2.0 时代。在人工智能突飞勐进的态势下,深入对人工智能教育的研究有利于我们落实科技强国、人才强国发展战略与教育现代化 2035 的指导思想。

2.2 期刊分布

与年发布量分析方式同理,勾选「来源」选项后进行字段抽取和频次统计:1984 年到 2020 年「人工智能教育」主题相关文献所属期刊前五位分布如图 2 所示。

通过 SATI 进行频次统计发现大部分期刊来源较为分散,具有一定程度集中性且发布数排名前五位的分别是:《中小学信息技术教育》《现代教育技术》《中国信息技术教育》《远程教育杂志》和《中小学电教》。

其中《远程教育杂志》是 CSSCI 来源期刊,关注于国内外现代远程教育、教育技术及相关领域前沿和发展;《现代教育技术》是国家级学术刊物、CSSCI 来源期刊和中国教育技术学会会刊,面向教育信息化等诸多领域;《中小学电教》是国内最具有影响力的电教类核心期刊之一,关注于现代化教育教学现象和教学管理;《中小学信息技术教育》和《中国信息技术教育》关注于发展教育信息化。

通过对文献发布量排名前五位的学术杂志进行分析得出:「人工智能教育」的研究有着很高的专业性和技术性;它很大程度属于教育技术学研究领域,其发展需要教育技术学相关技术人员的支持和推动;同时它对于实现教育信息化、优化远程教育、提高信息素养和实现深度学习领域起着重要作用。

3 研究热点分析

研究热点的分析是通过运用 Citespace、SATI、和 UCINET 三个可视化分析软件,对「关键词」分别进行频次统计、聚类分析、中心度分析分析得到的。由于文献来源量不能以千计数,所以没有涉及突现词分析,即本文无法精准预测「人工智能教育」的未来发展趋向。

3.1 关键词频次统计

将 780 篇与「人工智能教育」相关的期刊文献转码导入到 SATI 软件中,设置好相应参数后选择「关键词」——字段抽取——频次统计。关键词出现频次分别有 182、20、12、11、9、8、6、5、4、3、2、1,关键词出现频次越多代表研究相关性和热度越高。除去频次为 1、2、3 的关键词后,所剩相关性较强、热度较高的关键词如表 1 所示。

从表 1 热度较高的关键词分析可以得出:与「人工智能教育」相关的研究主要体现于人工智能技术在教育教学领域的应用层面,这体现了教育信息化的背景;这种应用需要借助大数据智能教学系统等开设人工智能课程、教学过程中使用教育机器人;人工智能教育已经应用于职业教育和中小学教育阶段,而且涉及远程教育和网络教育的研究和优化;人工智能技术在教学中的应用是一种智能教育,它改变了教学模式转变了传统的人才培养理念,有利于实现深度学习和个性化学习,提高了教师和学生的信息素养;教育教学领域要实现人工智能技术的应用需要教育技术学专业人员的投入与支持,这一点在与上文中文献来源和作者分布的分析中也有所体现。

3.2 关键词聚类分析

将 1984 年到 2020 年的相关文献转码后导入 Citespace 软件,time slicing 设为 1,node types 选择 keyword,生成 780 篇文献关键词的聚类图。关键词的中介中心性越小代表研究相关度越低,虽然有些关键词地出现频次较高,但是与研究主题的相关性较小或者没有相关性。所以需要将关键词的中介中心性列表按照从大到小的顺序排列,隐藏中介中心性较低的关键词。由于所剩有效关键词的中介中心性差距较大,且为了美观和体现聚类图的有效性,调整 term labling 标签中 threshold 项,使聚类图谱中只显示中介中心性排名前十位的关键词。调整后的关键词聚类图谱如图 3 所示。

从图 3 可以看出与「人工智能教育」主题相关的文献研究重心是人工智能技术在教育教学中的应用,这种教育方式引申出智慧教育和智能教育。人工智能技术在教育领域中的应用需要借助于专家系统等平台的支持,且主要作用于职业教育层面(在上文中有所体现)。

关键词聚类图谱中,N=494,E=1205,density=0.0099,即在隐藏中介中心性为 0.00 的关键词后,所剩余的关键词组成的聚类图谱中共有 494 个节点,它们之间有 1205 个相关关系。在聚类图谱中,S 值和 Q 值越接近于 1 代表聚类之间的相关性越大,本文中关键词聚类图谱的 Q 值等于 0.7881,S 值等于 0.8225,说明本文的关键词聚类图谱结构明显,效率和信服度极高。但是由于受期刊文献数量限制,故而没有采用 pruning 剪切,所以 pruning 值等于 0。

3.3 研究热点分析

本文利用 SATI 和 UCINET 软件对相关文献进行了中心度分析,旨在说明 25 年来「人工智能教育」的研究热点。本文通过将文献转码导入 SATI 软件,在完成相应参数设置后抽取字段、统计频次并生成关键词共现矩阵并转码导入 UCINET 软件,设置相应参数后进行可视化导入生成关系图并调整相应参数进行中心度分析,如图 4 所示。

图 4 表示,以人工智能为研究核心延伸出了:深度学习、机器学习、智能教育、学习分析、大数据、智能教学系统、学习方式、人机协作、个性化学习、教育大数据、教育人工智能、智慧教育等相对成熟的热点探究;对于中外层的:机器智能、跨媒体智能、人才培养、终身学习、教育理念、个性化教育、通识教育、群体智能、教育创新等则属于新兴研究热点;对于边缘地区较少关系连线的节点,如:教育本质、教育缺陷、新工科、课程教学等则是出于研究起步阶段的关键词或者是目前而言较冷门的研究方向。

UCINET 生成的研究热点分析关系图是 Citespace 和 SATI 生成的关键词聚类分析和关键词频次表的综合和提升,不仅对关键词热度进行可视化的直观展现,而且对相关领域研究有一定的研究方向预测作用。

4 结束语

本文结合了三种文献可视化分析软件:Citespace、SATI 和 UCINET 对与「人工智能教育」相关的近 25 年中文文献进行分析,对人工智能技术在教育领域的应用和发展历程、研究热点进行了直观化的展示。自「人工智能」被提出至今已经发展了 60 余年,而我国对于人工智能技术在教育领域的应用研究历程却仅仅为 25 年左右且主要集中于近 5 年,人工智能在世界中的发展态势突飞勐进,已经逐步开始了跳出技术范围的高度智能化的进程。教育信息化应该作为社会信息化的支柱,而不是紧跟社会信息化的脚步。俗话说「打铁要趁热」,相关研究者应该趁着近年来人工智能教育的发展势头加大研究力度,以期为教育信息化的深入开展垫好基础。

本文对国内「人工智能教育」的分析有一定不足:(1)由于对中国知网中文献资源的拥有度有限,因此可视化分析的结果有一定的局限性;(2)本人对于 Citespace 和 UCINET 两款可视化分析软件的使用能力有限,没能进行加权算法和交互信息算法等深度分析程序,没能更好地融合三款软件的优势;(3)本文对关键词中心性的分析中仅采用了中心性排名前十的关键词,使研究数据的范围一定程度缩小。

参考文献

[1]Mccarthy J,Minsky M L,Rochester N,et al. A Proposal for the Dartmouth Summer Research Project on Arti cial Intelligence[J]. Journal of Molecular Biology,2006,(01):279-289.

[2]杜占元.人工智能与未来教育变革[J].中国国情国力,2018,(01):6.

[3]侯剑华.CiteSpace 软件应用研究的回顾与展望[J].现代情报,2013,(4):102.

[4]陈超美.CiteSpace 知识图谱的方法论功能[J].科学学研究,2015,(2):243-246.

作者简介:胡倞茜(1995-),女,汉族,河北邢台人,硕士,安徽师范大学教育科学学院,研究方向为计算机教育应用。


作者 胡倞茜