【摘要】联通主义认为知识由实体间各种连接所组成;因为相互连接,一个实体的变化可能导致与之相连的另一个实体的变化;学习指的是这些连接的生长、发展、变化或加强。本文对联通主义进行概述,阐述联通主义学习观,详细分析学习如何发生于网络中。文章还对联通主义进行了解读,从学习网络角度分析联通主义的理论基础和实践。文章最后从教学理论视角全面剖析了联通主义。
【关键词】联通主义;教育;学习;发展;网络;教育学;评价
乔治·西蒙斯(Siemens, 2004)把联通主义(connectivism)称为“一个数字时代的学习理论”。虽然数字技术的兴起对联通主义的形成产生了重要影响,但它不是对数字化的回应,而是运用来自数字化的启示解决长期困扰学习与发展领域问题的一种方法。
当今教育领域不乏“学习理论”,比如基于行为、教学方法、交互距离、知识和意义建构等理论、活动理论以及动机理论等。这些理论往往被用作解释研究问题的工具或“视角”。然而,它们除了对知识和学习简单化分类或描述外,对于何谓知识和学习自始至终没有取得共识,更别说对何谓学习“成功”的标准。社会目前对教学、考试,甚至对教育方方面面普遍不满,然而尽管如此我们照样学习,而且收获颇丰。至于为什么这样,现在仍然无法从根本上进行解释。
传统教学理论的弊端在数字时代暴露无遗。沃特斯(Watters, 2021)指出,虽然教育技术据称有助于开展个性化学习和有意义的教育,但是即使采用最先进的教育技术,我们所得到的不过是一个机械化、没有人性、标准化的过程。换言之,是建立在斯金纳箱(Skinner boxes)和行为主义基础上的教学机器。联通主义的提出不是为了回应数字化,而是为了弥补教育领域与时俱进理论的匮乏。它不像其他理论一样提供“暗箱”(black box)和比喻,而是基于最新自然和人工智能研究成果对知识和学习进行阐述。
由此可见,联通主义不是解释教学问题的另一种“学习理论”或“视角”,而是理解教与学的实证基础,重新定义我们的知识观和学习观,揭示学习行为和评价。
(一)何谓学习?
对于何谓学习,可谓众说纷纭。比如,加涅(Gagne, 1977)说学习是人的倾向或才能的一种变化。这个理论反映一种行为主义方法(Ryle, 1949)。梅耶从认知角度把学习视为一个人知识的变化(Mayer, 1982)。在宾厄姆和康纳(Bingham & Connor, 2010)看来,学习是吸收信息的一个转变过程。史密斯(Smith, 1982)和布朗等(Brown, Roediger III, & McDaniel, 2014)则把学习看成习得知识和技能。
我认为上述理论错误理解学习,我把它们称为“暗箱理论”,因为它们没有揭示学习的实际情况。比如究竟什么情况才算是“人的倾向或才能的一种变化”?这个定义说的是学习前后行为不一样,但是为什么会发生这种变化?变化是如何发生的?我们一无所知。
联通主义认为知识分布于由连接(connection)组成的网络中,因此学习指的是搭建和遍历这些网络的能力。
(二)联通主义学习观
学习是搭建连接,这不是一个比喻。一个人或某件东西在学习时,实际上是把网络中两个节点(node)或实体(entity)连接起来。连接指的是一个自然事件,不是比喻或“暗箱”。具体而言,如果一个实体的状态变化能引起另一个实体的状态变化,两者之间便有连接。学习是所有网络都在做的事情,即:①网络节点(相互连接实体)的增加或减少;②节点之间连接的增加或减少或加强或减弱;③节点或连接的特性发生变化。第①和②说的是“可塑性”(plasticity)或“神经可塑性”(neuroplasticity),即大脑神经元有时增加有时减少,神经元之间可能发生连接和断开连接。第③点讲的是连接强度的变化。比如,因为神经元激活函数变化,不同能量输入模式可能导致神经元发出不同序列信号。
(三)自组织
连接通过一个自组织(self-organization)过程变成学习。相互连接、改变彼此状态的实体通过自组织能够实现同步或以某种方式组织起来。比如,在一块木板上摆放一组节拍器,然后把它放在两个易拉罐上(如图1所示),随机拨动这些节拍器,即它们不是同时开始摆动,然而,它们的摆动节奏却会渐渐同步起来(Bahraminasab, 2007)。
如何解释这种现象?这些节拍器彼此相连,一个节拍器每一次左右摆动都会使木板也跟着移动起来,从而影响其他节拍器,有的摆动速度加快了,有的则减缓了,直到最后所有节拍器以相同节奏摆动。这就是自组织。这个例子说明相互连接的东西,无须其他干预,也无须一个“领头”,便能实现同步或自己组织起来。这就是我所说的学习。
(四)西蒙斯的联通主义理论
“联通主义”这个术语归功于乔治·西蒙斯,他在《联通主义:一个数字时代的学习理论》一文奠定其基础(Siemens, 2004)。因为有不同网络,所以就有不同东西能够学习,比如神经网络(Kasabov, 2014)和社交网络(Oddone, 2018)。联通主义讲的是神经网络和社交网络的学习。
我和西蒙斯最大的分歧之一是对学习的理解。西蒙斯认为神经网络和社交网络形成一个大网络,知识包括大脑的所有连接、大脑与世界上其他一切东西的连接,以及这些东西的相互连接。因此,知识一部分在大脑中,一部分在社交网络中(比如各种社交媒体或朋友圈)。
我却是把它们分开对待,即个人学习(神经网络)是一个网络,社会学习(社交网络)是另一个网络,但是它们通过感知(perception)过程相互作用。在我看来,感知是神经网络与社交网络相互作用的途径,而交流(communication)或会话(conversation)则是社交网络得以跟神经网络相互作用的途径(关于这种相互作用,详见下文有关“涌现”[emergence]和“辨识”[recognition]的讨论)。
西蒙斯(Siemens, 2004)提出联通主义的八条原则是:
• 学习和知识体现在多样化观点之中(换言之,存在于网络中而不是仅集中于一个地方);
• 学习是把特定节点或信息源连接起来的过程;
• 学习可能存在于不是人的事物中(比如一个组织或数据库,因此西蒙斯说个人学习和社会学习组成一个大的学习网络);
• 知晓更多知识的能力比已经掌握的知识更加重要(我们对这一点观点一致,都认为学习不仅仅是获得内容,还是为了培养认识世界和与世界交互的方式);
• 必须发展和维护连接才能促进持续学习;
• 能挖掘不同领域、观点和概念之间的连接是一种核心技能(详见下文讨论);
• 与时俱进(准确、最新的知识)是一切联通主义学习活动的目的;
• 决策是一个学习过程(详见下文讨论)。
(五)联通主义与其他学习理论的区别
联通主义不同于建立在内容基础上的教学主义理论(instructivism),比如交互距离(transactional distance)理论。联通主义认为大脑不是一本书或一个图书馆,我们不是把事实、句子和观点装进大脑、把它们组织起来并作为一个整体存放在大脑中,犹如书由书页组成、图书馆存放书籍一样。大脑不是这样,只有网络和网络中不同实体相互发送的信号。
联通主义不是认知主义理论(non-cognitivist)。很多关于知识和学习的研究建立在认知主义心智理论或认知主义学习理论基础上,主要涉及瞬时记忆、工作记忆和长期记忆,以及图式的编码和建构、认知负荷等。这些理论实际上是用计算机做比喻。大脑犹如计算机信息处理系统,然而工作记忆、认知负荷等并不能反映学习的实际发生过程。
建构主义理论(constructivism)认为学习是建构知识或表征现实。可是,我们依然陷入“暗箱”窘况。联通主义不是一种表征(representational)理论。根据表征理论,大脑是某种表征系统,诸如语言系统、逻辑系统、图形图像系统或表征客观世界对象的其他符号系统,而且这个系统实体的创建和操作必须遵循一定规则。然而,大脑的认知并非如此。有趣的是,人的学习经常被比喻成计算机,而现在即使是人工智能也不再使用这个系统。我们过去经常把它称为人工智能专家系统或基于符号或规则的人工智能系统。现在人工智能几乎全部使用神经网络模型。我认为联结主义(connectionism)不是表征理论,因为不存在知识转移、制造或建构这些概念。学习和知晓知识(knowing)是发生于大脑的实际活动。
联通主义是一种生长(growth)理论。犹如长肌肉一样,学习和知晓知识是我们在生长和发展自己的过程。学习涉及人体这个由物理属性构成的物理系统,尤其是能够根据已有经验、活动和活动结果生长和发展的神经网络。比如,只有通过锻炼和科学饮食我们才能强身健体(最典型的例子是运动员)。大脑也一样,只有通过实践(并吸收养分)才能得以发展。学习犹如对大脑进行“训练”,使之能够辨识现实中的事物(并做出相应反应)。
然而,很多教育界人士并不认同这种观点,而是认为通过正确“呈现”信息便能够促使学习的发生,好像我们只要把信息告诉学生,学生即使不练习/实践也自然而然能够掌握相关知识。这种观点显然站不住脚,就像强身健体一样,如果只动口(比如告诉运动员该怎么锻炼)但听者不行动,根本不可能取得强身健体的效果。
(一)概述
有不少学习理论阐述学习的发生,比如库伯(Kolb)和杜威(Dewey)的体验式学习理论,认为学习过程包括具体体验、观察、理论和演绎推理等成分(如图2和图3所示)(Kolb, 1984)。
这些理论的共同点是阐述产生学习的过程,但是关注的是学习者环境(条件)而非学习者本身。比如加涅(Gagne, 1977)的“教学九大事件”涉及教师如何设计和组织学习活动,而不是从学习者个人角度阐述学习如何发生。从学习者个人角度看,学习应该是这样的(如图4所示)(Wolchover, 2017)。
这仅是众多神经网络的一种。图4显示,在向神经元输入分解成像素的图像之后,接下来各环节环环相扣,连接在一起。这个处理(processing)过程发生于大脑后部枕叶的视觉皮层。视觉皮层接收作用于眼睛的所有输入并进行“2.5维图”(Marr, 1982)检测、边缘检测等一系列处理。这就是神经元的工作原理。神经元没有说“我正在寻找边缘”,它们只是接收输入,然后产生输出,仅此而已。它们不是“有意”检测边缘等——这是我们强加的理解,从我们的角度阐述神经元的工作原理而已。
(二)信号、交互作用、结构
西蒙斯多次谈到网络特点,但是他使用的术语不那么准确。比如,他说网络有“内容”(content),而说网络有“信号”(signal)更准确,因为不是所有交互作用(interaction)都有意义,而“内容”的言下之意是有意义。
西蒙斯讨论大脑的“数据”(data)和“信息”(information)这些专业性很强的术语。一条数据代表一个事实(fact),而根据德雷茨克(Dretske, 1981)的观点,信息是“从接收者角度看对世界上可能存在的事态的简化”。由此可见,它们都不如“信号”准确。
在西蒙斯看来,“交互作用”指形成连接和通过这些连接发送信号,由此产生interactivity(交互性):一个实体把信号发送给另一个实体,这个信号有可能改变另一个实体的状态。但是这个意义上的“交互性”应该与大教育背景下所言的“交互性”区别开来,后者广泛用于指会话或讨论这一类的信息交换。
西蒙斯采用静态(static)和动态(dynamic)知识结构术语,这些术语本身也不够清晰,因为可以指认知或表征结构(比如模型或框架)或物理结构(比如社交网络或神经网络)。联通主义认为知识不是指认知或表征结构,而是专门仅指这些物理结构中实体连通性模式。
同样,我们用动态结构指神经网络接收新信号的方式。西蒙斯用“新信息”和“新数据”术语,而更准确的术语是“新(或刚)接收的感官知觉”(sensory perception)。西蒙斯认为情感、动机、接触、辨识模式、逻辑和体验等能够加强网络中的连接,这些连接也受到其他因素的影响,包括社会化和技术(Melrose, Park, & Perry, 2013),甚至是“自我更新的节点”(self-updating nodes)。但是,这个术语欠精确,因为它可能只指内部感觉(internal sensation)或是把信号发送给自己的循环网络节点。
诸如“思想”“信念”“意图”这些“心灵内容”(mental content)术语,用丹尼特(Dennett, 1987)的话即是表明“意向性立场”(intentional stance),使用起来更加容易。只要不用其内涵解释其所指现象,它们本身没有不妥之处。比如,说“电脑认为(think)其内存溢出”,我们并不真的以为电脑会“思考”(think)。同理,说某个人接收了新信息并不意味着这个人真的掌握了新事实。
(三)学习理论
有很多方法可以阐述学习的发生,但不涉及“意向性立场”。比如,阐述影响神经元之间连接的形成和强度的因素要比讨论教学实践更恰当,因此可以被理解为“学习理论”。具体说,我们可以从以下四个方面分析神经元的连通性。
• 赫布连通性(Hebbian connectivity),即“一起放电的神经元会紧密相连”原则(Hebb, 1949)。比如,两个神经元同时放电同时静默,那么它们最终会彼此相连。这是形成网络的最简单形式。
• 邻接性(contiguity),指实体在一定程度上相邻而处。比如,在一个交互激活和竞争网络(Interactive Activation and Competition Network)中节点相互竞争、与负权重相关联,这些节点形成节点“池”(McClelland, 1981)。
• 反向传播(back propagation),指反馈通过网络回传,调节连接权重。虽然人们常说反馈有助于学习,但是反向传播在人类神经网络中的工作机制仍不清楚。目前,反向传播应用于人工神经网络上 (Rumelhart, et al., 1985),长期以来是最被看好的一种神经网络学习形式。
• 玻尔兹曼连通性(Boltzmann connectivity),指网络试图通过调节连接权重实现最佳热力学稳定状态(Hinton, 2007),类似于金属的退火过程。比如,把一块石头扔进水池中,水原子会哗啦哗啦翻动碰撞,但是水面最终又会“风平浪静”下来。
今天人工神经网络已经不是根据这些学习理论进行分类。现在界定神经网络类型的因素包括拓扑、激活函数和特征检测。机器学习和深度学习这两种使用神经网络的主要人工智能都可见这些核心概念。机器学习需要人的某种干预以发现或分类数据,深度学习则通过各种层次神经元独自发现和分类数据。
(四)网络特性
人工智能领域认为人工神经网络通过试错工作。研究者开发各种模型解决具体问题。他们可以改变模型参数对其进行调节以达成预期输出目标,然后用预定训练集对模型进行训练。比如,图5显示了一个神经元的工作原理(Gavrilova, 2020)。
神经元通过网络连接接收来自其他神经元的信号。每个输入都有一个权重,这可能是连接强度的函数。传递函数对这个权重进行界定,可能提高其输入值,或取最高值输入、最高两个值或中间值,等等。不管传递函数结果如何,它还得经过激活函数的权衡,根据这些输入是否达到一个阈值决定这个神经元是否发送自己的信号对输入进行回应。人的神经元激活函数取决于电位(electrical potentials),这些都可以在分子层面阐述(Lumen Learning, 2021)。而根据上述玻尔兹曼原理,人工神经网络可以在连续多次的神经元相互作用过程中降低,然后逐渐提高阈值达成激活的目的。
值得指出的是,人工神经网络的设计只用到几种不同的神经元,而人脑有数以万计的不同神经元(Masland, 2004),直到今天我们还在继续收集和分类(Hippocampome, 2021)。神经元因作用、在大脑所处位置以及对环境回应的不同而具有多样性。人脑这种多样性无疑很重要,但是我们目前还远未了解不同神经元如何相互作用。
神经网络拓扑也各不相同(Pai, 2020)。上文的赫布网络可以被重新说成是“前馈神经网络”(如图6所示)或“感知器”(perceptron)。这是最早的人工神经网络类型之一。信号通过不同的神经元层发送,每一个神经元在信号输入时,其激活函数便决定是否放电。这些都是简单的网络,只能用于“线性回归”。它们有助于组织表格数据、图像数据或文本数据,但是无法解释复杂关系。
循环神经网络(如图6所示)则将一个神经元发送的信号回馈给这个神经元,这样便保存以连串形式输入的数据,比如一个句子的单词或一连串事件。这种网络用于解决与时间序列数据和文本数据相关的问题。今天谷歌录音器之类的应用程序能够在说话的时候把音频信号转换成文字,它们使用的是复杂循环神经网络。还有一种“卷积神经网络”,可用于捕捉图像的空间特征(如图7所示)。它分析呈现给它的像素排列,分辨不同图像。这一点与上文的“邻接性”相似。
因为有很多类型的神经元,所以有很多类型的神经网络。限于篇幅,恕不一一介绍。
(五)网络如何学习?
一个人工神经网络即使由数以万计或数以百万计的连接组成,仍然无法跟人脑相比。人脑有1,000亿个神经元和数不尽的连接。神经网络在接收、传输、重新组织和生长、生成有趣且相关现象以及辨识和回应等方面具有强大的能力。这与学习有何关系呢?我们可以说这些网络在“处理信息”,但是实际并非如此,网络不关心信号的“内容”。赖尔(Ryle, 1949)认为学习是人的倾向的一种变化,我们认为这种变化是神经网络的变化。网络学习指网络如何获得其特性,神经元如何生长和发展?它们如何相互连接?网络拓扑如何形成?
显然,遗传在这方面发挥作用,但是仅在构建发生学习的物理平台方面。同样,一些环境因素(比如营养和身体创伤)可能影响这个平台。然而,神经网络的“学习”指的是感知和体验如何塑造和发展神经网络的连通性。换言之,我们如何“生长”知识。人类神经网络的塑造和发展被称为“生物神经可塑性”,即“神经系统通过重新组织其结构、功能或连接改变其活动以回应内部或外部刺激的能力”(Mateos-Aparicio & Rodríguez-Moreno, 2019),而人工神经网络则通过“训练”(training)达成这个目标。
在教育领域“训练”这个术语内涵不佳,往往表示死记硬背和机械重复,无须更深层次理解或认知,但是在人工神经网络语境下并没有这层含义,而是指网络为了获得与其体验相适应的配置(连接和连接权重)一次又一次所经历的过程。
因为信号通过网络发送,神经元特性、神经元连接的性质和强度,乃至整个网络拓扑都是经过上述一种或多种学习理论的过程塑造而成的。在训练人工神经网络时,在一代又一代训练和一次又一次训练中反复发送这些信号。简而言之,给它提供新的感知信号,通过网络传播信号,适应这个过程。
(一)现实中的网络
对一个理论的不同“解读”(interpretation)是指理解这个理论并把它应用于现实世界的不同方式,解释世界为何如此运转。解读不仅仅是陈述理论的内容,还要解释为什么其观点是对的、相关的或有用的等。比如,我们可以从三个方面解读概率理论:概率是“事件发生的频率”(Reichenbach, 1949)、“全部可能事态的数量”(Carnap, 1950)和“对产生某一个结果的把握程度”(Ramsey, 1931)。这些不同解读不但代表对概率的不同思考方式,而且也运用数学知识并将之应用于不同学科中。比如,频率说涉及统计推断和回归,事态说涉及本体论和分类学,把握说则涉及博弈论、偶然性和社会学。如同概率一样,网络理论以多种形式存在于现实世界中,比如,数学的图论,计算机科学的联结主义、人工神经网络和人工智能,生物学的生态论和生态系统,社会学的社交网络分析和行动者网络理论,生理学的感知说和神经科学。上文提到的节拍器效应是一种网络理论,下面的八哥集群飞舞(murmuration)也是一种网络理论(如图8所示)(其他例子,另见:Barabási, 2003;Watts, 2003)。
图8 八哥集群飞舞景象(Donovan, 2021)
如图8所示,一群八哥在翱翔过程中不断形成新队形,这是一种网络行为,虽然没有任何形式的领导或指导但却形成聚合力。“这些八哥实际上是自组织的,换言之,八哥集群飞舞正是一只八哥微不足道的行为规则被推而广之到一群八哥身上所然的结果。为了理解这种行为,我们不得不先了解局部(个体在干什么?它遵循什么规则?)才能明白全局(结果是什么?)”(Donovan, 2021)。在诸如此类的例子中,“社会性动物间的协调要求个体间能够快速和高效传递信息,而这可能主要取决于交流网络的底层结构”(Rosenthal, 2015)。随处可见的网络都有类似特性,比如社会组织(公司网络或政治网络)、基础设施(电网或因特网)和社交网络(网站、脸书和推特)。
这些(以及诸如此类)现象是可以观察到的物理现象,用图论(Euler, 1995)和人工神经网络描述。联通主义把与教与学相关的现象看作是诸如此类的网络现象,采用相同的基本原则和理论。以网络方式看世界的好处之一是简约(parsimony),即能够把同一个理论应用于多个领域,因此对相关现象的解释力更强;另一个好处是转移(transference),即如果不同领域基于相同逻辑,那么一个领域的发现便可以用于理解另一个领域。比如,计算机网络知识可以被用于认识人类神经网络。
(二)一个数字时代的理论
如上所述,西蒙斯把联通主义看作是“一个数字时代的学习理论”。据此,联通主义应该旨在回答“知识是什么”这个问题。西蒙斯在后来的专著中指出“知识已经从范畴化和层次关系向网络和生态转变。这使一切发生变化并强调改变我们的组织的空间和结构的必要性”(Siemens, 2005, p. v)。这种观点的提出绝非偶然。
上文指出知识是对网络中连接的组织。比如,说“弗雷德(Fred)掌握某种知识”,实际是在说弗雷德被以某种方式组织起来。弗雷德有某一种神经网络,他已经以某种方式“生长”他的神经网络,因此他知晓某方面知识,比如数学。但是,这不是说弗雷德记住了乘法表或勾股定理。知识和记忆不一样。记忆犹如客厅游戏(parlor game),只需把听到的话背诵出来,也如同美国拼词比赛,只要记住词汇的拼写即可,不必知道它们的意思或如何使用(Melby-Lervåg & Hulme, 2013)。知识显然不只是记忆。
我们可以说知识是理解世界的一种方式。质性知识(比如形状、颜色或大小)和量化知识(比如数量、重量或尺寸)是我们所熟悉的,与它们对应的是质性研究和量化研究(Creswell, 2020)。联通主义认为还有第三种知识,即建立在组织和结构基础上的联通知识(Downes, 2008)。
联通知识使我们能够理解诸如八哥集群飞舞现象。这种现象是一个网络,但不是大脑或计算机之类的网络。八哥们在空中相互作用并形成队形,但是并没有领头八哥,最前面的八哥看不到最后面的八哥,反之亦然。每一只八哥仅对其周围几只八哥做出反应,但是它们却产生集体行为,好像所有八哥是一个集体,在空中翱翔。我们可以观察到队形是如何变化的:当一只八哥改变其位置时,会引起身边另一只八哥跟着改变其位置,直到全部八哥都相应改变位置。这是因为它们只有作为一个整体动起来才能有效应对险境。比如,如果这群八哥附近出现捕食者动物,只要有一只八哥有所警觉并做出反应,所有八哥都会跟着反应。这就是联通知识与质性知识或量化知识的主要不同:集体知识优于个人知识。
联通主义另一个核心概念是“涌现”(emergence)。图9是一位女士头像,由圆点组成。我们从这幅图中看到的是一个戴着帽子的女士。但是,并不是说画中真的有一位女士。我们之所以看到这个画面,是这些圆点被组织起来的方式所致的结果。这就是联通主义的“涌现”现象。“知晓知识”即是“被以某种方式组织起来”,使得我们能够辨识相应现象(比如图9的女士),而且他人也看得出我们掌握相关现象(比如女士)的知识——这也是一种涌现。从实体相互作用角度讲,在一个网络中模式(pattern)是在实体之上“涌现”出来的。
因为“知晓知识”即是“被以某种方式组织起来”,因此学习即是习得模式,频繁体验某种现象直到能对其做出习惯性反应。知识即是辨识(recognition)。传统知识理论认为知识即理解事物组成部分或规则或具体配置。然而,事实并非如此。比如,一个人能够在公交站人群中看到自己母亲,他并没有对人群进行分析也没有根据规则进行评判,而是看着人群直到能够辨识其母亲的“模式”。这是一种即时意识,即时对双眼所见现象与已有网络配置进行匹配,非常个人化和情景化。
除了“知晓知识”过程外,联通主义对知识的要求也是不同的。比如,图9的点阵图可能是具体某个人,不一定是一位女士。比如,它可能是阿诺德·施瓦辛格(Arnold Schwarzenegger)。然而,不是所有人都能从中看到施瓦辛格,比如从来没见过他的那些人。由此可见,辨识取决于个人先前体验。以前我们用潜意识,比如格式塔心理学(Gestalt psychology)(Guberman, 2017)解释联通知识,用格式塔设计原则开发网络(Bufe, 2021)。如今得益于联结主义人工神经网络和全球交流网络这些数字技术,我们能够设计和开发大型网络,直接观察它们的运作,提出建立在通用网络设计原则而非潜意识理论基础上的机制。
(三)网络设计原则
只有结构合理的网络才能做出恰当反应。这涉及人工网络的网络设计,而如果是非人工的系统,则是指相互作用的实体如何发展成为网络。比如免疫系统往往呈现一种最佳连通性。“重要系统据说是运作于混沌的边缘。换言之,处于有序和无序之间最佳的‘平衡状态’,即既灵活又稳定这种看似不可能的状态。实际上,大脑便是如此,其行为模式保持一致时体现的是稳定性,而学习新模式时则体现多变性。复杂系统能够应对临界边界,从根本上避免受到两种极端中任何一种的左右。”(Ros, et al., 2014)
网络实体必须以某种方式相互连接,否则不可能发生交流。本节从八个方面讨论网络设计。这些是作为假设提出的,不是规则,虽然它们构成联通主义学习系统设计的核心。
1. 去中心化
去中心化(decentralization)是网络拓扑的一种偏好。中心化网络只有少数“中心”实体拥有很多连接,因此是一个“星状”网络。去中心化网络减少对“中心”实体的依赖,使实体连接更加均匀分布,比如每一个实体都与邻近几个实体相连接的“网状”网络。另一种去中心化的方法是把实体分成层次进行组织,形成典型的“深度”学习网络(如图10第三种网络)。
图10的第四种网络拓扑的节点之间不存在相互连接现象,而实际上星状网络的连接也很少,过于集中在几个神经元(实体)上,容易产生单点故障。
2. 分布式
即使大脑神经元也不是全部集中在一个部位。大脑分为不同叶,比如海马和小脑等。同样,因特网通过分布式网络(比如电子邮件这样的点对点网络)或诸如RSS的内容聚合网络实现可靠性。分布式网络比中心化网络(如脸书或推特)可靠。认知表征系统每一个概念都有一个单独位置,这就是物理符号系统假说(Physical Symbol System Hypothesis)(Newell & Simon, 1976)。分布式(distribution)可以代替认知表征系统。比如,我们对“猫”“狗”或“鱼”的概念实际上是我们看到一只猫、狗或一条鱼时激活的一组神经元。但是这些使用的是相同神经元网络——这一点很重要。由此可见,猫与狗、狗与鱼、猫与鱼等都可能重叠(如图11所示)。因此,我们对猫的知识影响我们对狗的知识、对鱼的知识,反之亦然。认识到这一点非常重要!
我想强调的是大脑并不存在“猫”“狗”或“鱼”这些词,不存在它们的形式逻辑结构(或分类)。它们碰巧重叠。神经元组织方式使得我们在神经网络的感知出现重叠。这可以被称为“亚符号认知”(sub-symbolic cognition),即不是使用符号、词汇或语法规则等,而是涉及神经元激活模式和神经元连接。
3. 去中介化
去中介化(disintermediation)即消除信号源与接收者之间的障碍,使信号能畅通无阻地从一个实体传递到另一个实体。神经网络一些结构的作用是为了保证信号顺利传播。比如,髓鞘使电脉冲能够快速高效传递(Morell & Quarles, 1999)。社交网络去中介化指的是废除信息提供者和接收者之间的编辑、出版商等“中介”,但是并不意味着必须扫除所有障碍。没有某种形式的调节中介,信息量会令人不堪负荷。
4. 分解
分解(disaggregation)类似于分布式表征,旨在把对象设计成为一个统一、不可再分的整体。比如计算机系统的功能分布于很多相互连接的装置中。再如,我们不主张把内容打包成为一门课程或一本书,而是制作成学习对象或开放教育资源,由使用者按需选择资源并进行整合。分解使对相同成分的多种理解成为可能,更加方便新旧成分的整合。
5. 非集成
非集成(disintegration)说的是网络实体是独立的,不是彼此的组成部分。发送信号实体的结构逻辑上有别于接收信号实体的结构。这是系统论与联通主义的一个重要区别。系统是一个有组织或复杂的整体,各部分的组合形成一个复杂或统一整体(Johnson, Kast, & Rosenzweig, 1964)。在系统论看来,不同部分组成一个整体,并共同努力实现某个目标或目的。联通主义认为不存在把整体统一起来的目标或目的。
非集成对解读理论非常重要。比如,进化(evolution)是没有目的的。鸟不是为了飞翔才生长翅膀,而是它们能够飞翔,而在这个随机选择的过程,它们生长了翅膀,翅膀又使它们在飞翔方面占有优势。因此,不能从集成化角度看实体,比如不能以为鸟离不开翅膀。在一个不同世界、不同环境中,鸟可能不会生长翅膀。
6. 民主化
民主化(democratization)源于实体自主和多样性的需要。这是一条结构性原则,因为自主和多样性是网络运作的必备条件;“运作”指一个实体状态变化能够导致另一个实体状态变化。如果实体不能够自主,不存在多样性,所有实体均处于相同状态,那么不可能发生状态变化。因此,可以把民主化理解为实体改变彼此状态的能力,从这个意义上讲还需要兼顾公平和包容。
民主化还涉及下文的“语义原则”(semantic principles),以确保网络保持连贯以及能对环境变化做出反应。
7. 动态化
动态化(dynamization)与民主化相关。我们应该把网络看作是流动、变化和发展的。网络只有通过变化这个过程才能学习,才有可能发展。因此,任何导致网络处于静止状态之举都会使网络停止学习。
8. 去类别化
我们经常对实体进行分门别类,辨识网络中的模式、形状和簇群,但这些是对网络的解读,不是网络本身固有的。比如,根据共同特性、位置或其他质性特征对实体分门别类,这可能导致我们根据这些共性分析其功能和作用,而实际上网络功能取决于实体的实际相互作用。比如,“护理学”“社会工作”“皮肤病学”等往往被视为完全独立的学科,然而文献分析显示它们彼此相关,不同学科研究者彼此互动与交流(Bollen, et al., 2009)。但是,他们相互联系的目的只是产生相互作用,达到这个目的即可,比如药物研究者发现mRNA可以治疗新冠病毒,他们把这个成果与网络其他实体交流,从而对他们(比如社会工作者)产生影响。不同学科或研究者均是一个更加复杂网络的一部分,因此学习网络设计要去类别化(desegregation)。
(四)语义原则
上文“去中心化”谈道,有星状网络和网状网络。“小组”(group)是星状网络,其特点是统一性、协调性、封闭性和传播式。相比之下,“(通常所言的)网络”(network)则是网状网络,其特点是多样性、自主性、开放性和交互性。语义原则从根本上认为星状网络(“小组”)的学习不如网状网络(“[通常所言的]网络”)成功。
成功的网络具备多样性、自主性、开放性和交互性,反之则“不堪一击”,难以适应变化和学习、生长。
1. 多样性
如前所述,如果强调统一性而非多样性,就不会有信号交流,不会有交互作用。当然,世上没有完全相同的东西,但是我们不能主张统一性这个价值观,因为这会削弱韧性。比如,农业的单一培养(monoculture)导致农作物抗病能力下降(Ekroth, Rafaluk-Mohr, & King, 2019)。同理,如果人的神经元不具有多样性,这将是一场灾难。
2. 自主性
在一个成功的网络中,实体相互连接、相互影响,但是各自“决策”(各自根据接收到的输入和自身状态发送信号)(Raghavachary, 2021)。这样的网络比需要协调的网络应变能力更强。
讨论人类神经网络协调性是没有意义的,因为没有一个神经元“领头”协调其他神经元的行动。一个社会越是需要协调,应对变化的时间则越长;个体越是自主,社会越能更快应对变化和新情况。
3. 开放性
成员资格的开放性(网络能增加实体)使网络有可能生长。对新体验或概念持开放态度有助于网络辨识现实世界各种可能事态。相比之下,封闭网络则不能适应新体验,辨识能力受制于自身先前体验。开放性不仅是一种生活态度或方式,它是网络的一种物理特性。当然,封闭也可能被设计成为默认状态,比如苹果公司的系统(Worstall, 2012)。这不过是一种“损人利己”的行为。
4. 交互性
交互性指网络的知识通过实体间相互作用而产生,不是从一个实体传送给另一个实体,即知识不是集中于一处产生然后传送给其他实体。如果知识是传播式的,那么某个实体的知识只是被传送给其他每一个实体。这意味着一个网络的知识不可能超越它任何一个实体的知识。然而,如果知识是通过全部实体共同交互这个过程而产生的,网络的知识便多于任何一个实体的知识。这一点很重要。
交互性对人脑至关重要,因为单独任何一个神经元都不是很“聪明”,只能接收和发送信号。但是有1,000亿个相互连接神经元的大脑则是无与伦比的“聪明”。社会也如此。一个人不管有多大智慧都不可能比整个社会“聪明”(Surowiecki, 2004)。我们可能觉得有些人比全社会更有智慧,这是因为我们把他/她与另外一个个体比较,而不是跟作为整体的社会比较。个人的知识永远是残缺的。
(一)联通主义教学原则
简而言之,联通主义教学原则是:教学即示范和演示;学习即实践和反思。因此,联通主义跟其他实证主义教学理论很相似,比如杜威主张学校和教室应该呈现现实生活情景,使小孩能够灵活穿梭于各种社会情景参加学习活动(Williams, 2017)。
尽管如此,联通主义不同于传统基于信息论和内容传播的远程在线教育理论,比如穆尔(Moore, 1997)强调师生对话的程度和质量的交互距离理论。后者的目的是保证信息完整性,即忠实表征相关信息(University of Waterloo, 2021),因此要求通过同行评审确保内容质量并通过测验和考试保证学生能够忠实复制内容。
在联通主义看来,知识不是从一个人转移给另一个人;知识即网络,从网络的实体,甚至是现实世界中实体的相互作用中生长和发展起来的网络。因此,教学旨在通过示范和演示相关活动激发这种相互作用。网络的实际生长则取决于个体实践和能够通过实践使网络进一步完善的一种机制。联通主义学习活动的目标是辨识。换言之,能够辨识相关现象,辨识包括对这些现象做出相关反应(Simpson, 2013; Boesch, 2021)。因此,知识即辨识。
(二)不整合内容
当今的教学法理论,比如IMS全球学习联盟的“简单顺序标准”(Simple Sequencing specifications),非常重视内容和学习活动的呈现安排,强调基础知识、前提、课程内容范围、完成课程学习等,比如慕课学习(Jordan, 2015)。强调完整呈现内容的教学法理论不在少数(比如:Kirschner, Sweller, & Clark, 2006)。
联通主义对这方面的理解是不同的。比如,如果想了解一座城市,不能光看它的地图,不管这张地图多么详细和准确(Kukla, 2021)。换言之,有关这座城市的知识不等于它的地图所告诉我们的。要知晓它的情况,可以拿着地图去实地探寻,比如游览地图上所标示的地方,了解它们的情况以及它们之间的关系,等等,由此产生的神经网络结构便是有关它的知识。从这个意义上讲,“知晓”不是记住地图知识,而是在畅游这座城市时“识途”。
(三)ARRFF方法
传统教学法经常包含这些成分:学习倾向、概念设计、呈现教学设计、循序渐进引入内容、奖惩等(Bruner, 1966)。这些与联通主义无关。联通主义教学法可以归纳为A(aggregating—聚合)、R(remixing—重新混搭)、R(repurpose—改变用途)、FF(feed forward—前馈),即ARRFF法。ARRFF法不是联通主义独有的。但是,从联通主义角度讲,其独特之处在于着眼“一个神经元能做什么事”这个问题。如果你是某个网络中的一个实体,你是怎么做的?如前所述,答案是:接收信号,以某种方式处理这个信号,然后借助激活函数发送自己的信号。简而言之,成为节点;做网络的实体。
从教学理论的角度讲,联通主义核心技能是辨识信息源之间连接关系,即使在快速变化环境下也能做出决策;随着新现象的呈现,能够持续更新和改变我们的知识。因此,联通主义不在乎“你能否把知识背诵出来”,而是强调“你能适应快速变化和动态的环境吗”。
(四)慕课
联通主义的学习不是发生于正式课程中,而是在某种学习网络的环境下。我和西蒙斯开发第一门慕课,目的正是要为学习者创设这样一个学习环境。我们当时的想法是创设一个联通主义环境,使得学习者能身处其中学习。我们不关心他们学习什么,我们不要求他们学习具体内容并准确复述出来,而是告诉他们只要能在一个网络环境下学习,能够从这个网络学到东西,自己感到满意就行。
(五)联通主义的素养模型
从联通主义角度讲,literacy不是“识字”,不是语法规则,而是辨识常见模式和现象。(literacy既可以指“识字”“读写能力”,也可以指某个领域或方面的能力,通常译为“素养”——译注)“素养”多种多样,包括文本(或传统)素养、数学素养(基本算术能力)、信息素养、文化素养、情感素养、数字素养等。这些素养往往被说成是知识(事实、规则等)和技能的集合。任何领域或学科的知识都是如此。“知晓”一个学科或领域不仅仅是记住一些相关事实,而是要能够与本学科或领域其他专家进行熟练的社会交互,他们辨识你是跟他们一样的专家。
本节介绍构成一个学科或领域“素养”的六种主要模式——句法、语义、语用、认知、背景和变化(联通主义把它们视为神经网络辨识的模式,不是其他学习理论所述的基本概念),可能还有其他模式,本节仅是抛砖引玉。
1. 句法
“句法”(syntax)指形式或结构的模式,但不局限于乔姆斯基(Chomsky, 1957)所言的语法和规则。虽然语法可被视为语言的重复模式,但并不是建立在规则基础上,比如Cobuild(Collins, 2017)所呈现的语法。句法还可以包括柏拉图的形式理论和荣格的原型。相似性是一种句法形式,操作、程序或动作技能也是一种句法形式。
2. 语义
“语义”(semantics)包括各种真理理论、意义、目的和目标,在联通主义素养模型中这些不是严格意义上的“理论”,而是不同模式。语义包含涵义和所指、解读、联想等。现实中语义还体现在决策、表决、寻求共识和涌现之中。
3. 语用
“语用”(pragmatics)包含使用、行为和影响的模式。在奥斯丁(Austin)和塞尔(Searle)看来,语用是言语行为(speech act)和以言行事,比如断言(assertives)、指令(directives)、承诺(commissives)、表情(expressives)和宣布(declarations)(“宣布”还可能伤害、骚扰或凌辱他人)。语用还包括质疑和预先假定。
4. 认知
虽然我们可以说必须有“认知”(cognition)才能知晓和学习,但是联通主义认为认知本身是一种复杂的模式辨识形式。认知可以被分为四种主要推断类型,即描述、定义、论证和解释,每一种都可以通过其特有形式予以辨识,各自能够引发相应反应,促进和评价推断。
5. 背景
“背景”(context)即某个活动或事件的环境、发生地或外部条件。背景辨识是模式辨识不可或缺的一步。比如,范·弗拉森(van Fraassen, 1980)指出解释是为了回答“为什么”,但是只有同时说明其他可能的情况才能解释“为什么”。奎因(Quine)认为意义具有背景敏感性。在哲学家雅克·德里达(Jacques Derrida)讨论词汇和语言学家乔治·雷可夫(George Lakeoff)有关框架(frames)的阐述中“背景”是一个核心概念。
6. 变化
谈论模式就是讨论变化模式。《易经》、马歇尔·麦克卢汉(Marshall McLuhan)和黑格尔(Hagel)都述及“变化”(change),实际上是在讨论发现和理解世界变化的不同方法。变化还涉及博弈论、发展、计划等。
(六)评价
任何学科的“素养”都可以根据上述模型呈现。比如“表演专业”的“句法”包括其形式、规则、操作、模式或相似性等方面的内容,我们可以据此分析表演这个概念,比如有一些基本成分(如背台词的能力),也有一些复杂理论(如斯坦尼斯拉夫斯基[Stanislavski]“方法演技”体系),还有一些是仪式化的(如婚礼和葬礼)。所有这些都是对表演不同方面情况的辨识,构成一场成功演出的内容(指南或对照清单),但是如何评价却是另一回事。
举个例子,我们要考核在高危环境下工作的高技能人才,比如外科医生、飞行员、部队指挥官,甚至是律师,我们不会只要求他们答一份试题,不会叫他们复述所学知识,而是会安排他们到一个真实环境中并由本领域专家观察他们的表现。考官们手上可能有一份考核对照清单,但是他们不会根据所给的规则或原则或甚至是评价对象所掌握的知识评判这个人是否合格,而是会对他/她进行综合评价,即“我会把这个人当成医生、飞行员或律师吗?我能从其表现中辨识医生、飞行员或律师的模式吗?”
换言之,考核对象在所处环境中能够辨识周围现象吗?能够恰当反应、用词准确、提问中肯、表现出应有技能吗?等等。现实中不可能把考官需要考虑的问题一一列出来。某一个学科或领域的专门技能(知识)包括很多细节和细微变化,根据新情况做出新反应,或者实际行为与先前实践相似但不雷同。考官们会全面评价一个人的表现,判断在此情此景中其表现是否清晰可辨。
联通主义强调把学习置于大环境下理解,认为学习不是为了背诵事实和信息,而是取决于一个人在一个互联互通大社区中生活、工作和发展的能力。评判学习成功与否不是分数、成绩等级或是否毕业,而是社会指标,比如犯罪率是否下降、健康水平是否提高、民众是否更幸福等。我认为这些才是衡量学习成功的恰当标准,也是评价一个学习理论的恰当方法。
本文不是在为联通主义辩护,不是要求学界相信或接受它的观点。本文的每一个观点都应该接受实证检查和验证。文中一些表述可能需要进一步完善,甚至通过进一步研究予以推翻。本文旨在提供一个理解学习和发展的框架,而且这个框架不应该被当成一种工具使用,而是应该把它视为提出一系列观点以帮助学界开始发展真正的教育科学。