帮助&资讯

其他 — 一位世界级专家的学习研究关注(二)

2021-02-19 15:41:07

发表时间:2007年3月29日
原文链接:what I’m working on
原文作者:Stephen Downes(blog,web)
翻译:danny
工作组织:教育中文翻译

【说明】本文第一部分见此链接。

回到人工智能(AI)的前史时代,那时有两种解决思路。一种被称为“专家系统”,本质上是努力将知识表达成一系列的陈述,以及找到从陈述复现出知识的规则。由此产生了以规则为基础的AI语言,如LISP。范例之一可能要算是Newell和Simon的“通用问题解决器”,但该努力后来被放弃。在我看来,专家系统的思路带着很多附加条件:知识可以被编成语句,思想和推理跟随着规则,人类思想是物理标志的系统,诸如此类。这种思路正是语义网建立的基础--这并非巧合。

另一思路由明斯基(Minsky)和派珀特(Papert)倡导,被称为“联结主义(connectionism)”。它基于这样的观点:计算机系统应该模拟人的思想--也就是说,计算机系统应该由相互连接的基本单位或“神经元”,多层次组合而来。一台这样的计算机不能由一组指示性语句来“编程”,它会在操作者不断的输入中受到“训练”。人们提出了不同的“神经网络”(它们后来被这样命名)训练方式:简单(Hebbian)观念联合论、误差反向传播、(Boltzman)“沉降”等。联结主义系统被证实在一些情况下确实很好用,比如模式识别,但也在另外一些情况下效果不佳,如产生规则。

如果这样来观察,情况就很清楚,两个差别非常显著的问题,实际上是同一问题的不同情形。在互联网上查找合适的资源,基本上与在考试中将题答对是一样的。所以,如果我们能够理解人类的思维是如何学习的,我们就能够理解如何管理我们的学习资源网络。

联结主义说“学习‘x就是P’,就是按照某一种方式被组织起来”,就是拥有正确的联结的组合。回顾我们前面所说的“一个知识的片段并不是对 某物的描述,只是与某物联系 的一种方式。我所说的‘了解x是P’,不是对‘x’的描述,而是表示‘我和x之间的关系’ ”,那么,非常清楚,我们在此讨论的是同样的理论。互联网上的内容组织问题,与大脑的内容组织问题是一样的。也许结果更加积极:既然我们知道“按照某一种方式被组织起来”能够在大脑中组成知识,那么,“按照某一种方式被组织起来”就同样能够在网络中形成知识。

联结主义给了我们技巧。它告诉我们如何将网络联结到一起,如何分层安排网络的基本组成单位,并提出了互动和训练的机制。但它没有解决语义学的问题。它也没有告诉我们,何种 组织将会成功地产生知识。

接着,我们步入了社会性网络理论时代,这是Duncan J. Watts等人开创的领域。起初,这个理论被用来解释,一个由相互独立实体构成的网络如何在没有外部介入的情况下取得内部协调。除非它自身产生,一个网络不可能会冒出知识来--这点非常重要,否则我们将不得不到个人身上去寻找知识,问题回到了从前。Watts(以及其他人)根据网络成员之间的数学特性发现,网络组织了它们自己。例如:一只蟋蟀每秒钟鸣叫一次,但在其它蟋蟀叫声的刺激下会缩短鸣叫间隔为3/4秒。假设每只蟋蟀能听到至少另外一只蟋蟀的叫声,这个简单系统将发出和谐的鸣叫声,就象合唱一样,所有的蟋蟀参与其中,但并没有任何一只“超级蟋蟀”在引导它们。

类似的现象在James Surowiecki的书《群体的智慧》中非常普遍。这个现象说明,一个群体比一位专家能够更好地回答某一问题。2003年在Idea City上我看到了一个图形案例(IdeaCity的组织者不再让我参加该活动,真是遗憾)。歌手Neko Case要听众成为她的合唱队。“别担心你会走调,” 她说,“一个声音走调了--但当300个声音齐唱时,整个的声调通常会非常完美。” 的确如此。错误被抵消了,我们每一个人按照自己的方式至少会接近一点点正确的声调,依靠所有人的努力,大声齐唱,我们完美地到达准确的声调之上。

所以,知识能被网络产生出来。但这是哪一种 网络呢?我们都知道旅鼠集体自杀、暴徒暴动以及所有类似的问题--在文化上这被称作“瀑流现象(cascade phenomena)”--它们就象疾病在人群中的传播,或大脑中有害想法的扩散。我们对学习网络科学的研究由此开始。

研究的第一部分,是将互联网和元数据的概念与社会性网络科学结合起来,这在《语义社会性网络》一 文中得以实现。这样,我们有了网络的图景,看起来就像Watts和Surowiecki描述的社会性网络那样。这些已经被(糟糕地)应用到 Friendster和Orkut等社会性网络服务之中。为了完成这项工作,一个分布式的身份识别网络是必需的。它被开发成了mIDm--请看这里和这里。今天,一个被称为OpenID的类似概念,正在互联网上获得越来越广泛的应用。

另一部分是提供一组网络创建的设计法则,可以有效避免瀑流现象。从我们早期的工作,包括分布式元数据等概念中,导出了一个有效网络理论的草稿。这里是该理论的幻灯和Robin Good对我的论文很不错的阐释版本。该理论建议,表现出八个法则的网络将会有效自组织起来--这是一个非常 粗略的经验法则,用意在替代可能永远无法解决的数学问题,因为法则所描述的现象,都是受多元相互依存变量影响的复杂 现象,如天气系统或生态系统。而这些组织法则最最简单的例子,可以在“生命游戏(Tha Game of Life)”这类游戏中看到。

除此之外,还加上了“语义原理”,以确保我们的网络所采取的组织形式是确实可信赖 的组织形式。关于网络知识的认识论阐述,详见我的论文《连接知识导论》和《学习网络和连接的知识》。

我从技术层面演示这些法则的主要尝试,出现在Edu_RSS的开发中。Edu_RSS应用了如下理念:从在线学习领域大约500名作者身上采集RSS种子,用不同的方式组合这些种子,然后将它们组织成种子集合加以输出。该系统现在和我的个人网站相结合,也接受读者评论。Edu_RSS这样的系统,就像网络中的一个节点- -最终,网络的各个层次将由其它做着类似事情的服务所创造。关于Edu_RSS的介绍见此。

在概念和设计上和Edu_RSS非常接近的,是这个理念的学生版本,更广为人知的名称是“个人学习环境(Personal Learning Environment,PLE)”。PLE与Edu_RSS不同之处在于,它明确地依赖于外部服务(如Flickr、del.icio.us、Blogger以及其他类似服务)来进行数据的检索和储存。PLE形成的“网络的节点”,实际上虚拟分布在大量的网站上,具备很强的可携带性--甚至可以说,它能在一支记忆棒上得到应用。我正在PLE这个概念上独自进行着研究工作,也在与外部机构合作。

再次强调,这一切工作背后的想法,是将上面整个的讨论联系起来--分布式元数据、内容聚合、分布式版权、身份识别、数据、自治、观察和视角的多元、创造出互联个体“层次”的多重同步连接等等。

学习网络这个项目在理论上、以及超越理论的目的,就是要建立或帮助人们建立各种工具,当它们被大量使用时,将会产生出一个自我组织的网络来。

该网络具备这样的特点:某人需要检索某个资源时(他或她可能知道也可能并不知道现存资源),网络自己会重组织,使得这个资源成为网络中最显眼的资源。这样一个网络永远不需要搜索,它会根据你所处何处、所处何人、所做何事,分分秒秒伸缩、弯曲和重新塑造自己,会一直将某些资源始终看作“首要理念”,随时放到任何环境或工作场所中去。例如,想象一下一个这样的文字处理软件,它会在你输入论文时,向你建议你在那时可能想阅读和使用的参考资料。它工作良好,不会有偏见,也没有背后的商业动机。想象这样一个网络:在你创建出自己的学习资源后,如果打算将其放到开放市场上去销售,它能够立刻准确地告诉你,你的资源价值几何。

这就是我现在的研究工作。

广告位
即刻开始,免费体验 EduSoho 强大功能