帮助&资讯

其他 — 一位世界级专家的学习研究关注(一)

2021-02-19 15:41:07

发表时间:2007年3月29日
原文链接:what I’m working on
原文作者:Stephen Downes(blog,web)
翻译:danny
工作组织:教育中文翻译

【说明】Stephen Downes是“教育中文翻译”项目最深入全面介绍的一位学习研究专家,每周五个工作日持续翻译他的邮件列表OLDaily, 还不定期翻译他的重要理论文章。追踪这样一位世界级专家,可以帮助我们了解学习领域最新研究动向,对我们站得更高看得更远会有积极的帮助。本文发表于今年3月,Stephen以blog贴的形式回复单位(加拿大国家研究委员会)内部询问,系统阐述自己当前的研究关注范围,其中链接到了他的其它一些工作成果,有兴趣的读者朋友,也请点击阅读。全文较长,分两次发布。

在这里,我尽可能通俗易懂地描述自己所从事的工作。这不大容易,因为需要将一些独特的概念结合起来,而这些概念自身还在发展中,它们的结合作用尚不清晰。

我工作的核心是基于e-learning的,但不限于e-learning。e-learning面临的挑战,一直都是如何准确地 搜寻和传递合适的学习资源到需要它们的人手中。网络空间相关的议论已有很多。多数情况下,人们都将在线学习资源看作图书馆学习资源的类似物,因而,将搜寻学习资源描述成对资源的搜索和修补问题。从某种意义上看,这是合理的,要想从成千上万的资源中找到某一个,你不靠搜索靠什么?

人们已作出了一些很好的工作成果。语义网(Semantic Web)是其中之一,它最重要的洞见,是学习资源可标准化描述。e-learning中的学习物件元数据(Learning Object Metadata)是87个数据文件组,e-learning设计者们可以在描述自己制作的学习资源时,以XML的格式加以使用。它适应了搜索的需要,不但允许关键词和短语的搜索(这点Google已实现),还允许结构性搜索。如,Google无法发现某个10年级学生的最佳学习资源,但如果有人在上面标注了“典型年龄范围”的标签(tag),这个资源就会被搜索到。

限制来自于数据发掘的技术。不管你的分析多么好,你只有学习资源本身可进行观察。有时,这些资源相当的不清晰, 当我们根据它们彼此的相似性来搜索时,连物理外形上相似的都无法加以区分,更不用说那些内在含义有着巨大差异的资源了。举例说明:在图片库中检查色情照片(无论是出于修补需要或者过滤的考虑,具体操作都是一样的)。问题不但存在于区分色情图片和一场游泳聚会的体育照片之间,也存在于区分色情图片和医学的、人类学的和艺术的图片之间。裸露的身体看上去总是很相似,一张图片到底是科学的还是色情的,由解读来决定,并不由物质载体本身。

在互联网空间里,人们已认识到,这类问题都可以归结到“关系”上。这是可喜的进展,因为研究已经显示,没有人会去理会那87个元数据文件。“推荐系统”是一项与关系相关的技术,它被应用到从音乐选择到数据匹配等各种情况上。推荐系统包含三种类型的数据:资源的描述、个人的描述,具体的评估或排序的信息。 简单说,我们在寻找如下的说明,“象P这样的人,认为象R那样的资源,排序在Q上。” 这就是“筛式过滤(sifter-filter)”的基础,它被弗雷德里克顿(译注:加拿大东南部城市,新不伦瑞克省省会)的人们采纳,建成了RACOFI 协同过滤系统。这是一个包含了RACOFI介绍的相关演示说明,这里是另外一个。

我工作的一部分包含了“资源轮廓(resource profile)”的想法。这是我们项目中所独有的,它的主要观点是:任何资源都有多元化 的视角。同样一本书,可能被描述成厚重的或轻快的,好的或坏的,恰当的或不恰当的,主要看是谁在进行描述。制作书的人往往不是唯一描述书的人,这点很重要,否则,每一本书都将会很“优秀!!” ,这也就是为什么我们需要评论家的原因。更深入地看,我们创造了不同类型的元数据:资源的作者创造的、资源的使用者创造的,以及对它不感兴趣的第三方(评论家和分类学家)创造的。现在,当我们看到不同的资源类型、不同的元数据类型时,情况变得清楚了:任何将元数据看作一份文件 的思考都会产生误导。元数据是我们拥有的关于一个学习物件的知识 --具体的说,就是轮廓 (profile--它时时刻刻发生着变化。论文《资源轮廓》详细探讨了这个问题。

这里的关键认识是:知识有很多作者,有很多个侧面,每个人看它都不一样,它时刻发生着变化。一个知识的片段并不是对某物的描述,只是与某物联系的一种方式。我所说的“了解x是P”,不是对“x”的描述,而是表示“我和x之间的关系”。当我说“x是P”和你说“x是P”时,我们实际上在作两个说明(这就是为什么语义网正走到一个非常昂贵的错误边缘的原因--它是一种基于描述而非关系的知识理论)。这个问题另外一种表述方式是, 我“知道x是P”是描述我如何使用x的一种方式。如果我认为“x是一匹马”,我在按照一种方式使用它;如果我认为“x是一棵树”,我就在按另外一种方式使用它。当我们观察词语(特别是描述学习资源的词语)意义时,这点特别明显。如果我认为“ ‘x’意味着P”,我在按照一种方式使用“x”这个词。如果我认为“‘x’意味着Q”,则我在按照另外一种方式使用它。因此--正如维特根斯坦所说-- “意义是有用的”。

以上一切的结果是,不存在有效的资源发现的描述性 方法,因为对不同的人而言,用来进行描述的词语意味各不相同。在容纳了数万学习资源内容的小型资源库里,你不会注意到这点。但当你进入到数以百万计的学习资源库时,这会成为一个严重问题--考虑到其中可能混杂着人为 错误,用词语误导他人,情况会更加严重。

现在,我们暂停这个话题,来看看别的。

元数据被开发出来后,在信奉语义网的人们手中,它被作为一种描述(description)格式,而在写blog的人们手中,它则被开发成一种聚合(sydication) 格式。也就是说,元数据的关键并不是用来描述一个学习资源,而是将其设置成为一个非常便于携带的、机器可读的格式。这些格式中第一个,也是最重要的一个是RSS。 我涉足RSS已经有很长时间,从它刚出现时就开始,我的feed种子在Netscape Netcenter中的序号是第31号。早期我即看清,聚合将会是传输挑选出来的学习资源到人们手中的最佳方式。这里是我首次提出的建议。

当我们在观察用RSS来聚合学习资源,以及用元数据来描述学习资源时,我们很清楚,内容聚合最好的支持来自分布式 元数据(distributed metadata)。也就是,通过一个RSS种子分布式存在的元数据,连接到了其它 的元数据,这些元数据可以存在于互联网上的任何地方。

根据这点,我们开发出了“分布式数字版权管理(distributed digital rights management)”。在用户或“搜寻者”所搜寻的学习资源元数据中,有一个链接指向了“版权元数据(rights metadata)”--我们用开放数字版权语言(Open Digital Rights Language,ODRL)来加以描述。通过这种方式,RSS元数据可以被送到全世界,分发给任意数目的人们,储存在我们所不知道的某个地方,而版权元数据则一 直在我们身边的服务器上,在我们需要的时候可以任意改变它。既然RSS文件中的版权元数据只是一个标示,这意味着版权信息一直将是实时更新的。这里是几个相关的演示幻灯,对这一概念进行说明。

这就是“创作共用(Creative Commons)”最终采用的机制,允许作者将授权协议附在作品上,可在RSS中附加一个CC声明。其它的标准体系,如“都柏林核心元数据库(Dublin Core)” ,也正在接近这样的版权声明形式,这点超乎人们的想象。毫无疑问,依然存在很大的声音,支持版权信息应该与资源物件随时相伴,以使得该物件“可携带”和“可使用”。这又是个老想法,要了解一个资源物件是怎样的,你必须要打开它,置身其中 。但是,“版权”信息和“知识”一样,会发生很大的变化。一个资源,如猫王的唱片,可能在他在世的某一天值一个价,他过世后的某一天要值双倍价。一张批头士(Beatles)唱片的拥有者,某一天可能转而钟情保罗-迈卡特尼,下一天又将收藏换成了迈克尔-杰克逊。

资源轮廓、聚合、分布式元数据的结合,为我们提供了一个学习资源聚合网络的模型。这里是描述该网络的幻灯和论文。 这就是我们希望eduSource项目发展的方向。不幸的是,不同兴趣的参与者们,决定将要走另外一个方向,把我们的DRM系统搁置了,最终 eduSource失败。但是,如果我们观察今天的RSS网络(现在已包含了数以百万计的种子),以及OAI/DSpace网络(包含了数以百万计的学习资源),我们可以看到,正是这一类型才可能取得成功。

eduSource项目在这儿就到头了。代价高昂的问题依然存在:你的内容网络怎样才能确保合适的学习资源最终落到想要的人手中?

答案是:通过网络组织的方式。因此,网络组织的方式,就成为了学习网络理论的核心。

但是,这意味 着什么呢?

广告位
即刻开始,免费体验 EduSoho 强大功能