ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
# 记忆研究总结 [TOC=2,5] ## 关于间隔重复研究的问题 [间隔重复](https://supermemo.guru/wiki/Spaced_repetition)的研究历史,饱受下列因素的困扰: - 用猜测和启发式方法来代替数学优化 - 理论和实践之间缺乏互动,科学侧重于简单实验,实践侧重于简单工具 - 术语不一致,结果陷入遗忘和重新发现实验结论的循环! 上述内容与我对**[失败的因素](https://supermemo.guru/wiki/Why_spaced_repetition_research_kept_failing%3F#Formula_for_research_failure)**的排名一致。除非个人电脑和网络现身,否则人们很难摆脱这种恶性循环。 ## 间隔重复直觉 当我们问青少年一组关于他们的记忆是如何工作的问题时,很大一部分人在没有进行任何测量的情况下,就能很好地猜测出重复间隔。特别是,他们经常正确地猜测第一个最佳间隔可能是 1-7 天,并且连续的间隔会增加。此外,许多人可能会猜测第二个间隔可能是一个月,而且连续的间隔可能会增加一倍。换句话说,**间隔重复是一种常见的直觉**。 ## 早期记忆研究 1885 年,[赫尔曼·艾宾浩斯](https://supermemo.guru/wiki/Hermann_Ebbinghaus)对记忆科学做出了重大贡献。他在自己身上做了实验,提出了[遗忘曲线](https://supermemo.guru/wiki/Forgetting_curve)的第一个轮廓。他也知道[间隔效应](https://supermemo.guru/wiki/Spacing_effect)。他从未研究过[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)。我认为赫尔曼没有启发过我的[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)研究,因为我根本不知道赫尔曼是谁,他完成了什么。我[设计了自己的测量方法](https://supermemo.guru/wiki/Birth_of_SuperMemo),并由此发现[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)。在一个与赫尔曼无关而且我早已遗忘的练习中,我也制作了[我自己的遗忘曲线](https://supermemo.guru/wiki/why_spaced_repetition_research_kept_failing%3f#forgetting_curve_1984),这件事可能影响了我的思考。赫尔曼的曲线要陡峭得多,实际上可能会阻碍进一步的研究(参见:[艾宾浩斯遗忘曲线的错误](https://supermemo.guru/wiki/Error_of_Ebbinghaus_forgetting_curve))。我们亚当·米基维奇大学的图书馆里有大量二战前的「古代」德国文学,但我不懂德语。我懵懵懂懂,独自前行。后来我读到了关于艾宾浩斯的文章,并在我的[硕士论文](https://supermemo.guru/wiki/Master's_Thesis)中提到了他的[遗忘曲线](https://supermemo.guru/wiki/Forgetting_curve)。 到 1901 年,在威廉·詹姆斯所写的文章中,间隔复习的优越性显而易见,似乎间隔重复渗透各种学习理论仅仅是时间问题,而对间隔的优化很显然就是下一步。但结果却并非如此。又过了 80 年。 C. A. 梅斯于 1932 年出版的畅销书中,提出了一个简单的[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)时间表:1 天,2 天,4 天,8 天,等等。猜得不错!然而,梅斯的努力被人遗忘了,因为在互联网时代到来之前,[「口袋里的明信片」上的间隔重复](https://supermemo.guru/wiki/SuperMemo_on_paper)肯定没什么吸引力。为了有一个好的开始,梅斯必须用自己的好榜样来鼓励别人。他把他关于有效学习的优秀思想描述为一种理论。他从未提及自己的经历。在那个时候推广一个新想法可能并不容易。希特勒成了新闻的主角。也许间隔重复记忆理论的进步是纳粹的又一个受害者? ## 20 世纪 60 年代:文艺复兴 1966 年,赫伯特·西蒙瞥见了[约斯特定律](https://supermemo.guru/wiki/Jost's_law),该定律在 1897 年左右从[艾宾浩斯](https://supermemo.guru/wiki/Ebbinghaus)的著作中衍生出来。西蒙注意到,[遗忘的指数性质](https://supermemo.guru/wiki/Exponential_nature_of_forgetting)说明有一个记忆属性必然存在,今天我们称之为记忆稳定性。西蒙写了一篇[简短的论文来解释他的想法](https://supermemo.guru/wiki/Herbert_Simon_predicted_two_component_model_of_memory),然后开始着手于他脑海中成百上千的其他项目。他的文章基本上被遗忘了。 大约在同一时期,[罗伯特·比约克](https://supermemo.guru/wiki/Robert_Bjork)在学习和记忆方面有很多创新的想法。正如经常发生的那样,他走在了时代的前面。老师们几乎从不听心理学家的话。学生们甚至不知道心理学家的名字。如果比约克是一个程序员,我们可能早在十年前就有了第一个流行的间隔重复应用程序。我想他不会放过任何一个好主意。比约克似乎是第一个明确区分检索强度和存储强度的人,而他使用的模型类似于我们的[记忆双变量模型](https://supermemo.guru/wiki/Two_component_model_of_memory)的模型。 1967 年,[保罗·皮姆斯勒](https://en.wikipedia.org/wiki/Paul_Pimsleur)清楚地注意到间隔重复可能是学习语言学习中单词对的伟大工具。就像 SuperMemo 一样,他在术语上遇到了困难,使用了「[渐进间隔回忆](https://supermemo.guru/wiki/Alternative_terms_for_spaced_repetition)」这个术语。在我们的「[锯齿状遗忘曲线](https://www.supermemo.com/pl/blog/diebbinghaes-invent-spac-repetition)挑战」中,皮姆斯勒与图中所示的最早的锯齿曲线曲线最为接近: [![Pimsleur's serrated curves](https://supermemo.guru/images/5/53/Pimsleur_serrated_curves.jpg)](https://supermemo.guru/wiki/File:Pimsleur_serrated_curves.jpg) 也许我们会发现这个想法的早期草图,然而,由于技术原因,图线制作的时间越早,内容也就越少,而我们今天用 Excel 就能轻松绘制大批图线。 皮姆斯勒的间隔时间拓展为数小时、数分钟甚至数秒。这是直觉的反映,而不是测量。他将他的推理从容易测量的陈述性知识(如单词对)扩展到程序性知识和声音模式识别,如学习发音。[SuperMemo](https://supermemo.guru/wiki/SuperMemo) 解决了这个问题,它将单词对学习从发音、拼写、识别、同义词等方面分离出来。因此,在 [Advanced English](https://supermemo.guru/wiki/Advanced_English) 中,我们从不需要减少超出用户标准启动[稳定性](https://supermemo.guru/wiki/Stability)的时间间隔,它很少下降到一天以下。由于实际原因和[睡眠的作用](https://supermemo.guru/wiki/Science_of_sleep), SuperMemo 从不使用短于 1 天的间隔。睡眠也是该算法在时间间隔长度上使用天为间隔的主要原因。SuperMemo 可以让你在一天内复习很多次,但是这是一个子集复习的一部分,偶尔会有用(比如考试前的死记硬背)。与梅斯和纸上的 SuperMemo([算法 SM-0](https://supermemo.guru/wiki/The_birthday_of_spaced_repetition:_July_31,_1985#First_spaced_repetition_algorithm:_Algorithm_SM-0.2C_Aug_25.2C_1985))的推荐间隔不同。它们不是测量的结果,而是推测的结果,从可靠到不可靠。皮姆斯勒想确保 60% 的保留率,这在 SuperMemo 的标准下是非常低的。他打赌启动稳定性是 5 秒,而 SuperMemo 使用 1-15 天,这对于 90% 的良好的知识回忆来说是可以的。皮姆斯勒的区间指数基数([E-系数](https://supermemo.guru/wiki/E-Factor))是 5,在大多数情况下应该是 1.4-2.5。因此,皮姆斯勒的间隔与 SuperMemo 的间隔有很大的不同,不应该用作算法度量的基准。在他的原始论文(1967)中,皮姆斯勒建议间隔 5 秒、25 秒、2 分钟、10 分钟、1 小时、5 小时、1 天、 5 天、25 天、4 个月和2 年。差异主要来自于基于不同性质材料的实践(相当于 SuperMemo 中的高[复杂性](https://supermemo.guru/wiki/Complexity))。秒、分和小时的使用相当于[死记硬背](https://supermemo.guru/wiki/Cramming),在 SuperMemo 中强烈不鼓励使用。相反,建议优化[知识表示](https://supermemo.guru/wiki/20_rules)。 1969 年,阿尔弗雷德·马克西莫维奇写了《阅读与思考》。你在你的图书馆里找不到他的书。这本书是用波兰语写的,面向的是一小部分技术大学的学生。它提到了间隔重复,遗忘曲线,甚至遗忘指数可能决定最佳间隔。马克西莫维奇提出的第一个最佳间隔为 3 天。就像之前和之后的许多努力一样,这个好建议在很大程度上仍然被忽视。学生们急于通过考试,然后就忘记了。[临时抱佛脚](https://supermemo.guru/wiki/Cram_and_dump)是一个原则,学校的压力会通过这个原则毁掉长期良好学习的前景。我之所以知道马克西莫维奇的书,是因为我在波兰的一所技术大学学习过,而且我对自己的间隔重复方法很感兴趣。我只能想象,有几十个类似的文本中,直觉被表述为一个好建议,然后仍然被大众忽视。如果没有时间和空间的巧合,将来关于间隔重复的文章可能永远不会注意到马克西莫维奇曾经存在过。马克西莫维奇的灵感可能来自皮姆斯勒、梅斯、他自己的直觉,或者其他我不知道的潜在文本。马克西莫维奇给扎弗拉涅克的话以自信,[对 SuperMemo 表示怀疑:「一切都发生过」](http://www.super-memory.com/articles/users/szafraniec.htm)。 ## 1972 年:莱特纳盒 在 SuperMemo 之前,在间隔复习领域最大的实践和算法上的成功要归功于[塞巴斯蒂安·莱特纳](https://en.wikipedia.org/wiki/Sebastian_Leitner)。1972 年,他提出了**莱特纳盒子系统**。在莱特纳系统中,抽认卡被按优先级排序,并被转储到对应不同[稳定性](https://supermemo.guru/wiki/Stability)级别的盒子中。与之前提出的理论建议相比,莱特纳系统有一个巨大的优势:它是实用的。这是一个任何人都可以使用的系统,几乎不需要介绍。即使是写在纸上的 SuperMemo(1985) 相比之下也显得复杂。 [![An alternative method of Leitner System where incorrect answers are only moved back by one box](https://supermemo.guru/images/4/4d/Leitner_system.png)](https://supermemo.guru/wiki/File:Leitner_system.png) > 图:一个错误的[莱特纳系统](https://supermemo.guru/wiki/Leitner_system)变种,不正确的回答只往回移一个盒子(来源:Wikipedia)。这个变种在 Duolingo 中使用了一段时间 **莱特纳盒子不是一个间隔重复工具**。它是一个排序工具。没有间隔的概念,更不用说[最优间隔](https://supermemo.guru/wiki/Optimum_interval)。盒子的名称来源于最初的实现,以物理闪卡盒的形式出现,与时间无关。当莱特纳盒子定期用于一个小型的抽卡片集合时,它会模拟[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)的行为。如果间隔太短,就会导致[死记硬背](https://supermemo.guru/wiki/Cramming)。如果太长,就会导致次优结果。然而,在 SuperMemo,低优先级的材料也可能周期性推迟,并产生很长的间隔,这会降低预期的[稳定性增长](https://supermemo.guru/wiki/Stability_increase),但对于记忆时间较长的卡片,[稳定性增长](https://supermemo.guru/wiki/Stability_increase)会变得较大。在 20 世纪 90 年代和新千年之初,莱特纳系统被用于许多成功的闪卡应用。随着他们不断修改和改进复习程序,这些应用程序实际上可能已经发展成为一个成熟的间隔重复系统。即使他们的应用由于 SuperMemo 的被证明容易实现且非常优秀的 [SM-2 算法](https://supermemo.guru/wiki/Algorithm_SM-2)的流行愈发减少。 莱特纳盒子系统较新的软件版本可能会将间隔附加到优先级盒上,例如第 5 个盒子需要 16 天,但是这种方法的缺陷无异于[死记硬背](https://supermemo.guru/wiki/Cramming):(1)失败仍会导致间隔的回归,但这应导致重新学习;(2)第一个月重复 5 次,不能很好地与组织良好的知识相配,组织良好的知识可以在第一个月减少 60-80% 的学习成本。(3)需要更多的盒子。在 SuperMemo 中,我们看到[间隔时间](https://supermemo.guru/wiki/Interval)远远超过了人类的最长寿命。对应用程序的使用寿命需求增加了 200%。这是永久记忆间隔与 16 天之间的差异。 需要额外的 11 个盒子来覆盖 [EF](https://supermemo.guru/wiki/E-factor) 为 2 的使用寿命。 如今,最流行的语言学习系统之一是 Duolingo。很长一段时间,它都使用莱特纳系统。如今,他们采用了基于[可提取性](https://supermemo.guru/wiki/Retrievability)预测的新算法。然而,他们仍然使用莱特纳系统作为基准。更糟糕的是,他们的基准使用了优先级盒中的抽认卡的反向传输(在这里,遗忘后的稳定性被高估了)。[归一化莱特纳](https://supermemo.guru/wiki/Leitner_box)可以作为一个基准,然而,简单的归一化相当于使用 EF 为 2,可能会产生与选择 EF 为 1.6 不同的结果。在未来,所有的算法都应该转换到一个由 SuperMemo 提出的通用度量,并且 [SM-2](https://supermemo.guru/wiki/Algorithm_SM-2) 可能成为一个有用的度量基准,可以与专用解决方案并行实现。我希望用户在这方面要求清楚、统计、度量和完全开放。顺便说一句,如果您碰巧使用了[SuperMemo 17](https://supermemo.guru/wiki/SuperMemo_17) 版本 17.4,您可以将 [SM-17](https://supermemo.guru/wiki/SuperMemo_17) 与莱特纳系统、皮姆斯勒和 [SM-2](https://supermemo.guru/wiki/Algorithm_SM-2) 进行比较。不用说,如果您的[集合](https://supermemo.guru/wiki/Collection)足够大,[差异相当惊人](https://supermemo.guru/wiki/Universal_metric)。 在 20 世纪 70 年代,托尼·布赞通过思维导图创新专注于结构化知识。矛盾的是,思维导图和 SuperMemo 会因为缺乏统一的理论而产生冲突。简而言之,我们需要好的模型来理解这个世界,我们需要间隔重复来长期保留模型的组成部分。布赞也有他自己的想法,那就是如何将复习间隔开。当他在 20 世纪 90 年代初第一次见到 SuperMemo 时,他立刻同意了这个概念,然而,他总是更喜欢关注知识结构而不是简单的回顾。 ## 20 世纪 80 年代:SuperMemo 1982 年,我自己的作品进入了人们的视野,那时我真的受够了没完没了的遗忘过程。我想学习生物化学和生理学。我会读书,做笔记,可是都怪遗忘,一切都是白费功夫。即使是最重要的事实也可能在最不幸的时刻(如考试)被遗忘。我决定采用[主动回忆](https://supermemo.guru/wiki/Active_recall)。我不单单做笔记,而是把笔记写成问题和答案的形式。我可以把答案盖上,并使用主动回忆来回答。这个做法极大地改善学习效果。这也就是 SuperMemo 直到今天的学习方法。这个新方法对我提高我对学习的热爱有很大的积极影响。 到 1984 年,我已经熟练地掌握了主动回忆法。我由此知道复杂的问题是行不通的。如果答案太过冗长,例如,列一张长长的答案清单,你就会总是忘记。这将是徒劳的学习。我后来把这种对简单性的追求称为「[最小信息原则](https://supermemo.guru/wiki/Minimum_information_principle)」。今天,这一原则是首个知识表述的 [20 条规则](https://supermemo.guru/wiki/20_rules)之一。 真正的突破出现在 1985 年,即[艾宾浩斯](https://supermemo.guru/wiki/Ebbinghaus)关于记忆的论文发表 100 年后。我想检查一下间隔是如何影响回忆的。我需要找出重复之间的最优间隔的长度。显然,这些间隔是存在的。我只需要测量它们。实验过程[在这](https://supermemo.guru/wiki/The_birthday_of_spaced_repetition:_July_31,_1985#Experiment)。这个实验简单、粗糙、懒惰、仓促。6 个月后,我制定了第一个 SuperMemo 算法,而不是花几年时间让耐心找出所有的细节。你可以称它为第一个有点科学的间隔重复。我的研究是基于个人和一种学习材料,但它足够普遍,多年后有许多忠实的用户。在 [1985 年 7 月 31 日](https://supermemo.guru/wiki/Birth_of_SuperMemo),我开始使用新的方法学习生物化学。这是使用计算机的间隔重复的生日。计算机程序 [SuperMemo for DOS](https://supermemo.guru/wiki/SuperMemo_for_DOS) 出现于 1987 年,[SuperMemo](https://supermemo.guru/wiki/SuperMemo) 这个名字提出于 1988 年。 在 20 世纪 80 年代,贾普·穆尔的[记忆链模型](https://supermemo.guru/wiki/Memory_Chain_Model),是早期的一些模型中,颇有可能推导出实打实的[间隔重复](https://supermemo.guru/wiki/Spaced_repetition)算法的一个。这个模型甚至有自己的早期应用——《尼莫船长》(Captain Mnemo)——这一应用可能与 SuperMemo 在这一领域展开竞争。Captain Mnemo 和 OptiLearn 说明了,为什么在学术界中,提出伟大的理论之后,扩大其影响力的实践往往无法跟上。 在 1991 年,[SuperMemo World](https://supermemo.guru/wiki/SuperMemo_World) 成立了,它的成立故事在[这里](https://supermemo.guru/wiki/Employing_forgetting_curves_in_spaced_repetition_(1991))。从那时起,[间隔重复的扩展态势已经呈指数级](https://supermemo.guru/wiki/Exponential_adoption_of_spaced_repetition)。到 1999 年,我们开始使用「间隔重复」这个术语来代替「SuperMemo 方法」。有关 SuperMemo World 的最新进展,请参见[此处](https://www.supermemo.com/en/blog)。