【学习笔记】LLM for Education-编程知识

ChatGPT has entered the classroom: how LLMs could transform education

前言
Introduction
The risks are real
Embracing LLMs
Introducing the AI tutor
Augmenting retrieval
Will it catch on?
总结

前言

一篇来自Nature的文章，探讨了教育行业的不同参与者，如何抓住LLM这个变革性的工具带来的机会，重新改造这项自人类文明诞生以来就存在的行业。文中提出了当前LLM所带来的机遇与挑战，以及讨论了未来教育领域该何去何从。

Paper	https://www.nature.com/articles/d41586-023-03507-3
From	Nature

Introduction

LLM对教育的冲击已经不可阻挡，不论是学生，老师，还是教育机构，乃至教育工具提供商，都应该积极地把握LLM带来的机会，彻底地改变学习和教学的方式，才能应对教育行业即将发生的改变。
教育心理学家Beghetto设计了一系列以创造力为主题的聊天机器人，并将其托管到亚利桑那州立大学的平台上。这些机器人可以扮演各种角色，用于鼓励学生的创造力。Beghetto将这些聊天机器人和一群研究生以及教学专家进行了对话，得到了积极的反馈，一位参与者说，他们以前曾尝试使用ChatGPT来辅助学习，但发现它并不实用，这与Beghetto的聊天机器人不同。
LLM的兴起同样造成了需要教育工作者的担忧，他们认为学生会更容易作弊。因此，Beghetto团队正在探索如何发挥LLM的潜力，作为加强教育的工具，节省学生和老师的时间，让他们更专注于讨论和学习。为了让一对一辅导模式能够大规模应用，Wolfram Research公司目前正在开发一种基于LLM的辅导软件，这种人工智能合作伙伴可以用来引导学生一步一步地解决问题，激发批判性思维，或者像Beghetto的实验那样，提高用户的创造力，扩展思维的边界。

The risks are real

自从ChatGPT推出以来，其在教育领域的应用大部分都是负面的。因为它的回答写的很好，因此学生会常常依赖ChatGPT帮他们做作业，或者快速获取答案，而不去明白其中的道理。此外，ChatGPT还会输出错误的信息，从而误导学生，这就是LLM的幻觉问题。
虽然GPT-4被认为是表现最好的LLM，但是研究发现，它并不擅长回答大学水平的教科书问题，即使是对问题进行分解进行解答也只能带来适度的提升。

Embracing LLMs

尽管困难重重，一些研究人员和教育工作者还是看到了LLM的巨大潜力。有的公司使用ChatGPT的替代品，有的公司想方设法减少不准确性和幻觉，有的公司则通过指令微调等方法来让LLM学习特定学科的知识。所谓“高风险，高回报”，许多教育专家都认为对于LLM强大的能力，社会需要帮助学生了解LLM的优势和风险，而不是一味地禁止他们使用这项技术。2023年9月，联合国教科文组织发布了一份题为《生成式人工智能教育和研究指南》的报告。其主要建议之一是教育机构在使用 ChatGPT 等工具支持学习之前先对其进行验证。
一些公司销售MagicSchool和Eduaide等商业助手，这些工具基于LLM，帮助学校教师规划课程活动并评估学生的作业。此外，学术界也开发了其他工具，比如宾夕法尼亚州立大学计算机科学家Rebecca Passonneau团队创建的PyrEval，用于阅读论文并提取关键信息，并且还能为学生撰写的物理论文进行评分，帮助学生对自己的作业内容进行反思。
在这里插入图片描述

Introducing the AI tutor

一些机构直接使用AI来辅导学生，除了ChatGPT，Khanmigo可能是使用最广泛的基于LLM的教育工具。通过使用GPT-4提供的能力，Khanmigo可以在学生完成练习时为他们提供提示和辅导，从而节省教师的时间。它的呈现形式与ChatGPT不同，它以弹出式聊天机器人形式出现在学生的电脑屏幕上，当学生将自己的问题发送到GPT-4之前，Khanmigo会自动添加一个提示，让GPT-4不要直接给出答案，而是提出很多问题，引导学生自己得到答案。
Khanmigo目前仍处于试验阶段，在有助于学习的问题和难到让学生放弃的问题之间存在着微妙的界限，关键就是在于如何找到这条界线。虽然Khanmigo已经有超过2.8万名教师和学生用户，但是它在问答的过程中，有时候会出错，有时候会直接给出答案。这表明，Khanmigo还有很多值得改进的地方。

Augmenting retrieval

另一种创建AI学习助手的方法是将LLM和严格认证的外部知识语料库结合在一起。比如AI公司Merlyn Mind正在其开源Corpus-qa LLM中使用检索生成方法（RAG），这个LLM面向教育领域。在回答问题时，它会参考特定的语料库，从而减少幻觉和其他错误，此外，如果问题没有高质量的回答，就会坦白说自己不会，并努力做出更好的回答。

华东师范大学的研究人员创建了一款名为EduChat的教育大模型，将论文评估、对话式辅导和情感支持结合在一个大语言模型中。该团队以开放源代码的形式分享了这一工具。尽管EduChat仍处于早期阶段，但它是一个专用的教育LLM，而不是在现有通用模型基础上的套壳工具，这一点值得注意。