利用博弈论的思想提高语言模型的可靠性 | MIT 新闻

利用博弈论的思想提高语言模型的可靠性 | MIT 新闻

24浏览次
文章内容:
利用博弈论的思想提高语言模型的可靠性 | MIT 新闻
利用博弈论的思想提高语言模型的可靠性 | MIT 新闻

想象一下,你和朋友正在玩一个游戏,你们的目标是只用神秘的句子来互相传达秘密信息。你朋友的任务是猜出你句子背后的秘密信息。有时,你会直接给出线索,有时,你的朋友必须通过对你给出的线索提出是非问题来猜测信息。挑战在于你们俩都想确保彼此理解正确并就秘密信息达成一致。

麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员创建了一个类似的“游戏”,以帮助提高人工智能理解和生成文本的能力。它被称为“共识游戏”,涉及人工智能系统的两个部分——一部分试图生成句子(如提供线索),另一部分试图理解和评估这些句子(如猜测秘密信息)。

研究人员发现,通过将这种互动视为一场游戏,让人工智能的两个部分按照特定规则协同工作,就正确的信息达成一致,他们可以显著提高人工智能对问题给出正确和连贯答案的能力。他们在各种任务上测试了这种新的游戏式方法,例如阅读理解、解决数学问题和进行对话,发现它有助于人工智能在各方面表现得更好。

传统上,大型语言模型会采用以下两种方式之一来回答:直接从模型生成答案(生成式查询)或使用模型对一组预定义的答案进行评分(判别式查询),这可能会导致不同的结果,有时甚至不兼容。使用生成式方法,“谁是美国总统?”可能会得到一个像“乔·拜登”这样的直截了当的答案。然而,在评估同一答案时,判别式查询可能会错误地质疑这一事实,例如“巴拉克·奥巴马”。

那么,我们如何协调互相不兼容的评分程序以实现连贯、有效的预测?

“想象一下一种帮助语言模型理解和生成文本的新方法,就像游戏一样。我们开发了一种无需训练的博弈论方法,将整个过程视为一个复杂的线索和信号游戏,其中生成器尝试使用自然语言向鉴别器发送正确的信息。他们使用的不是棋子,而是单词和句子,”麻省理工学院电气工程和计算机科学博士生、CSAIL 附属机构 Athul Jacob 说。“我们驾驭这个游戏的方法是找到‘近似均衡’,从而产生一种称为‘均衡排名’的新解码算法。这是一个非常令人兴奋的演示,展示了如何将博弈论策略融入其中,以解决一些重大挑战,使语言模型更加可靠和一致。”

在阅读理解、常识推理、数学问题解决和对话等多项任务上进行测试时,该团队的算法不断提高这些模型的性能。将 ER 算法与 LLaMA-7B 模型结合使用,其结果甚至超过了规模大得多的模型。“考虑到它们已经很有竞争力,人们已经研究了一段时间,但我们看到的改进程度能够超越规模是其 10 倍的模型,这令人惊喜,”Jacob 说。

游戏开始

“外交”是一款以第一次世界大战前的欧洲为背景的战略棋盘游戏,玩家在游戏中无需使用骰子即可谈判联盟、背叛朋友和征服领土——完全依靠技能、策略和人际操纵。最近,这款游戏再次面世。2022 年 11 月,包括雅各布在内的计算机科学家开发了“西塞罗”,这是一个人工智能代理,可以在混合动机的七人游戏中达到人类水平的能力,这款游戏需要上述相同的技能,但使用自然语言。这背后的数学部分启发了共识游戏。

虽然人工智能代理的历史早于 OpenAI 软件于 2022 年 11 月进入聊天室,但有充分的证据表明,它们仍然可以扮演你善意但病态的朋友。

共识博弈系统以协议的形式达到平衡,确保模型原始见解的准确性和保真度。为了实现这一点,该方法会迭代调整生成组件和判别组件之间的交互,直到它们就准确反映现实并与它们的初始信念一致的答案达成共识。这种方法有效地弥合了两种查询方法之间的差距。

在实践中,将共识博弈方法应用于语言模型查询(尤其是问答任务)确实涉及重大的计算挑战。例如,当使用 MMLU 等包含数千个问题和多项选择答案的数据集时,模型必须将该机制应用于每个查询。然后,它必须在每个问题及其可能答案的生成和判别组件之间达成共识。

该系统确实在解决小学数学应用题方面遇到了困难。它无法生成错误答案,而这是理解得出正确答案的过程的关键要素。

“过去几年,人工智能系统在战略决策和语言生成方面取得了令人瞩目的进展,但我们才刚刚开始研究如何将两者结合起来。均衡排序是朝这个方向迈出的第一步,但我认为我们可以做很多事情来将其扩展到更复杂的问题,”雅各布说。

未来的工作方向之一是通过整合当前方法的输出来增强基础模型。这尤其有前景,因为它可以在各种任务(包括事实性和开放式生成)中产生更符合事实和更一致的答案。这种方法有很高的潜力来显著提高基础模型的性能,从而可以从 ChatGPT 和人们日常使用的类似语言模型中获得更可靠、更符合事实的输出。

“尽管 ChatGPT 和 Gemini 等现代语言模型已经能够通过聊天界面解决各种任务,但从这些模型中生成响应的统计解码过程几十年来一直保持不变,”未参与这项工作的谷歌研究科学家 Ahmad Beirami 表示。“麻省理工学院研究人员的提议是一个创新的博弈论框架,用于通过解决共识博弈的均衡来从语言模型中进行解码。研究论文中报告的显著性能提升令人鼓舞,为语言模型解码的潜在范式转变打开了大门,可能会引发一系列新应用。”

Jacob 与 MIT-IBM Watson 实验室研究员 Yikang Shen 以及 MIT 电气工程与计算机科学系助理教授 Gabriele Farina 和 Jacob Andreas(也是 CSAIL 成员)共同撰写了这篇论文。他们在本月初的国际学习表征会议 (ICLR) 上展示了他们的工作成果,并被评为“焦点论文”。该研究还在 2023 年 12 月的 NeurIPS R0-FoMo 研讨会上获得了“最佳论文奖”。

分类:

游戏新闻

标签:

评估:

    留言