利用博弈论的思想提高语言模型的可靠性 | MIT 新闻

24浏览次

米哈游新作《星布谷地》取得中国游戏版号，《动物森友会》竞争品离推出不远了？

勇士队-红人队双打赛第二场比赛推迟

2024 年大西洋卢瓦尔奥运会 - 新闻

Humble Games 裁员 36 名员工进行重组

9 款游戏加入 NVIDIA GeForce Now 服务 - 包括《Skyrim》

最后：《现代战争 3》将于明天登陆 Game Pass

鼓胀！新的 Xbox Game Pass 计划不需要控制台并运行广告。

EA 发布《战地》新作遭强烈反对：“我已经不想玩这个游戏了”

阿曼清真寺袭击：ISIL 的计划是什么？| ISIL/ISIS 新闻

纸牌游戏，400欧元罚款抵达佛罗伦萨 - 新闻

文章内容:

想象一下，你和朋友正在玩一个游戏，你们的目标是只用神秘的句子来互相传达秘密信息。你朋友的任务是猜出你句子背后的秘密信息。有时，你会直接给出线索，有时，你的朋友必须通过对你给出的线索提出是非问题来猜测信息。挑战在于你们俩都想确保彼此理解正确并就秘密信息达成一致。

麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员创建了一个类似的“游戏”，以帮助提高人工智能理解和生成文本的能力。它被称为“共识游戏”，涉及人工智能系统的两个部分——一部分试图生成句子（如提供线索），另一部分试图理解和评估这些句子（如猜测秘密信息）。

研究人员发现，通过将这种互动视为一场游戏，让人工智能的两个部分按照特定规则协同工作，就正确的信息达成一致，他们可以显著提高人工智能对问题给出正确和连贯答案的能力。他们在各种任务上测试了这种新的游戏式方法，例如阅读理解、解决数学问题和进行对话，发现它有助于人工智能在各方面表现得更好。

传统上，大型语言模型会采用以下两种方式之一来回答：直接从模型生成答案（生成式查询）或使用模型对一组预定义的答案进行评分（判别式查询），这可能会导致不同的结果，有时甚至不兼容。使用生成式方法，“谁是美国总统？”可能会得到一个像“乔·拜登”这样的直截了当的答案。然而，在评估同一答案时，判别式查询可能会错误地质疑这一事实，例如“巴拉克·奥巴马”。

那么，我们如何协调互相不兼容的评分程序以实现连贯、有效的预测？

“想象一下一种帮助语言模型理解和生成文本的新方法，就像游戏一样。我们开发了一种无需训练的博弈论方法，将整个过程视为一个复杂的线索和信号游戏，其中生成器尝试使用自然语言向鉴别器发送正确的信息。他们使用的不是棋子，而是单词和句子，”麻省理工学院电气工程和计算机科学博士生、CSAIL 附属机构 Athul Jacob 说。“我们驾驭这个游戏的方法是找到‘近似均衡’，从而产生一种称为‘均衡排名’的新解码算法。这是一个非常令人兴奋的演示，展示了如何将博弈论策略融入其中，以解决一些重大挑战，使语言模型更加可靠和一致。”

在阅读理解、常识推理、数学问题解决和对话等多项任务上进行测试时，该团队的算法不断提高这些模型的性能。将 ER 算法与 LLaMA-7B 模型结合使用，其结果甚至超过了规模大得多的模型。“考虑到它们已经很有竞争力，人们已经研究了一段时间，但我们看到的改进程度能够超越规模是其 10 倍的模型，这令人惊喜，”Jacob 说。

游戏开始

“外交”是一款以第一次世界大战前的欧洲为背景的战略棋盘游戏，玩家在游戏中无需使用骰子即可谈判联盟、背叛朋友和征服领土——完全依靠技能、策略和人际操纵。最近，这款游戏再次面世。2022 年 11 月，包括雅各布在内的计算机科学家开发了“西塞罗”，这是一个人工智能代理，可以在混合动机的七人游戏中达到人类水平的能力，这款游戏需要上述相同的技能，但使用自然语言。这背后的数学部分启发了共识游戏。

虽然人工智能代理的历史早于 OpenAI 软件于 2022 年 11 月进入聊天室，但有充分的证据表明，它们仍然可以扮演你善意但病态的朋友。

共识博弈系统以协议的形式达到平衡，确保模型原始见解的准确性和保真度。为了实现这一点，该方法会迭代调整生成组件和判别组件之间的交互，直到它们就准确反映现实并与它们的初始信念一致的答案达成共识。这种方法有效地弥合了两种查询方法之间的差距。

在实践中，将共识博弈方法应用于语言模型查询（尤其是问答任务）确实涉及重大的计算挑战。例如，当使用 MMLU 等包含数千个问题和多项选择答案的数据集时，模型必须将该机制应用于每个查询。然后，它必须在每个问题及其可能答案的生成和判别组件之间达成共识。

该系统确实在解决小学数学应用题方面遇到了困难。它无法生成错误答案，而这是理解得出正确答案的过程的关键要素。

“过去几年，人工智能系统在战略决策和语言生成方面取得了令人瞩目的进展，但我们才刚刚开始研究如何将两者结合起来。均衡排序是朝这个方向迈出的第一步，但我认为我们可以做很多事情来将其扩展到更复杂的问题，”雅各布说。

未来的工作方向之一是通过整合当前方法的输出来增强基础模型。这尤其有前景，因为它可以在各种任务（包括事实性和开放式生成）中产生更符合事实和更一致的答案。这种方法有很高的潜力来显著提高基础模型的性能，从而可以从 ChatGPT 和人们日常使用的类似语言模型中获得更可靠、更符合事实的输出。

“尽管 ChatGPT 和 Gemini 等现代语言模型已经能够通过聊天界面解决各种任务，但从这些模型中生成响应的统计解码过程几十年来一直保持不变，”未参与这项工作的谷歌研究科学家 Ahmad Beirami 表示。“麻省理工学院研究人员的提议是一个创新的博弈论框架，用于通过解决共识博弈的均衡来从语言模型中进行解码。研究论文中报告的显著性能提升令人鼓舞，为语言模型解码的潜在范式转变打开了大门，可能会引发一系列新应用。”

Jacob 与 MIT-IBM Watson 实验室研究员 Yikang Shen 以及 MIT 电气工程与计算机科学系助理教授 Gabriele Farina 和 Jacob Andreas（也是 CSAIL 成员）共同撰写了这篇论文。他们在本月初的国际学习表征会议 (ICLR) 上展示了他们的工作成果，并被评为“焦点论文”。该研究还在 2023 年 12 月的 NeurIPS R0-FoMo 研讨会上获得了“最佳论文奖”。

利用博弈论的思想提高语言模型的可靠性 | MIT 新闻

相关文章

热门