人工智能如何预测象棋比赛中可能出现的作弊行为?
Chess.com使用机器学习来预测人类做出某些动作的可能性。 Image: Unsplash/Hassan Pasha
- 在职业象棋界,作弊变得愈发普遍,无论是在实体游戏中还是在线游戏中;
- 世界上最大的国际象棋网站Chess.com对其如何监测棋手是否作弊一事秘而不宣,但它承认使用机器学习来预测人类做出某些动作的可能性;
- 这些机器学习模型可能对于确保参赛选手的诚信至关重要。
几年前,国际象棋网站Chess.com暂时禁止美国特级大师Hans Niemann在线下棋,因为该网站怀疑他的棋步是由计算机程序建议的。据报道,此前他的导师Maxim Dlugy也曾被禁赛。
而在本月初的辛克菲尔德杯上,世界冠军Magnus Carlsen在与19岁的Niemann对弈时败下阵来,没有发表任何意见就退赛了。他后来说,这是因为他认为Niemann最近还在继续作弊。
另一位参赛者,俄罗斯超级大师Ian Nepomniachtchi称,尼曼的表现 用“令人印象深刻”来形容都不够。虽然Niemann承认在以前的在线游戏中有时会作弊,但他强烈否认曾在现场的国际象棋比赛中作弊。
但是世界上最大的国际象棋网站Chess.com是如何判断一个玩家是否作弊的呢?该网站表示不能向世界展示它所使用的代码,否则可能的作弊者会知道如何避免被发现。
“虽然法律和实际考虑使Chess.com不能透露用于评估公平竞赛工具中的全部数据、指标和跟踪方式,但我们可以确认,Chess.com系统的核心是一个统计模型,评估了人类棋手与引擎的最佳选择相匹配的概率,从而判断其是否逾越了历史上最伟大棋手所确认的‘干净’的棋步。”
幸运的是,研究可以阐明该网站可能使用的方法。
人类对战人工智能
人工智能公司DeepMind开发了可以玩战略游戏围棋的程序AlphaGo,他们教导AI预测人类在任何给定的棋局中会走哪些棋步。
预测人类动作是一个监督学习问题,是机器学习的重中之重。给出人类游戏中大量的棋局实例(数据集)和每种情况下的人类棋步实例(标签),机器学习算法就可以被训练来预测新数据点的标签。因此,DeepMind教它的人工智能估计人类从任何给定位置走任何给定棋步的概率。
著名的AlphaGo在2017年击败了人类对手李世石。该人工智能在比赛中的一个著名棋步是 “第37步”。正如首席研究员David Silver在纪录片《AlphaGo》中指出的那样,“AlphaGo说,人类棋手下出第37步的概率仅有万分之一”。
因此,根据人类围棋选手的机器学习模型,如果你看到一个人走出了第37棋,这可能不是他们自己的决定。但当然,这并不是铁证。
要确信某人在游戏中作弊,你必须查看大量的棋步。例如,研究人员已经探索了如何对一个玩家的大量动作进行集体分析以发现异常情况。
Chess.com公开使用机器学习来预测人类在任何给定的棋局中可能采取的行动。事实上,它有针对个别著名棋手的不同模型,你可以和他们展开真实的博弈。据推测,类似的模型被用来检测作弊行为。
最近的一项研究表明,除了预测人类走某一步棋的可能性之外,还必须考虑到这一步棋有多好。这也正是Chess.com所表示的:评估该走棋方式是否“超过了伟大的棋手所确认的‘干净’的下法”。
但如何衡量哪些棋步更好呢?理论上,一个棋局要么是“赢”(你可以保证赢),要么是“输”(对手可以保证赢),要么是“和”(双方都不能保证),而好棋就是任何不会使你的局面变坏的棋。但实际上,尽管计算机在计算和选择未来棋步方面比人类强得多,但对于许多棋局来说,甚至连它们也无法确定是赢、输还是和。它们当然也不可能证明这一点——证明通常需要太多的计算,需要检查指数型对局树的每一片叶子。
因此,人类和计算机所做的是使用“启发式方法”(直觉猜测)来评估不同位置的“价值”——估计他们认为哪个玩家会赢。这也可以看作是一个机器学习问题,数据集是大量的棋盘位置,标签是谁赢了——这就训练了算法来预测谁会从一个给定的棋局胜出。
通常,用于这一目的的机器学习模型会对接下来可能的几步棋做一些思考,考虑哪些位置是双方都可以走的,然后利用对这些未来位置的“直觉”来告知它们对当前棋局的评估。
但谁能从一个给定的棋局中获胜,取决于球员的水平如何。因此,模型对某一特定棋局的评价将取决于是谁在参与这些将会进入数据集的棋局。通常,当国际象棋评论员谈论不同棋步的“客观价值”时,他们指的是当双方由现有的最好的国际象棋人工智能对弈时,谁有可能从一个给定的棋局获胜。但在考虑人类棋手最终必须执行的局面时,这种价值的衡量标准并不总是最有用的。所以并不清楚Chess.com(或我们)到底应该认为什么是“好棋”。
如果我在国际象棋中作弊,走了国际象棋引擎建议的几步棋,它甚至可能不会帮助我获胜。那几步棋可能是为我准备的一次绝妙的攻击,而我永远不会想到,所以我会把它浪费掉,除非我要求国际象棋引擎为我下完这盘棋。(Lichess.org告诉我,在写这篇文章时,我已经下了3049盘闪电战,而我的ELO等级分不是很高,只有1632,这意味着你能预期我将会错过好的战术。)
监测作弊是很难的。如果你在网上玩,你想知道你的对手是否作弊,你真的无法断定——因为你没有见过数以百万计的人类游戏,其风格完全不同。因此,在这个问题上,用大量数据训练机器学习模型具有很大优势。而这可能对国际象棋比赛的诚信度至关重要。
本文作者:
Michael K. Cohen,牛津大学工程系博士生
本文与The conversation合作发布。本文原载于世界经济论坛Agenda博客,转载请注明来源并附上本文链接。
翻译:张一凡
编辑:王思雨
不要错过关于此主题的更新
创建一个免费账户,在您的个性化内容合集中查看我们的最新出版物和分析。
许可和重新发布
世界经济论坛的文章可依照知识共享 署名-非商业性-非衍生品 4.0 国际公共许可协议 , 并根据我们的使用条款重新发布。
世界经济论坛是一个独立且中立的平台,以上内容仅代表作者个人观点。
分享:
每周 议程
每周为您呈现推动全球议程的紧要问题(英文)