综合

这篇文章告诉你AlphaGo隐藏弱点

作为战胜了人类围棋冠军的人工智能,AlphaGo强在小范围战斗,弱点在于对全局的判断。

李世石如何赢?从科技角度看,李世石必须在开局阶段建立优势,并且最好能够更频繁转移战场范围;未来,AlphaGo 会将人类棋手远远甩在身后。它就只能继续和自己玩了。

一、AlphaGo 是如何决定下每一步棋的?

企鹅智酷没有能够真的打开 AlphaGo 代码库,去检查它全面的运行逻辑。我们只能从已公开的权威论文中,来梳理这个迄今为止走进公众视野的最强大人工智能,是如何做出决策,战胜人类的。

简单说,AlphaGo 下的每一步棋,都依赖于概率。

1.当一开始,棋盘有大量空白区域,棋子较少时,AlphaGo会更愿意采用“固定策略”。

这种策略来自于 AlphaGo 自己模拟训练的数百万场棋局。这让 AlphaGo 心中有一个大概的最佳选择可能性,即下在点A和点B,哪个更好些。

在这个时候,AlphaGo 是通过经验来判断的。虽然这个经验不来自与人类,而是来自于它结合人类下棋方式学习后,自己和自己对弈的数百万经验值。但这种基于经验的判断,是人类挑战它的最佳机会——和“恐怖”的机器推演能力相比,经验,起码离人类更近一些。

为什么 AlphaGo 不在一开始就用蒙特卡罗算法,尽量穷尽所有可能性,去给出更可靠的“计算答案”,而不是“经验答案”呢?

我们猜测,一方面是当棋局尚未真正交锋时,各种选择的概率差不多,没必要做精确计算;另一方面,也为了节省时间。

2.当棋局有局部拼杀时,AlphaGo 的战力就升级了。棋局瞬息万变,李世石的下法,很可能是 AlphaGo 没有模拟过的。

这时候,AlphaGo 会不再聚焦于整个棋盘,而将计算精力缩到一个小范围。它会启动现场演算推理功能,即开始计算每一个落子位置的后续走势,来计算最佳一步。

这需要时间。所以,AlphaGo 在短兵相接时,不得不缩小观察范围,在局部启动现场计算。这虽然失去了一定的“大局观”,但换来了计算的效率,和电脑比,人脑的纯粹计算力是相对弱势的,所以,短兵相接,机器占大优势。

3.当局势需要兼顾大局和计算力时,AlphaGo 怎么办?

开局布局,AlphaGo 用经验;短兵相接,AlphaGo 用计算力。那么在局势复杂时,AlphaGo 的另一个特长就有用武之地了——兼顾大局观和计算能力。

AlphaGo是如何下棋的,AlphaGo 模拟了两个“自己”,然后随机落子计算每个位置对赢棋的价值。这种简单粗暴的计算是人类大脑无法训练的,只有机器可以肆无忌惮的这么做。

但和穷尽推演相比,这种价值估算并不是完全准确的。它是在兼顾时间和效率基础上,一种最适合的策略。这也是 AlphaGo的一个弱点。

二、AlphaGo 也会怀疑自己

我们觉得人机对战对李世石不公平的一个地方,是机器人不会受情绪影响,而人类棋手却时常受困于其中。

从单一棋局看,AlphaGo 每一步,都是它认定的最佳决策。但当你通过多局去观察 AlphaGo 时,会发现它快速分析促进它的进化。

原理很简单。AlphaGo 会怀疑自己,是因为在很多局面选择时,最优解不止一个,或者比较接近。

如果点A赢了,以后它会一直选择点A吗?这个我也不清楚,论文里没说。但从逻辑上推断,既然是经过了百万棋局的演算,那么一局的胜负,对于具体某点的概率提升,不会太明显。所以,AlphaGo 在应对同样局面时,它可能给出完全不同的下法——根据几个最优解,随机选择。

而这一点,也正是它可怕之处。连开发它的人类,都无法预测它的行为。因为你把随机函数的权利,交给了人工智能自己。

三、AlphaGo 为什么极少下臭棋?

我们通常把人工智能比作”高智商婴儿“,按照这个推断,AlphaGo 就算表现惊艳,但应该也会有下臭棋的时候。因为单纯的人工智能,是无法真的模拟人类思维的。

但 AlphaGo 没有丢过人。因为在一开始,它并非完全的“自学”。工程师们安排 AlphaGo 在网络对战平台上,与人类棋手不断下棋,用来学习人类下棋的风格和方式。当工程师们觉得 AlphaGo 足以“像个人类棋手”时,才让它开始自己和自己更疯狂的练棋。

你如果很早在KGS(网络围棋对战平台)上遇到过 AlphaGo ,那么,你可能有幸看到过 AlphaGo 还是婴儿时的样子。

四、AlphaGo 自己训练自己,而且效率吓人

前面提到了,和人类练棋不同,AlphaGo 在学会了人类下棋方式后,复制了两个自己,依托计算机性能优势,不断下棋,去丰富对局面判断力。这种效率非常之高,甚至已经超越了人类历史上所有的对弈棋局总数量。

这意味着 AlphaGo 会越来越”老练“。虽然它还是无法在每一局的每一步中,穷尽所有可能性,但它会不断通过训练积累大局观,而随着大局观提升,在实战中,它需要做现场精准推演的效率也会更聚焦——人类也就越来越难赢它。

在可以预见的未来,AlphaGo 会将人类棋手远远甩在后面。然后,它就只能在自己的世界里,自己和自己下棋玩了。

 

 

 


【责任编辑:赵洪】

春运“小桔灯” 把温馨“种”在旅客回家路

他们是一支聚焦服务旅客出行的志愿者队伍,由车站工作人员和大学生志愿者组成,服务覆盖进站、安检、检票、出站、换乘等重点乘车环节,被称为“小桔灯”志愿

国家医保局亮剑精神疾病医疗乱象,本周完成全国医疗机构集体约谈

医保监管风暴来袭,精神疾病诊疗机构迎来全面体检。国家医保局2月4日发出紧急通知,要求各省级医保部门本周日前完成对辖区内所有精神疾病类医保定点医疗机构的集体约谈。这项举措旨在严厉打击违法违规使用医保基金乱象,以近期媒体曝光的湖北省襄阳市、宜昌市部分医疗机构问题为反面教材,开展全行业警示教育。此次约谈范围涵盖所有精神类定点医疗机构,包括综合医院精神科。各机构主要负责人将面对

“乡村好房子”创新论坛暨京津冀超低能耗建筑产业发展大会圆满落幕

近日,康居时代“乡村好房子”创新论坛暨京津冀超低能耗建筑产业发展大会在北京盛大启幕。本次大会由京津冀超低能耗建筑产业联盟农村工作部主办、北京康居时代科技发展有限公司承办,汇聚了京津冀及周边地区住建、农业农村、发改等相关部门代表、行业权威专家、知名企业负责人、金融机构代表及乡村业主代表等各界力量。

春运首日 武铁精心守护旅客安全有序出行

立足岗位,以不同方式守护旅客平安有序温馨出行。凌晨时分,华中地区最大的动车组检修基地——武汉动车段灯火通明。这里承担着京广高铁、郑渝高铁、荆荆高铁、武宜高铁等线路的动车组检修任务,动车组运行范围覆盖全国50余个主要城市,被形象地称为“动车医院”。今年春运,武汉动车段配属的258组

重庆“阴阳菜单”宰客被查实!官方零容忍,涉事饭店停业整顿、退还费用

相同菜品差价达数十元,市场监管部门以“零容忍”态度责令其停业整顿并退还消费者费用。重庆市沙坪坝区市场监督管理局发布通报,对近日网传的“阴阳菜单”事件作出正式回应。经查,涉事饭店使用标价不一致的两种菜单行为属实。目前立案调查已终结,市场监管部门已责令该饭店停业整顿,退还费用,并将根据调查情况依法依规严肃处理。--

衡德高速公路改扩建项目荣获京津冀交通一体化劳动竞赛优秀项目

近日,2025年度京津冀交通一体化(河北赛区)重点建设项目劳动竞赛优秀项目名单公布,衡水至德州高速公路改扩建项目名列其中。全省共有13个项目获奖。衡水至德州高速公路改扩建工程起自衡德高速邓家庄枢纽互通,终于衡德高速冀鲁界南运河,作为冀东南地区重要的交通通道、衡水市规划高速公路网中“一环、两纵、三横”的重要组成部分

全国铁路明日调图 武汉首开往返呼伦贝尔图定旅客列车

1月26日零时起,全国铁路首次调整2026年列车运行图,中国铁路武汉局集团有限公司同步对列车运行图进行优化调整。调图后,武铁分界口图定客货列车总对数为1540.5对、较现图增加22对,其中分界口客车总对数803.5对,客货运输能力和运行效率进一步提升。

分化世界中寻求合作 | 达沃斯2026:直面“新的竞争时代”

达沃斯白雪皑皑的山谷间,全球领袖们在一个充满地缘政治紧张的世界中寻找共同立场,中国声音为多边合作带来希望。世界经济论坛2026年年会今天在瑞士达沃斯开幕。来自130多个国家和地区的近3000名政商学界代表齐聚这座雪山小镇,在“对话的精神”主题下,探讨处于十字路口的世界经济前景。论坛总裁博尔格·布伦德坦言:“年会将在全球自二战以来最复杂的地缘政治背景下举行。” 随

包钢爆炸事故再现“安全周期律”,6年21起事故暴露管理沉疴

巨型球罐炸飞数公里,2死8失联84伤的惨痛代价背后,包钢集团6年内已发生21起安全事故,整改措施未能触及本质。1月18日15时03分,包钢股份板材厂炼钢作业部一个650立方米的饱和水、蒸汽球罐发生爆炸。截至19日,事故已造成2人死亡、8人失联、84人受伤,其中5人重伤。爆炸现场升起形似蘑菇的巨大白烟,冲击波震碎周边数公里内居民玻璃。事发监控画面显示,有巨大球状物

多地彻查“全网最忙五人组” 问责77人

从政府项目评审专家到行政执法处罚对象,从公益项目受助者到学术期刊编委,张吉惟、林国瑞、林玟书、林雅南、江奕云这五个源自网络人名大全的虚构角色,在过去四年间“活跃”于湖北、浙江、辽宁等四省多个官方公示文件中,被网友称为“全网最忙五人组”。事件曝光后引发社会对形式主义、官僚主义的强烈关注。1月15日最新追踪报道显示,多地已完成核心调查工作,累计问责77人,涉案资金全部追缴归还

企业年金新规落地:中小微企业职工迎来“第二养老金”

2026年开年,企业年金普惠制改革破冰,灵活缴费与简易程序为亿万职工铺就补充养老之路。1月15日,人力资源社会保障部、财政部联合发布《关于进一步做好企业年金工作的意见》,标志着我国补充养老保险制度进入普惠发展阶段。新规通过简化程序、灵活缴费等举措,旨在将企业年金覆盖面扩展至各类社会组织及中小微企业职工。截至2025年三季度,全国企业年金积累基金规模已达4.0

琼深社工携手启新程 共绘自贸港发展蓝图与民生暖心图景

岁序常易,华章日新。1月9日,海南省社会工作联合会秘书长王海燕受深圳社联理事长严书翔邀请,作为特邀嘉宾出席深圳市社联社工服务中心年会,与深圳同仁共话发展、共商合作新篇。年会现场,700余名社工的身影汇聚成一道亮丽的风景线。这场跨越岗位与领域的相聚,不仅彰显了社会工作者强烈的职业归属感,更凸显了深圳社联强大的行业凝聚力。在严书翔“党建为魂、专业为基”理念的引领下,深圳社联

燃情冰雪铸魂育人:哈体院“冰雪思政课”开启思政教育新范式

1月6日下午,由省委教育工委、省教育厅主办,哈尔滨体育学院(国家冰雪运动学院)承办的“黑土地上的精神力量”全省大中小学思政育人大课堂2026年首场“冰雪思政课”,在哈尔滨体育学院大学生滑冰馆精彩呈现。活动以“燃情冰雪砥砺报国志 接续奋斗筑梦新征程”为主题,省委教育工委常务副书记、省教育厅厅长许振宇出席,省教育厅相关负责同志、在哈高校及教育局代表、大中小学师生代表等1000余人现场

全国宣传部长会议:把经济宣传摆在新闻舆论工作重要位置

全国宣传部长会议1月5日在京召开,中共中央政治局常委、中央书记处书记蔡奇出席会议并发表讲话,强调要把经济宣传摆在重要位置,加强舆情应对与舆论引导,巩固壮大自信自强、团结奋进的主流思想舆论。新华社记者 殷博古 摄。蔡奇在讲话中指出,党的十八大以来,以习近平同志为核

网红玫瑰盐实为工业盐:重金属超标,监管存在空白

一款粉红色、号称“高营养价值”的玫瑰盐在网络平台热销,价格高达每斤240元,是普通食盐的数十倍,消费者不知道的是,这种所谓的“高端食盐”并不符合我国食用盐标准。近日,多个网络平台上出现粉红色的进口“玫瑰盐”,打着“纯天然无污染”、“富含矿物质”等营销标签迅速走红,成为不少消费者眼中的“高端食盐”。测评机构对五款“玫瑰盐”进行检测,发现均含有铅、砷、铬等重金属,且含

返璞归真,重塑生活:大喜村圆生活生态社区诠释当代乡居新范式

在快节奏的都市生活中,越来越多人渴望逃离钢筋水泥的桎梏,寻觅安放身心的净土。福建福州永泰大喜村,藏于群山之间,凭借澄澈溪流、浩渺湖面、葱郁树林与清新空气,成为一群追梦者的归宿。他们在此扎根打造圆生活生态社区,以回归本真的生活实验,诠释“乡村才是真正的奢侈”的内涵,更在城乡融合、南北联动与中外文化交流中,勾勒出独特的康养旅居新图景。

沪渝蓉高铁武宜段即将开通 汉口至宜昌最快69分钟可达

昨天上午10时,随着G9385次“复兴号”列车从汉口站驶出,沪渝蓉沿江高铁武汉至宜昌段(以下简称沪渝蓉高铁武宜段)媒体试乘体验活动启动。中国铁路武汉局集团有限公司党委宣传部,联合宜昌、荆门、天门市宣传部门,邀请中央省市媒体、网络达人等70余名记者,深入天门、钟祥、荆门、当阳、宜昌等沿线车站、城市开展行进式调研采访,亲身感受这条贯穿江汉平原的交通新动脉。
返回
顶部