人工智能称霸棋坛——冰山一角的里程碑-人工智能
北京时间3月9日,谷歌AlphaGo与韩国首尔与李世石正式开战。这场所谓的“捍卫人类尊严”之战将历时5天,五局后一分胜负,而首局便以人脑失败告终。在樊麾之后,这一败更是让人机地位之争的舆论狂潮上升到了新的高度,人们表现出来更多的是对自身高级智能物种之位可能被颠覆的担心。这种担心有必要吗?由AlphaGo代表的人工智能技术水平到底到了什么程度?
冰山一角的旗帜
我们知道,棋类游戏竞技实际上相当于在规则明确的情况下和计算机比拼计算能力,显然计算机的运算速度是人脑无法匹敌的,因为在假设算法不变的环境下,任何涉及数据运算的技能比拼,人类都会完败给电脑。

但我个人认为这次AI战胜人类顶尖棋手仍是具有里程碑意义的,因为在不让子的情况下计算机战胜人类职业围棋选手之前被认为是”需要数十年才能达成的巨大挑战”,而从DeepMind发布的论文的结果表明这一进步比想像的来得早。在所有古老的主流棋类游戏中,围棋是最后一个人工智能程序试图征服的领地,所以这一工作确实有“符号”意义。
据我理解,DeepMind 主要的创新方法或技术有:
1) 之前最好的计算机围棋程序普遍采用的 Monte Carlo Tree Search (MCTS) 算法。在解决一个复杂的二人零和博弈游戏 (two-player zero-sum game)中, 最重要的是尽量深度地探索当前认为的最好着法,以及尽量广度地探索一些未尝试着法。在计算资源有限的情况下,MCTS 比较好的实现了这两种策略的平衡。在 MCTS 被引入前,人工智能几乎无法和人类业余选手对抗,引入了 MCTS 后,计算机已经可以达到了人类业余围棋选手的水平。这是一个巨大飞跃,DeepMind 的工作继承了这个算法框架。
2)在使用 MCTS 中,评估当前棋盘局面的效用函数 (value function) 和决定下一着 (next move) 的策略函数 (policy function) 是非常重要的算法组成部分。前者决定 AI 能否很好的评估一个局势,不需要往前探索很多步 (look ahead) 就能准确把握局势优劣,从而减下搜索深度;后者决定在那么多可能应对着法中,找到比较好的应对着法从而减小计算机进行搜索的宽度。举个例子,围棋在开局阶段,职业棋手借助大量的经验和历史总结的开局方法,可以评估开局中双方的优劣,这种就是需要 AI 学习的效用函数;在遇到一些局部处理中,人类高手也有很多所谓的“定式"来借鉴,这些就是历史上总结出来的局部最佳应对,AI 如果能学到就是一个非常好的策略函数。
Deep Mind 使用深度学习 (Deep Learning) 和 强化学习 (Reinforcement Learning) ,通过大量专业的人类专家对弈棋局和自我对弈 (self-playing) ,统计地学习出了出色的效用函数和策略函数。他们的实验表明,仅仅使用他们自己的效用函数就已经超越了之前所有的围棋AI 。需要说明的是,这并不是首次将深度学习引入围棋AI,Facebook 和其他一些研究者在这方面之前就做了不错的工作。
综上,让AlphaGo取胜的关键并不仅仅在于其运算速度,而是学习能力,然而这种学习能力是纵向深入的,也就是说AI可以在围棋的道路上越走越精,但却不能像人类一样在学习围棋的同时参悟到其他触类旁通的技能。“下棋” 只是人工智能调用人类单一技能点,如果把人类自身复杂而又多元的认知和学习系统比作冰山,那么此次AI的胜利仅占据了一角之地,但不得不说人工智能变得更聪明了,因为它开始学习思考了。
人工智能的真正使命
谷歌董事长Eric Schmidt曾在赛前的发布会上表示:“我们开发人工智能机器人的最终目的在于为人类提供福祉,为未解难题提供新的解决方法;而其中,围棋只是我们选择增强人工智能机器人的实力的方法之一。无论这场对决孰胜孰负,最终的赢家都将是人类自己,因为人工智能的发展,最终的受益者将是人类自己。”从目前局势来看,AI似乎已经解决了像围棋这样复杂的问题,我们不妨思考一下,同样的方法还可以适用于哪些行业?
目前以深度学习和强化学习正受到越来越多的关注,复杂的双人或者多人博弈游戏,语音识别和语义理解,自动理解视频语义内容等都是被探索的方向。这些都有可能取得新的进展。
比如人去看视频的时候并不会对视野中所有地方平均“用力”,而是会快速地筛选出高价值信息所在的地方,如果有了进一步兴趣,会仔细观察视频中的某些物体或者区域。传统的统计机器学习AI无法很好的模拟人这一行为,从而将大量时间花费在无效区域的计算上,而视频正好是数据量非常的应用领域,这样就限制了很多 AI 的计算速度以及达到的识别精度。DeepMind 工作中使用的强化学习在这一领域也有了用武之地,通过学习一个策略从而聪明地挑选有用的地方进行计算,AI可以用较少的代价实现更好的视频理解。
再比如人机交互中,人类用户提出的问题如何应对,也是一个策略问题,通过和真人在线上进行对话,通过衡量对话持续的长度和用户体验可以不断强化策略的优势(强化学习的使用),结合深度学习来学习问题到应对的函数,两者结合也有想像空间。
简单来说,人工智能的起点即是终极目标,那时候,计算机的智力也许会超过人类,机器和人类能够自然而感性地沟通互动,而如今的下棋甚至自动驾驶等可程序化的专项技能人都很快会被机器技能所超越。
人工智能完胜只是时间问题
人类是复杂的生物没错,但并不是神奇的不可逾越的物种。人脑会有思维弱点,也会因精神或外力的原因影响判断力,而计算机永远不会,可以说留给深度学习和人工智能学界和产业界的只是时间和信心的问题。
除了谷歌DeepMind,还有比如Facebook,Microsoft, IBM, 以及国内的 Baidu等行业巨头都在投资这一方向,当然大家的侧重点可能不一样,但是都有很不错的一些成果,比如 Microsoft Research 的孙剑团队最近在图像识别中提出的技术 (ResNet) 取得了非常不错的结果,很多公司的语音识别,机器翻译等也开始商业化,比如百度硅谷实验室的工作就展示了令人印象深刻的语音识别效果。
机器思考的前提——看懂世界
十年来,深度学习几乎渗透到了人工智能相关的所有领域,国内一些创业公司也在从事 AI 的工作,就旷视科技Face++来说,旷视的愿景是“先让机器看懂世界,再让机器真正思考”,从逻辑上讲视觉是认知的重要前提,是实现流畅的人机交互的重要基础;当机器拥有了视觉才能够使人工智能系统具备对于物体三维空间的把握和距离感知能力。
在深度学习和计算机视觉的研究中,旷视已经实现了多次技术突破,比如专注于图像和视频中的信息理解和结构化的旷视科技Image++团队,最近的自然场景中的文字识别取得了不错的结果(ICDAR15 Challenge 4上目前结果第一),其中就使用了深度学习的技术,我们正在尝试用强化学习来提升文字检测的效果,希望让机器可以更加智能的知道哪些区域更有可能出现文字,从而提高计算效率。而作为人工智能产业化得先行者,旷视科技已经将深度学习技术应用于实际的生活场景中,如互联网金融风控和身份认证、平安城市安防保障、以及企事业单位智能商业改造等。
和所有埋头于AI研究的科研工作者们一样,我们相信不久的将来,人工智能将不会满足于和人类在某一专项的智力比拼而是成为人类最知心的助手,毕竟人工智能出现的本意是希望它能为人类服务。
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-