众所周知,Google的世界里不止搜索引擎和SEO,目前最前沿的科技还有它的AI。5月12号,Google旗下的DeepMind发表了一篇论文(还记得AlphaGo吗? ),在人工智能圈子里引起轰动。 它展示了最新的研发成果:人工智能系统Gato。
之前的AI系统只能执行单一任务,就算是击败世界第一棋士李世石的AlphaGo,也只能下围棋;痛击电竞选手的AlphaStar,只能玩《StarCraft》,它们都是单一领域的专家。 但是Gato不同,它能够去完成超过六百种不同的任务,能与人聊天、描述图像、玩不同种类的游戏、甚至控制机械臂等等。 因为Gato的这个特性,很多人惊呼通用人工智能的时代要来临了。
1.专用人工智能
简单解释一下:只能在一个特定领域的AI,叫作「专用人工智能」,或者叫弱人工智能,就是输入数据的来源单一、输出目标简单而明确;而接近人类学习水平,完成很多不同种类的任务的AI,叫作「通用人工智能」,或者叫强人工智能。
2.工作原理
怎样达到通用人工智能呢? DeepMind解说,是把不同数据的信息统一化。 背后的核心技术是转换(Transformer,与电影《变形金钢》的英文名一样),把数据的信息转换为Gato读得懂的信息。 提供给Gato的数据种类广泛,包括图像、文本、机械臂的力矩、游戏方向键的压力等等,DeepMind是怎么转换,把这些数据统一起来?
答案很简单:其实文字就是一种序列数据,直接提供给AI;那图像也是序列数据,把图像分割成单一的像素,然后编上序号处理成跟文字一样,再提供给AI;游戏的按键操作也是“方向”的操作,同样转换成序列数据;机械臂稍微复杂一点,随着机械臂的运动,再把关节力矩和传感器信号提取出来,转换成序列数据。
不管是图像、文字还是其他数据,在Gato眼中都是一样。 最终,所有的数据都交给同一个Transformer 算法来处理,这就是Gato的原理。 不过,Gato还在研发初期,虽然能实现不同的任务,但每个任务的处理能力不是很强。 例如语言处理,GPT-3有1750亿个参数,但是Gato只有12亿个,未来还需要不断提升算力来弥补不足。
3.背后的开发原因
为什么要开发通用人工智能呢?
DeepMind的说法是,“通用性”会让 AI 取得更大优势。 从过往的人工智能发展史中看到,通用人工智能最终倾向是,超越专用人工智能。 很多AI专家也认为通用人工智能最终会胜出。 不过根据维基百科的解释,通用人工智能是,「能表现正常人类所具有的智能行为」,要具备逻辑推理、学习知识、做判断等自主能力,目前还是有点遥远。
从这次Gato的原理也看出,不管这个模型有多大,不管你喂多少数据给它,它还是个数据驱动的、有限制条件的学习系统,只能在人类定义的规则下做识别,还没有人类的自主能力。 这也是为什么DeepMind并没有使用“通用人工智能”(Artificial General Intelligence)这个词,而是基于严谨的学术性,把这个模型称为” 具有通识能力的智能体“(Generalist Agent)。
尽管终极目标还很遥远,但达成这一步仍然是了不起,是AI领域的一大步。 就拿自动驾驶来说,要实现真正的自动驾驶,具备通用能力的AI是必不可少,因为绝大多数AI是在理想的模拟环境中开发,但现实世界中有很多意外和突发情况,这就需要接近人类的通用人工智能。
上面提到的Transformer,最早是在2017年,由Google开发,在开发过程中发现,比以前的传统算法(例如卷积神经网络Convolutional Neural Network), 更接近人类的思考模式,准确性更高,于是成为了今天主流AI应用,采用的底层算法。
今天,Tesla的无人驾驶、OpenAI的GPT-3、Nivdia的Omniverse软件等都用上了Transformer ,是真正得到了业界的认可。 而Gato则代表了AI在通用能力上的突破,可以同时做语音语义、图像识别、机械臂移动等这些跨界任务。
4.未来的AI世界
想象一下未来日子,随着通用人工智能的增强,不同行业之间的壁垒消失,整个产业格局被改写。 当人工智能具有很强的通用能力时,今天的规律:弱人工智能比人强,强人工智能比人弱,也会被打破,很多行业边界、行业壁垒也会被打破。 对企业家来说,需要引入人工智能技术,同时留意通用人工智能的发展。 如果通用人工智能成熟,下一个人工智能革命就要到来了,我们千万不能错过!
再强调,要持续观察 AI产业的发展,理解产业变革,关注关键技术,技术革命不是一蹴而就,总有个从原理,确认到性能胜出的过程。 现在看,Gato背后的Transformer就有这样的潜力,至于会不会给人工智能带来革命,就需要我们持续观察了。