◎[美]阿杰伊·阿格拉沃尔
哈利·波特、白雪公主和麦克白这三个人物有什么共同点吗?他们都被预言或者预测所驱动。就连《黑客帝国》这部看似讲智能机器的电影里,人类对预测的信念也是剧情的推力。不管是宗教还是童话,有关未来的知识都会产生重大结果。预测影响行为。预测影响决策。
古希腊人敬奉的许多神谕宣示都有着了不起的预言能力。有时候,这些预言中的谜语会捉弄提问人。预测可以是关于当下的。我们预测当前的信用卡交易是合法还是欺诈,医学影像中的肿瘤是恶性还是良性,以及出现在苹果手机摄像头里的是不是它的主人。尽管“预测”的拉丁语词源的意思是“事先知道”,但我们对预测的文化解读强调的是看到本来看不见的信息,不管这信息是来自过去、现在还是未来。水晶球也许是人们最熟悉的魔法预言的象征了。我们常把水晶球跟“算命师预测某人将来的财运或爱情”联系起来,但在《绿野仙踪》里,水晶球让多萝西看到了当下的爱姆婶婶。这给我们带来了预测的定义:
预测是填补缺失信息的过程。
预测将运用你现在掌握的信息(通常称为“数据”),来生成你尚未掌握的信息。
几年前,阿维注意到自己的信用卡在拉斯维加斯赌场产生了一笔大得异乎寻常的交易。他本人并不在拉斯维加斯。他只去过那儿一次,而且是很久以前;赌博注定要输,以他的经济学家世界观而言,这毫无吸引力。他跟信用卡服务商展开了漫长而艰难的拉锯式对话,终于,服务商取消了交易,给他换了卡。
最近,又出现了一次类似的情形。有人用阿维的信用卡买了东西。但这一次,阿维没有在对账单里看到这笔交易,也没大费口舌地跟礼貌但立场坚定的客户代表解释。相反,他接到了服务商事后主动打来的电话,对方说他的卡遭到盗用,新卡片已经在寄来的路上了。
信用卡服务商根据阿维的消费习惯和其他大量数据准确地推断出涉事交易属于欺诈。信用卡公司很有信心,调查期间甚至没有冻结他的信用卡。而且,就像变戏法一样,他用不着做任何事,公司就为他发放了替换的卡。当然,信用卡服务商并没有水晶球。它拥有的是数据和良好的预测模型——一台预测机器。更好的预测可以减少盗刷,“解决消费者遭到误拒的重大痛点”。
将一种信息转化为另一种信息是人工智能近期取得的一大进步,这就是翻译的核心。翻译语音是遍布于所有人类文明的一个目标,连流传了数千年的巴别塔故事里也有它的身影。从古至今,要实现自动化翻译语言就得雇用一位语言学家来解析规则,并将其转换成可编程的形式。然而,人工智能的最新进展可以把翻译问题转换为预测问题。从谷歌翻译质量的突飞猛进中看到预测应用于翻译领域后体现出的神奇特质。欧内斯特·海明威的《乞力马扎罗的雪》一文的开头十分优美:
乞力马扎罗是一座海拔19710英尺、常年积雪的高山,据说它是非洲最高的一座山。
2016年11月的一天,东京大学计算机科学系教授历本纯一通过谷歌把海明威这篇经典小说的日文版翻译成英文,内容如下:
乞力马扎罗是19710英尺山被雪覆盖的,据说是非洲最高山。
第二天,谷歌的译文变成了:
乞力马扎罗是一座19710英尺的山,常年积雪,据说是非洲最高的山。
差异很明显。一夜之间,谷歌的译文就从一看就知道是机器翻译的笨拙文本,变成了一句连贯的话,如同一个人前一天还只能拿着字典磕磕巴巴地讲话,第二天就能流利地运用两种语言了。
诚然,谷歌的译文并未达到海明威的高度,但进步也很了不起。巴别塔仿佛重新建起来了。而且,这一改变不是出于偶然或者碰运气。谷歌利用人工智能的最新进步,更新了自家翻译产品背后的引擎。具体而言,谷歌的翻译服务现在依靠深度学习来提高预测效率。
企业马不停蹄地将这一神奇的技术付诸商业用途。例如,中国已有五亿多人使用科大讯飞开发的深度学习服务,使用自然语言进行翻译、转录和交流。房东用它跟使用其他语言的租客沟通,医院的患者用它跟机器人沟通以寻求指示,医生用它指导患者服药,司机用它跟其他车辆联络。人工智能被用得越多,收集的数据也越多,学习得越多,它的效果也就越好。有了如此多的用户,人工智能将突飞猛进。
谷歌翻译的变化说明了机器学习(深度学习是其子领域)怎样显著降低了质量调整的预测成本。从运算能力的角度来看,谷歌现在可以用相同的成本提供更高质量的翻译。生成相同质量的预测所需的成本大幅下降。
预测技术的创新正对传统的预测领域产生影响,比如盗刷检测。信用卡盗刷检测已经得到了很大改善,在用户注意到问题之前,信用卡公司就检测并解决盗刷了。不过,这种改善仍然是渐进式的。20世纪90年代后期,当时最先进的方法能抓住大约80%的盗刷交易。这一比值在2000年提高到了90%~95%,如今提高到了98%~99.9%。最后一步跨越来自机器学习,从98%到99.9%的变化意味着天翻地覆的转变。
从98%到99.9%的变化看似渐进,但如果犯错代价高昂,哪怕是小小的变化也有重要意义。准确率从85%提高到90%,意味着失误率降低了1/3。从98%提高到99.9%,意味着失误率降到了从前的1/20。20倍的改进似乎已经不算是渐进式的了。
预测成本的下降让人类的许多活动发生了巨大的变化。正如人们将第一批运算首先应用于解决普查表、弹道表等熟悉的数学问题上,在机器学习带来的廉价预测上,其第一批应用中有不少被用来解决经典的预测问题。除了盗刷检测,还包括信用评级、健康保险和库存管理。信用评级涉及预测某人偿还贷款的可能性。健康保险涉及预测某人会花多少钱在医疗保健上。库存管理涉及预测仓库在某一天存有多少物品。
目前这一代人工智能与科幻小说里的智能机器相去甚远。预测是一项十分基本的生产资料。你兴许并未意识到,但预测是无所不在的。商业活动和个人生活里充满了预测。我们的预测往往化身为决策的输入条件。更好的预测意味着更好的信息,更好的信息意味着更好的决策。用谍报活动的层面来表达,预测即情报,即“得到有用的信息”。机器预测就是人工生成有用信息。智能(情报)很重要,我们用信用卡盗刷的例子说明更好的预测会带来更好的结果。随着预测成本的不断下降,我们发现它对更大范围的额外活动大有用处。在这个过程中,它使各种各样从前难以想象的事情成为可能,比如机器翻译。
《AI极简经济学》,[美]阿杰伊·阿格拉沃尔、乔舒亚·甘斯、阿维·戈德法布/著,闾佳/译,博集天卷·湖南文艺出版社2019年版
新闻推荐
新华社北京2月15日电中国人民银行15日发布金融统计数据显示,1月份我国人民币贷款增加3.23万亿元,同比多增3284亿元,增量创单...