2017年5月,香港中文大学终身教授贾佳亚博士加盟腾讯优图实验室,担任优图实验室的杰出科学家。
“像我这样的教授来到优图实验室来做研究,我们是出出Paper,发发论文、做做技术就完了吗?” 2018年9月6日,在腾讯优图举办的首届计算机视觉峰会上,鲜少公开露面的贾佳亚这样问观众。
作为腾讯旗下三大人工智能实验室之一,腾讯优图实验室以图像识别和人脸识别等计算机视觉技术为核心。这两年,得益于深度学习和人工智能的发展,计算机视觉技术的准确率快速提升,处理数据的能力也大大提升,迅速走进人们生活并开始赋能各个行业。从苹果到小米,手机厂商将人脸识别应用于解锁手机;从微信到支付宝,互联网公司将人脸识别应用于验证身份、刷脸支付;通过安防摄像头,公安部门通过人脸识别技术找回走失儿童;从直播到短视频,图像识别技术可以帮助相关部门鉴定黄色内容。腾讯优图实验室杰出科学家贾佳亚 在世界人工智能大会召开前夕,澎湃新闻记者走访腾讯优图实验室位于上海的办公室,优图总经理吴运声告诉澎湃新闻,在过去一年,该公司的业务团队扩充了一倍以上,目前团队成员超过百人,博士人数占比接近50%,“这可能是腾讯内部博士占比最高的团队了。”
“是不是以为科学家是在实验室写数学公式或是各种各样代码的存在?在腾讯优图,很多科学家不仅可以做数学公式、模型,还可以到用户一线的现场当中,了解现场的实际需求,了解用户背后心里的诉求是什么。” 吴运声说。
腾讯三大人工智能实验室,AI Lab、腾讯优图、WeChat AI,即将参展在上海举办的世界人工智能大会。其中,优图实验室发源于上海,成立于2012年,目前在深圳、香港、合肥等地都设有办公地。
目前,优图AI技术应用在金融、鉴黄、安防、医疗、政务等领域,在手机QQ、QQ 空间、QQ音乐、微信、广点通、全民K歌、腾讯觅影等腾讯内部众多产品中落地,并联合腾讯云为微众银行、福建公安厅、顺丰、中国联通、每日优鲜、华星光电、南方电网等输出AI能力。
“在一个公司建立完整的人工智能体系是要做很多事情,前沿探索是基础,上层需要提供视觉硬件,保证能有快速的学习系统、内部自适应的系统,服务器端迅速地完成训练、分布和部署。从研究到开发,最后则是通过与腾讯其他部门合作,把优图的技术输出。” 贾佳亚说。
从识别手写字到鉴别色情内容
OCR(光学字符识别),是优图最早和最成熟的技术,已在手机QQ和微信实现。用户打开“扫一扫”,能将图片中的文字,直接转换为可编辑文本。
不仅如此,优图还可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡片证件。不仅是印刷体,还可以识别手写体,应用于识别快递面单等领域。
但这块骨头并不好啃。
“当文本场景非常复杂时,例如光照过强或过暗、文字排列不正的情况下,难以准确识别文本,其中最复杂的是快递单的手写体识别,不同的人手写体不同,更加难以识别。” 吴运声说。
优图采集了大量的数据,针对各个领域的特点进行专门训练,把这些难点攻克。譬如,以前OCR只能做单字识别,如今的OCR能够根据文本的前后关系进行整行识别。同时,优图还开发了交叉验证技术,在识别同一文本的不同字段时进行交叉验证和错误修复。
快递面单手写字提取
在快递领域,优图与顺丰合作,针对运单的收寄件人电话号码和收件人省市区地址信息做了深入的研究,取得高精度的识别成果。快递公司基于这些OCR自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升运单信息录入效率和物流资源的调度匹配能力。
吴运声说,优图OCR识别技术支持数字识别和超过7000个常用汉字的识别,在内部测试集上,单字识别准确率可达到中文98%以上,数字99%以上。将纸质的单据扫描转换成文字,目前3小时可识别2000万张,减少出错概率的同时也大大地降低了人力的成本。
基于类似技术,优图又研发出智能鉴黄技术、暴恐图片识别技术,可以精准识别出图片中的露点和不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物,辅助甚至代替人工过滤垃圾。目前该解决方案已在斗鱼、龙珠、映客等平台上线使用。
如今,优图在图像识别的调用量在千万级到亿级,人脸识别的调用量也达到千万级。
从跨年龄寻亲到追踪违法车辆
2017年12月6日,在“广州2017·财富全球论坛”上,腾讯公司董事会主席马化腾说,腾讯的人脸识别的能力还是非常强的。“基于大数据的学习,我们可以预测一个人变老的时候是什么样子,所以我们帮助公安部门寻找丢失儿童的时候,我们的人脸识别技术还可以推算出你丢失10年后、5年后孩子的样貌怎么样,而且非常成功地帮助公安找到这样的儿童。”
马化腾提到的跨年龄人脸识别技术,正是来源于腾讯优图实验室。腾讯把这项技术放在QQ平台,用来寻亲。2017年6月,这个项目成功帮助一个家庭找回了走失3年的18岁少年,凭借的是家人提供的一张孩子8岁的照片。优图深度学习五官的变化规律,实现跨年龄人脸识别,最高可达到每秒5000万张检索对比速率。
依托于腾讯优图的海量人脸检索技术,由福建省公安厅与腾讯互联网+合作事业部联合发布的“牵挂你”防走失平台2017年3月上线,截至2018年5月已经帮助寻回了681名走失人员。
在警务领域的应用远不止这些。优图联合苏州工业园区公安分局发布车辆追踪系统,该系统功能形态及核心的车辆识别、追踪AI能力全部由腾讯优图业界首创并自主研发。
实时跨摄像头跟踪车辆演示
为了全方位满足智慧交通的需求,优图天眼推出了天眼智能交通平台,主要面向交通安全保障、交通治理、违法追逃等应用场景。
在有警务突发事件时,车辆追踪系统可满足车辆追踪与布控需求。通过监控视频锁定指定车辆,描述车辆实时位置、行驶轨迹,自动调用能拍摄到指定车辆的最优视频资源,并能视频实时追踪指定车辆,协助路面布控或拦截。此外,该系统还可应用于交通控制辅助分析、违法车辆的调查取证等场景。
据介绍,2017年11月,优图AI在国际权威交通场景数据集KITTI上,将车辆追踪准确率提升至87.76%,打破图森、斯坦福等名企名校创下的纪录,斩获数据集排行榜第一,刷新了世界纪录。优图以图搜车术,在车辆搜索知名开源数据集VehicleID上,Top-1准确率达到86%;车辆属性识别支持300多种品牌、4000多种车系年款,不同颜色、单双层车牌,以及年检标、遮阳板、挂饰等各类特征区域。
从跑分到跑场景
在优图,研究和应用绑定得非常紧。不仅仅在政务、金融、社交娱乐,腾讯优图正在用AI赋能更多垂直领域。
比如,在医疗场景,优图在肺癌、糖尿病性视网膜病变早筛上取得显著进展,通过腾讯首个医疗AI产品“腾讯觅影” 进入大规模的临床预试验。利用AI医学影像分析辅助医生筛疾病,其中对早期食道癌的筛查准确率高达90%,已经在全国100多家三甲医院落地。到上个月,腾讯觅影已累计辅助医生阅读医学影像超1亿张,服务90余万患者,提示高风险病变13万例。
工业领域,优图实验室通过CV辅助华星光电超过100道工业质检,并在面板智能质检上建立可复制型工业自动化排查系统;同时,与南方电网合作进行的电网智能巡检,协同无人机通过图像识别技术自动定位关键原件,对设备缺陷进行识别标注。
刷脸支付
在零售领域,优图的以图像捕捉、识别、检索以及语音识别等AI处理引擎为基础,把原本线下门店难以量化的用户行为数字化,同时结合腾讯云多年积累的用户线上数据与大数据处理引擎,用户行为进行交叉验证分析,帮助零售商超、服饰百货、高端餐饮、大型购物中心等商家,进行数字化升级。
眼下,腾讯、阿里巴巴等互联网巨头以及众多初创公司都在全力进军人工智能的基础研发及应用。作为深度学习的主要应用领域,计算机视觉已经成为各家的争夺目标。
腾讯高级执行副总裁汤道生说,人工智能已经开始进入到一个场景化深度发展时期。他说,前两年,还经常看到各家公司说“某某能力达到了96.88%,又提升了一个百分点”。但现在这种声音已经开始慢慢变少,除了在基础能力上不断“跑高分”,人工智能已经在许多垂直应用场景技术落地,进入了“跑场景”时代。
这也将给优图的科学家带来更多考验。
腾讯优图实验室总经理吴运声
“我们有不同的智慧零售客户,像万达、百丽、名创优品等等,有的是几万平方米的大场,有的是几百平方米或者是几平方米的场地。有的人流量有几万人,也有几千、几百人的,不同的客户需求不一样。以前是商务人员接触客户,而我们实验室的科学家,不仅可以写公式、做模型,也需要到现场和客户交流、了解客户的实际需求。他可以去看现场的光线如何,了解在什么地方部署什么样的摄像头可以达到最优的算法和效果。根据前端和算法的配合,能够达到最好的、我们可以满足客户需求的情况,并且让我们在最低成本的情况下满足客户的需求。” 吴运声说。
汤道生在会上宣布,优图实验室升级为腾讯计算机视觉研发中心,对基础技术研究保持足够耐心,不设KPI。除了目前在医疗、零售、工业、文化等领域的应用外,腾讯优图将深入到自动驾驶、办公、社会公益等共十大领域。
新闻推荐
公职“老赖”逃避执行被抓获 庐阳法院开展“猎赖”行动 一天拘传4人
庐阳法院开展“猎赖”行动 一天拘传4人
合肥新闻,新鲜有料。可以走尽是天涯,难以品尽是故乡。距离合肥再远也不是问题。世界很大,期待在此相遇。