国产超大规模AI预训练模型发布可实现“用图生文”等任务

来源:澎湃新闻 2021-01-14 18:49 https://www.yybnet.net/

六出奇光动地来,西方海国见旌旗。

水心惟有终无底,火内曾无彻上灰。

地轴迂回周八极,天球低陷不磨回。

明朝沧海成桑田,吾欲吹嘘弄大灰。

以上诗句题为《咏智利日全食》，来自人工智能模型“文汇”的手笔。

人工智能模型“文汇”是北京智源人工智能研究院近日发布的一款面向认知的超大规模新型预训练模型。它旨在探索解决当前大规模自监督预训练模型不具有认知能力的问题，参数规模达113亿，仅次于OpenAI1月初发布的DALL·E模型的120亿参数量，是目前中国规模最大的预训练模型。

超大规模预训练模型是当前人工智能领域研究的热点。

自2020年5月，OpenAI发布迄今为止全球规模最大的预训练模型GPT-3以来，OpenAI、谷歌等科技公司都在持续推动大规模预训练模型的进一步发展。2021年1月5日，OpenAI在官方博客发布了人工智能神经网络“DALL·E”，可以通过自然语言文本直接生成对应图像。

据介绍，“文汇”模型能够学习不同模态（文本和视觉领域为主）之间的概念，可以实现“用图生文”等任务，具有一定的认知能力。

北京智源人工智能研究院成立于2018年11月，是在科技部和北京市委市政府的指导和支持下，由北京市科委和海淀区政府推动成立的新型研发机构。

“文汇”由智源研究院发起的“悟道”攻关团队完成，团队由智源研究院、阿里巴巴、清华大学、中国人民大学、中国科学院、搜狗、智谱.AI、循环智能等单位的科研骨干组成。

智源研究院院长、北京大学信息技术学院黄铁军表示，“文汇”模型针对性地设计了多任务预训练的方法，可以同时学习文→文、图→文以及图文→文等多项任务，实现对多个不同模态的概念理解。

“文汇”模型能够完成多种图文生成任务。例如，根据下面这张图片，模型可给出描述如下描述：

旗袍是一种古典的风格，它不仅能够彰显出女性优雅气质，而且还具有很好的修饰身形。这款旗袍采用了经典的圆领设计，穿着舒适自在，同时又能够展现出女性柔美的颈部线条，让你更加的迷人。精致的绣花工艺，使得整件衣服看起来更加的精致，也更加的凸显出女性的魅力。

“文汇”模型还能够生成基于人设的文本：

据悉，“文汇”模型的研究团队在模型中提出了针对多模态认知生成的大规模预训练的架构M6：MultiModality-to-MultiModality Multi-task Mega-Transformer。模型整体架构基于Transformer，其中图像进行切块并对块采用ResNet-50提取特征。这些特征以及对应的position embedding让图像和文本能组合在一起送入模型。

智源研究院透露，目前，“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务，部分应用即将与搜狗、阿里巴巴、学堂在线、智谱.AI、循环智能等机构合作上线。具体功能包括基于上传图片的开放域问答、用语言操作数据可视化、基于预训练语言模型的诗词创作应用和可控人设的开放域问答等。(本文来自澎湃新闻，更多原创资讯请下载“澎湃新闻”APP)

新闻推荐

上交所宣布 “零容忍”处理债券违规行为

据新华社上海1月13日电（记者潘清）上海证券交易所日前宣布，对华晨汽车集团控股有限公司（以下简称华晨集团）及相关责任人予以公...

相关推荐:: 市场监管总局依法对唯品会涉嫌不正当竞争立案调查，唯品会：积极配合2021-01-14 09:51

交易商协会给予永煤控股和河南能化自律处分，暂停其债券融资相关业务2021-01-14 19:05

2020年移动支付用户报告：微信支付超越支付宝，登顶用户最常使用产品2021-01-14 10:07

猜你喜欢:: 科尔尼：深刻影响全球未来发展和商业环境的五大趋势2021-01-14 15:51

交易商协会：暂停河南能化债务融资工具相关业务7个月2021-01-14 19:14

台积电市值超巴菲特旗下公司，2020年净利创纪录大增50%2021-01-14 16:47

评论:(国产超大规模AI预训练模型发布可实现“用图生文”等任务)

频道推荐: 西宁市主城区开展全员核酸检测

公园里的捐赠王溱

图说天下 2022年04月16日A07版文章字数：434朗读：

迄今发现的最远恒星也许开启了研究早期宇宙的新窗口

各地开展全民国家安全教育日主题活动

俄通报乌千余守军投降美将供乌8亿美元军援

热点阅读: 文牧野：我一直追寻着真实与真诚... 王阳：《人世间》让人思考什么是活着... 国潮那么潮

图文看点

乡里乡亲: 张庭夫妇公司被认定传销举报者：担心... 电影《花渡好时光》定档回乡青年演... 从《少年》《下山》《踏山河》到《孤...

热点排行

国产超大规模AI预训练模型发布 可实现“用图生文”等任务

国产超大规模AI预训练模型发布可实现“用图生文”等任务