首页 > 资讯频道 > 技术 > 正文

微软新研究提出一个新的多任务深度神经网络模型——MT-DNN

2019-03-22 17:17:37来源：新智元

微软新研究提出一个新的多任务深度神经网络模型——MT-DNN。MT-DNN结合了BERT的优点，并在10大自然语言理解任务上超越了BERT，在多个流行的基准测试中创造了新的最先进的结果。

语言嵌入是将自然语言符号文本(如单词、短语和句子)映射到语义向量表示的过程。这是自然语言理解(NLU)深度学习方法的基础。学习对多个NLU任务通用的语言嵌入是非常必要的。

学习语言嵌入有两种流行方法，分别是语言模型预训练和多任务学习(MTL)。前者通过利用大量未标记的数据学习通用语言嵌入，但MTL可以有效地利用来自许多相关任务的有监督数据，并通过减轻对特定任务的过度拟合，从正则化效果中获益，从而使学习的嵌入在任务之间具有通用性。

最近，微软的研究人员发布了一个用于学习通用语言嵌入的多任务深度神经网络模型——MT-DNN。MT-DNN结合了MTL和BERT的语言模型预训练方法的优点，并在10个NLU任务上超越了BERT，在多个流行的NLU基准测试中创造了新的最先进的结果，包括通用语言理解评估(GLUE)、斯坦福自然语言推理(SNLI)和SciTail。

MT-DNN的架构

MT-DNN扩展了微软在2015年提出的多任务DNN模型(Multi-Task DNN)，引入了谷歌AI开发的预训练双向transformer语言模型BERT。

MT-DNN架构

MT-DNN模型的架构如上图所示。低层在所有任务之间共享，而顶层是特定于任务的。输入X可以是一个句子或一对句子，其中的每个单词都先被表示为一个嵌入向量序列，表示为l_1。

然后，基于transformer的编码器捕获每个单词的上下文信息，并在l_2中生成共享的上下文嵌入向量。

最后，对于每个任务，额外的 task-speci?c 的层生成特定于任务的表示，然后是分类、相似度评分或相关性排序所需的操作。MT-DNN使用BERT来初始化它的共享层，然后通过MTL改进它们。

领域自适应结果

评估语言嵌入的通用性的一种方法是测量嵌入适应新任务的速度，或者需要多少特定于任务的标签才能在新任务上获得不错的结果。越通用的嵌入，它需要的特定于任务的标签就越少。

MT-DNN论文的作者将MT-DNN与BERT在领域自适应(domain adaption)方面的表现进行了比较。

在域适应方面，两种模型都通过逐步增加域内数据(in-domain data)的大小来适应新的任务。

SNLI和SciTail任务的结果如下表和图所示。可以看到，在只有0.1%的域内数据(SNLI中为549个样本，SciTail中为23个样本)的条件下，MT-DNN的准确率超过80%，而BERT的准确率在50%左右，这说明MT-DNN学习的语言嵌入比BERT的更加通用。

与BERT相比，MT-DNN在SNLI和SciTail数据集上的精度更高。

在GLUE、SNLI和SciTail 3个benchmarks上的结果

在GLUE测试集的结果，MT-DNN在10个任务上的结果均超越了BERT

模型开源

微软已经在GitHub开源MT-DNN包，其中包含了预训练的模型、源代码，并描述了如何重现MT-DNN论文中报告的结果，以及如何通过domain adaptation使预训练的MT-DNN模型适应任何新任务。

标签：微软任务神经网络模型

相关阅读

Win7运行Wegame蓝屏出现该怎么应对

win7运行wegame蓝屏怎么办给予人的体验还是非常不错的，小伙伴们想必都

2023-06-08
wmvdspa.dll损坏修复方法

wmvdspa dll的位置会因为不同的操作系统版本和所安装的软件而有所不同

2023-06-08
storport.sys蓝屏无限重启应该如何应对

storport sys蓝屏无限重启怎么解决推荐给大家，可能不少网友在使用这款

2023-06-08
如何解决出现olepro32.dll加载错误的问题

olepro32 dll是一个Windows操作系统中的动态链接库文件。它是OLE（Obje

2023-06-08
PEX启动蓝屏出现应该如何应对世界简讯

pex启动蓝屏怎么办这个问题最近不少小伙伴都在研究，其实这个pex启动蓝

2023-06-08
环球热资讯！emulator64.dll丢失如何修复

如果您收到了“emulator64 dll找不到”的错误消息，可以尝试以下解决方

2023-06-08
天天要闻：实控人被列入失信被执行人名单，加加食品的股价持续下跌

消息面上，加加食品在6月6日晚间发布了关于公司控股股东及实际控制人被

2023-06-08
潘功胜回应汇率波动：我国外汇市场将有条件保持较为平稳运行状态

潘功胜指出，2023年以来，我国外汇市场运行总体平稳，跨境资金流动由年

2023-06-08
坐竹筏被筏工索要红包？广西阳朔：景区公司暂停涉事人工作2个月

广西阳朔县文化广电体育和旅游局6月8日发布关于遇龙河筏工索要红包事件

2023-06-08
“第一生育大省”广东作部署：支持有条件地区发放育儿补贴全球信息

6月7日，广东省卫生建康委、省发展改革委等17个部门《关于进一步完善和

2023-06-08
国家金融监督管理总局：要真正实现金融监管“全覆盖无例外”-焦点播报

国家金融监督管理总局局长李云泽在开幕式上表示，加强和完善现代金融监

2023-06-08
世界微资讯！线上线下齐发力全民共享“四川非遗购物节”

四川经济网讯（记者乔薇）“四川到底有哪些非遗好物呢？”“我的家乡理

2023-06-08
【环球播资讯】南充蓬安：护航高考交警同行

四川经济网南充讯（彭圣洲邓涛记者张小星文图）6月7日，2023年全国高

2023-06-08
每日观点：政府当“红娘”，企业来“相亲” 这场产销对接会为四川纺织服装产业送福音

四川经济网讯（记者刘婕文鲍安华图）为激活消费对经济增长的基础作用

2023-06-08
德阳市旌阳区双东镇“三强化”提升基层人才能力|世界快消息

德阳市旌阳区双东镇始终把发现、培养、使用优秀基层人才作为一项基础性

2023-06-08
向海图强！海洋经济“扬帆远航”_环球讯息

广阔无垠的海洋，是人类发展的“宝库”，海洋不仅为我们提供丰富的资源

2023-06-08
天天速读：两部门印发通知：举办全国和美乡村篮球大赛

新华社北京6月7日电（记者曹奕博、吴博文）农业农村部办公厅、国家体育

2023-06-08
南充顺庆：爱心助考 “电”亮未来

为助力考生顺利高考，营造一个文明和谐、舒心暖心的考试环境，日前，国

2023-06-08
德阳市旌阳区人大常委会调研区农村集体经济发展情况

为深入调研德阳市旌阳区农村集体经济发展情况，5月17日-6月6日，德阳市

2023-06-08
顶烈日战高温什邡公安交警为高考保驾护航

6月7日，全国高考正式拉开序幕。在什邡中学高中部、七一中学两个考场外

2023-06-08
Win7运行Wegame蓝屏出现该怎么应对

win7运行wegame蓝屏怎么办给予人的体验还是非常不错的，小伙伴们想必都

2023-06-08
wmvdspa.dll损坏修复方法

wmvdspa dll的位置会因为不同的操作系统版本和所安装的软件而有所不同

2023-06-08
storport.sys蓝屏无限重启应该如何应对

storport sys蓝屏无限重启怎么解决推荐给大家，可能不少网友在使用这款

2023-06-08
如何解决出现olepro32.dll加载错误的问题

olepro32 dll是一个Windows操作系统中的动态链接库文件。它是OLE（Obje

2023-06-08
PEX启动蓝屏出现应该如何应对世界简讯

pex启动蓝屏怎么办这个问题最近不少小伙伴都在研究，其实这个pex启动蓝

2023-06-08
环球热资讯！emulator64.dll丢失如何修复

如果您收到了“emulator64 dll找不到”的错误消息，可以尝试以下解决方

2023-06-08
csgo国服不能开箱子吗？csgo国服开箱子详细介绍

给大家推荐一款绝对可信正规的开箱网站，政府备案监管确保爆率真实性，饰品秒到库存，注册可享免费开箱...

2023-06-08
浙江空管分局首次建设完成国产化导航台设备

《中国民航报》、中国民航网记者赵瑜通讯员陈天霞、刘欣报道：6月2日，

2023-06-08
山东机场：强化“四心宣讲”奏响“空港乐章”|每日动态

《中国民航报》、中国民航网记者许晓泓通讯员刘亚楠报道：“学思想，强

2023-06-08
天津航空：为旅客提供安心的出行保障

《中国民航报》、中国民航网记者许晓泓报道：随着天气入夏，航空市场日

2023-06-08
新疆皮山机场新建工程选址报告获中国民航局批复环球速看料

中国民航网通讯员梁茂报道：近日，新疆皮山机场新建工程选址报告获得中

2023-06-08
世界快讯:移动廊道亮相广州白云机场为远机位乘机旅客撑“伞”

《中国民航报》、中国民航网记者郭瑛通讯员吴文静、焦攀、商玉珍、伍

2023-06-08
践行“绿水青山就是金山银山”通过设立巡逻队来禁止渔民非法采集珊瑚并吸纳渔民进入景区就业|环球微头条

践行“绿水青山就是金山银山”通过设立巡逻队来禁止渔民非法采集珊瑚并

2023-06-08
天天快看点丨海南海洋乐园大盘点～别收藏，我怕你玩不过来

海南海洋乐园大盘点～别收藏，我怕你玩不过来每年的6月8日是世界海洋日

2023-06-08
全球热讯:中级经济师《金融》每日一练（2023.06.08）

中级经济师《金融》每日一练（2023 06 08）,由经济师考试频道提供,查找

2023-06-08
2023山西太原市古交市招聘社区专职社工体检和考察公告_天天时快讯

古交市公开招聘社区专职社工面试工作已于6月3日结束，现对体检和考察有

2023-06-08
李云泽：下好风险前瞻防控先手棋以更加主动态度应对风险隐患-全球今亮点

6月8日，在第十四届陆家嘴论坛开幕式上，国家金融监督管理总局党委书记

2023-06-08
2023年6月大学生村官考试公告汇总

本文整理2023年6月份全国各地大学生村官考试公告、见习后备干部、乡村

2023-06-08
2023年山东泰安肥城市城市社区专职工作者招录进入面试范围人员递补名单（第三批）_时讯

2023年肥城市城市社区专职工作者公开招录进入面试范围人员递补名单（第

2023-06-08
微动态丨威高骨科：脊柱、创伤、关节三大领域全部集采并落地执行

威高骨科在互动平台表示，目前脊柱、创伤、关节三大领域全部集采并落地

2023-06-08
天天最资讯丨应急管理部：今年以来生产安全事故起数和死亡人数持续下降但重特大事故有所反弹

据中国网，6月8日，国新办就“贯彻落实党的二十大重大决策部署推进应急

2023-06-08
康泰医学：暂无脑机接口相关产品

康泰医学6月8日在互动平台表示，公司暂无脑机接口相关产品，但公司对市

2023-06-08
士兰微：65亿定增获证监会批文 IDM龙头加速汽车芯片产品升级

6月7日晚间，士兰微（600460 SH）披露了《关于2022年度向特定对象发行A

2023-06-08
世界新资讯：君禾股份：未来预期随着海外库存消耗及消费市场逐步复苏水泵主业会呈现复苏反弹

君禾股份近日接受机构调研时表示，公司主业还是以家用水泵为主，未来预

2023-06-08
《神秘岛》开发商新作《苍穹乾坤》使用AI辅助开发引众筹者不满

《神秘岛》开发商新作《苍穹乾坤》使用AI辅助开发引众筹者不满介绍了　

2023-06-08
环球快报:生存冒险游戏《血清》新预告支持简体中文

生存冒险游戏《血清》新预告支持简体中文介绍了　　今日（6月8日），生

2023-06-08
特别好评RPG游戏《恐怖的世界》完整版10月19日上线|环球精选

特别好评RPG游戏《恐怖的世界》完整版10月19日上线介绍了　　今日（6月

2023-06-08
永远杀不完任天堂发布《塞尔达》历代总BOSS加农集锦_焦点速读

永远杀不完任天堂发布《塞尔达》历代总BOSS加农集锦介绍了　　是官方偷

2023-06-08
腾讯《无畏契约》国服今日终测 20名英雄爽玩天天报资讯

腾讯《无畏契约》国服今日终测20名英雄爽玩介绍了　　腾讯代理的PC端5V

2023-06-08
客人去哪了？五一后各地餐饮生意直线下滑，突然就没人了

客人去哪了？五一后各地餐饮生意直线下滑，突然就没人了,今年以来，餐

2023-06-08
天天头条：五大行再次下调存款利率

6月8日，包括工商银行、农业银行、建设银行、中国银行和交通银行在内的

2023-06-08
潘功胜：中国稳健金融周期为经济和金融市场运行提供适宜环境

中国人民银行副行长、国家外汇管理局局长潘功胜6月8日在第十四届陆家嘴

2023-06-08
当前快看：理想汽车在青岛成立销售公司

理想汽车在青岛成立销售公司,天眼查App显示，5月25日，理想智行汽车销

2023-06-08
易纲：坚决把绿色金融工作摆在突出位置，实现“3060”目标需要胡萝卜加大棒

6月8日，围绕促进我国绿色金融发展和国际合作、全力以赴促进“3060”目

2023-06-08
十元店重回巅峰：新穷人与日本1990s

十元店重回巅峰：新穷人与日本1990s,中产没钱了，但“新穷人经济”很赚

2023-06-08
美国社交电商再起波澜：TikTok商城开张，Meta却要闭门做生|今日快看

美国社交电商再起波澜：TikTok商城开张，Meta却要闭门做生,“寸草不生

2023-06-08

精彩推荐

顶烈日战高温什邡公安交警为高考保驾护航

阅读排行

相关词