全球自然语言处理领域的顶级会议EMNLP2023于12月6日-12月10日在新加坡举行,会议共收到4909篇投稿,主会录用论文1047篇,录用率21.3%。EMNLP的全称是Conference on Empirical Methods in Natural Language Processing,由国际计算语言学会ACL组织每年举办一次,是自然语言处理领域最具影响力的国际会议之一。本次会议,微信AI团队有8篇文章被选中。其中,由北京大学和微信AI团队合作的文章获得EMNLP录取文章中最佳长论文奖(Best Long Paper Award),这也是EMNLP会议上国内首篇获此殊荣的论文。
图1. 获奖论文
图2. 获奖证书
微信AI团队声名显赫,他们的研究文章获得了主会最佳长文奖
这篇获奖论文的题目是“标签词是锚点:从信息流角度理解上下文学习”。研究了上下文学习(ICL)的工作机制。首次发现了在上下文学习中,演示示例的标签词起到了“锚点”的作用:1)在浅层计算层的处理过程中,语义信息聚集到标签词表示中;2)在深层计算层的处理过程中,标签词中聚合的信息为语言模型的最终预测提供参考。基于这些发现,文章进一步提出了“锚点重新加权”方法来提高上下文学习的性能,以及用于诊断上下文学习错误的分析框架。这项工作也为未来相关研究指引了新的方向。
图3. 上下文中演示示例的标签词作为“锚点”的示意图
这篇论文的作者来自北京大学孙栩教授团队和微信AI团队。论文的第一作者王乐安是在微信AI团队实习的北大研究生,他在本科阶段就读于北京大学智能科学与技术系,是2019级全系第一名。这也是他在自然语言处理领域主会议上发表的第一篇论文。在研究过程中,北京大学孙栩教授团队和微信AI团队紧密合作,就研究方向、核心问题、实验改进以及论文修改等方面进行了充分的讨论和深入的工作。王乐安扎实的数理基础和专业知识,以及孙栩教授清晰准确的指导和建议给人留下了深刻的印象。
专注于前沿技术研究,微信AI团队多项研究成果令人瞩目
微信AI团队在多个领域的研究都取得了显著的成果。在全球学术界最具权威的机器翻译比赛(Workshop on Machine Translation,简称WMT)2020 ~ 2022连续三年里获得多个赛道冠军,比赛参与者包括来自全球的许多企业、科研机构和高校组成的顶尖团队。在2018和2019年的对话系统技术挑战赛(Dialog System Technology Challenge,简称DSTC)中也连续多次获得冠军。
微信AI团队一直致力于将业务与学术研究相结合,通过在业务中发现科研课题。他们认为,业务和研究是相互促进的关系:“通过研究来发现更好的方法,最终结果也可以直接应用在业务中。”本次会议中的多项工作已经进一步推动了对话系统、微信翻译、微信读书、微信输入法等多个业务场景的应用。
以下是微信AI团队入选的8篇文章:
1. 标签词是锚点:从信息流的角度理解上下文学习
Lean Wang, Lei Li, Damai Dai, Deli Chen, Hao Zhou, Fandong Meng, Jie Zhou, and Xu Sun are the authors of this work.
2. 使用基于超网络的解耦方法来提高少样本关系抽取模型的泛化能力
Liang Zhang, Chulun Zhou, Fandong Meng, Jinsong Su, Yidong Chen, and Jie Zhou
3. Re3Dial: Retrieve, Reorganize and Rescale Conversations for Long-Turn Open-Domain Dialogue Pre-training
Jiaxin Wen, Hao Zhou, Jian Guan, Jie Zhou, Minlie Huang
4. 多源探测用于开放领域的对话理解
Yuanxi Li, Hao Zhou, Jie Zhou, Minlie Huang
5.明确的规划有助于语言模型在逻辑推理中的表现
Hongyu Zhao, Kangrui Wang, Mo Yu, Hongyuan Mei
6. D2TV: 双重知识蒸馏和面向目标的视觉建模,用于多对多多模态摘要
Yunlong Liang, Fandong Meng, Jiaan Wang, Jinan Xu, Yufeng Chen, and Jie Zhou are the authors of this work.
7. 解读跨语言摘要中的翻译术语
Jiaan Wang, Fandong Meng, Yunlong Liang, Tingyi Zhang, Jiarong Xu, Zhixu Li, and Jie Zhou
8. Improving the Extraction of Argument Structure by Efficiently Utilizing Contextual Information
Yun Luo, Zhen Yang, Fandong Meng, Yingjie Li, Jie Zhou, and Yue Zhang
雷峰网(微信公众号:雷峰网)