码迷,mamicode.com
首页 > 其他好文 > 详细

Open-Domain Question Answering 开放域问答

时间:2020-06-26 01:05:10      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:acl   规模   implicit   向量空间   err   idf   设置   推理   出现   

内容源自  https://www.aclweb.org/anthology/2020.acl-tutorials.8.pdf

1描述开放域问题回答(QA)是利用大量不同主题的文献来回答问题的任务,是自然语言处理(NLP)、信息检索(IR)中长期存在的一个问题。

及相关领域(沃海等人,1999年;摩尔多瓦人有只科幻片al。2000: Brill等。2002: Ferrucci等人,2010)。传统的QA系统通常是一个管道,由许多不同的组件组成,如问题处理、文档/文章检索和答案处理。随着神经阅读理解的快速发展(Chen, 2018),传统红外技术与神经阅读理解模型相结合,重构了现代开放域QA系统(Chen et al., 2017;Yang et al., 2019: Min et al., 2019a)甚至在全面实施端到端时尚(Lee等)2019年;Seo等2019年;Guu等人,2020年;罗伯茨等人,2020)。In本教程,我们的目的是提供一个全面和连贯的概述在这个方向的前沿研究我们将首先简要介绍开放域问题的背景,讨论研究问题的基本设置和核心技术挑战。我们的目的是让观众了解这个领域在过去几十年是如何发展的,从早期的高度调制管道系统,到现代的深度神经网络的端到端训练。然后我们将讨论提出的现代数据集用于开放域QA(Voorhees等人,1999年;贝兰特等,2013;Rajpurkar等,2016;Joshi et al., 2017: Dhingra et al., 2017;邓恩等,2017:Kwiatkowski等人,2019年),以及共同的评估指标和基准。我们计划提供详细讨论了可用数据集的收集方法和属性——以及在开放域QA的背景下如何看待这些数据集接下来,焦点将转移到为开放域QA提出的尖端模型上。这也是本教程的中心部分。我们将现有的模型分为三大类:两阶段检索-阅读器方法。我们将展示不同模型背后的逻辑元素,并讨论它们的优缺点。两级retriever-reader方法。我们将从讨论开放域QA的两阶段检索-阅读器框架开始,该框架由Chen等人(2017)首创:检索组件查找文档,它(可能)包含来自大量文档集合的答案,然后阅读器组件查找给定段落或文档中的答案。在这个类别中,retriever组件通常由传统的稀疏向量空间方法实现。如TF-IDF或BM25,阅读器是由神经阅读理解模型实现的。我们将进一步讨论在该领域出现的一些挑战和技术,包括多通道培训(Clark and Gardner, 2018: Wang et al., 2019)、通道重排序。(Wang等人..2018:Nogueira and Cho,2019)以及去噪远监督数据(Lin等。2018).密集猎犬和端到端训练。第一类主要采用非机器学习模型进行检索。第二类将关注如何通过用密集表示代替传统的IR方法来学习检索器组件,以及如何联合训练这两个组件。在稠密向量空间中学习和搜索是一项具有挑战性的工作

什么Retriever-free方法。第三类。这是最近出现的趋势,仅仅依赖于大规模的预训练模型(Radford等。“2018;Devlin et al., 2018;2019)作为implicit知识库,不需要在推理期间访问文本数据。这些预先训练好的模型将被直接用于回答问题,以零射击的方式(Radford等。2019年Raffel等人。或者使用问答对进行微调。由于这些方法不需要检索组件,所以我们称它们为无检索方法到目前为止,我们的教程主要关注文本问题的回答。最后,我们还计划讨论一些混合的方法来回答开放领域的问题,使用文本和大型知识库,如Freebase (Bol)lacker等人,2008)和Wikidata (Vrande?ie andKrotzsch, 2014),并对结构化数据如何补充非结构化文本中的信息进行了评论。方法包括(1)如何利用结构化数据来指导现有文本OA svstems (Asai)的检索或读取阶段et al. 2020: Min et al. 20202019b)、或(2)如何同步对来自这两个不同来源的信息进行分类,并在com上建立有效的质量保证模型结合信息(sun et al. 2018)。2019:熊等,2019)最后,我们将讨论一些重要的问题,包括(1)与过去十年开发的QA系统相比,我们取得了多大的进展?(2)当前方法的主要挑战和局限是什么?(3)如何权衡效率(计算时间和。记忆要求)和深度学习时代的准确性?我们希望我们的教程不仅能为读者提供一个有用的资源,让他们有效地获取最新的知识,而且为下一阶段促进开放领域OA研究的发展提供新的视角。

以上内容翻译自论文《Open-Domain Question Answering》

——————————————————————————————————————————————————————

(1)知识问答系统中的数据收集;

(2)并对结构化数据如何补充非结构化文本中的信息;

(3)机器学习模型训练;

(4)不同数据源的信息分类与更新。

 

Open-Domain Question Answering 开放域问答

标签:acl   规模   implicit   向量空间   err   idf   设置   推理   出现   

原文地址:https://www.cnblogs.com/xiaonezhaya/p/13193399.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!