码迷,mamicode.com
首页 > 其他好文 > 详细

JEMT模型

时间:2020-05-23 00:34:51      阅读:81      评论:0      收藏:0      [点我收藏+]

标签:信息   文字   alt   embedding   idt   png   它的   语言   mamicode   

1.概述

  机器翻译的输入一般是源语言的句子。但在很多实际系统中,比如语音识别系统的输出或者基于拼音的文字输入,源语言句子一般包含很多同音字错误, 这会导致翻译出现很多意想不到的错误。由于可以同时获得发音信息,我们提出了一种在输入端加入发音信息,进而在模型的嵌入层

融合文字信息和发音信息的翻译方法,大大提高了翻译模型对同音字错误的抵抗能力。

2.Joint Embedding

  对于源语言的一个词,它的发音单元记作

        技术图片

  作embedding时,每一个s作一次embedding,记作:

    技术图片

 

   对于一个词的embedding是l+1维

    技术图片

 

最后通过公式

    技术图片

 

    将三个向量合成一个向量

 

 

 

 

 

  

JEMT模型

标签:信息   文字   alt   embedding   idt   png   它的   语言   mamicode   

原文地址:https://www.cnblogs.com/yangyang12138/p/12940397.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!