从rnn到lstm,再到seq2seq(二)

从图上可以看出来,decode的过程其实都是从encode的最后一个隐层开始的,如果encode输入过长的话,会丢失很多信息,a56爆大奖在线娱乐设计了attation机制。 attation机制的decode的过程和原来的最大的区别就是,它输出的不只是基于本时刻的h,而是基于本时刻的h和C的concat矩阵。 那
posted @ 2017-05-21 13:16  dmesg  阅读(5365)  评论(0编辑  收藏  举报