Skip to content

Latest commit

 

History

History
12 lines (10 loc) · 418 Bytes

README.md

File metadata and controls

12 lines (10 loc) · 418 Bytes

DataProcessing

#此代码用于模型训练前的数据预处理的典型过程, 包括: 1.建立Word2id 和 id2word 的字典 2.batch切分 3.最大长度截断

##code方面: 这是通过RNN+Attention进行的语义相似度的模型,其精妙之处在于: 1.通过BILSTM进行上下文语义的完整理解 2.通过4种Attension方式选择最佳的方式进行Query与Query之间的联系与Attention