Skip to content

longredzhong/EETask

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

41 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TODO:

  • 完成训练、验证一条龙服务
  • 使用其他数据集验证我的代码是否有问题 不需要了问题解决了
  • 使用bert或者其他预训练模型~~,因为感觉Albert有点问题~~
  • 完善训练代码,加入对test1.json的预测,加入实验数据记录
  • linear_schedule_with_warmup有问题或者我用错了,需要完善
  • 改善模型
    • 将分类与序列标注相结合
    • 简化序列标注类别
  • 如果以后精度提不上去了,就搞一波超参数搜索
  • 训练时加入学习率衰减

踩坑记录

  • torch的bucketiterate要慎用,因为如果使batch中的text长度趋于一致,可能能会改变数据的分布,使模型难以学习
  • 预训练模型的学习率要小 1e-5,crf层的学习率要大,大概是一百倍吧,苏剑林大佬讲的,因为我没有做完整的实验,所以也不知道情况

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages