Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

train 和eval时间 #152

Open
jichangzhen opened this issue Aug 23, 2019 · 6 comments
Open

train 和eval时间 #152

jichangzhen opened this issue Aug 23, 2019 · 6 comments

Comments

@jichangzhen
Copy link

不知道train 和eval到什么程度可以去解码,训练多长时间

@trc1998428
Copy link

我也想请教下,刚跑这个代码,不太懂eval是要和train同时跑么?

@jichangzhen
Copy link
Author

jichangzhen commented Mar 20, 2020 via email

@googlx
Copy link

googlx commented Jun 21, 2020

论文中有详细说明:

数据集:CNN/Daily Mail

  • 训练集大小287,226
  • 验证集大小13,368
  • 测试集大小11,490

GPU型号:Tesla K40m GPU

超参数

  • batch size:16

训练轮数及时间

  • 230,000轮(12.8个epoch),耗时3天4小时
  • coverge:额外训练3000轮,耗时约2小时

@hustcxx
Copy link

hustcxx commented Nov 11, 2020

不是,是分开跑的 发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: trc <[email protected]> 发送时间: 2020年3月17日 02:53 收件人: abisee/pointer-generator <[email protected]> 抄送: jichangzhen <[email protected]>, Author <[email protected]> 主题: 回复:[abisee/pointer-generator] train 和eval时间 (#152) 我也想请教下,刚跑这个代码,不太懂eval是要和train同时跑么? — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

这个eval要跑到什么时候以及作用是什么,eval跑完了之后还需要在跑train吗?我这边是把train阶段终止了之后再去跑这个eval,发现log/eval目录下什么也没有呀,难道他的功能就只是保存最好的模型到log/train目录中吗?

@XuemingQiu
Copy link

这个eval的意思是不是,只在测试集上计算了训练结束最后的一个模型?

@yuzexin05
Copy link

这个eval要跑到什么时候以及作用是什么,eval跑完了之后还需要在跑train吗?我这边是把train阶段终止了之后再去跑这个eval,发现log/eval目录下什么也没有呀,难道他的功能就只是保存最好的模型到log/train目录中吗?

同问,这个eval要跑多久,作用是啥呢?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants