Skip to content

Evaluation

阪本 浩太郎 edited this page Jan 28, 2017 · 1 revision

自動評価として、システムの解答が模範解答と内容が近いかを概念の重複度で計算するROUGEのスコアを出力します。 ROUGEには様々な値がありますが、ROUGE-1(概念の1-gram)とROUGE-2(概念の2-gram)のF1スコアを出力します。 概念単位としては、UniDic辞書+世界史用語ユーザ辞書を用いたMeCabの出力結果から作成する内容語です。

参考:

Clone this wiki locally