SummaryReport.txt

# “电商评论观点挖掘”比赛 总结
标签: NLP 比赛 总结
[2019.9.2] xmxoxo 

-----------------------------------------
## 参赛总结 

初赛已经截止了，目前得分是0.725，排名是82，看来进入复赛是不太可能了。
不过参加初赛这个过程还是挺有收获的，还是需要总结一下。

### 我的收获

* 一个完整的参赛项目。 
	之前的参赛项目都比较零碎，这个算是比较完整的参赛项目了，从项目日志，阶段目标，提交结果，在一周内完成。

* 完整使用了github的合作功能。 
因为有两个人合作，使用github的合作功能来完成，虽然中间也有插曲，也算是体验了一下远程合作。

* 对于复杂问题多模型方式有了更深的理解。 
	这次比赛内容不是一个模型就可以解决的，选用了多个模型进行组合。
	多模型之间的数据连接，前后关联就是最重要的关注点。

* 积累了一些可复用的工具
	在整个项目中，虽然模型离开了比赛失去了作用，但是一些工具是可以复用的，为以后类似的比赛和工作提供了方便。
	这些工具有：序列标注结果提取工具； 分类结果提取工具；模型评估工具；自动化作业流程工具；

* 看到了自己的不足
	整个比赛方案其实就是基于BERT的直接fine-turing，并没有深入。
	如果整个结果还需要提升，正如之前与教授沟通的那样：“这是个黑盒子，如果不能调整它，我们无法按需求来提升得分”
	在NLP上还需要其它的知识来补充。

### 我的遗憾

* 最优结果没能提交
	最遗憾的就是初赛结束了，最后一次优化的结果还没有出来，没能及时提交。
	主要的原因是一些通用的代码鲁棒性不够，链条后端做一个微调，影响到链条前部的环节修改。
	另外一键执行的功能不够弹性，无法直接从中间步骤开始，导致需要手工执行，影响了效率。

* 合作经验不足，沟通不够。
	对于团队共同完成比赛，这样的经验太少了。初期分工不够明确，没有及时沟通整个项目的框架；
	中间过程中阶段目标也没有及时明确，在沟通上花了不少时间。

* 信息来源获取太窄了。 
	比赛消息是从群里获取的，知道的时候离初赛结束只剩下一个半星期了。
	如果把自己的定位方向放在NLP，应该更多更主动的去了解NLP方向相关的比赛与行业动态。


### TODO

比赛结束了，但想做的事不会结束。虽然没能进复赛，但还是有些后续想做完的事。

* 把参赛日志整理形成成博文；
	把参赛思路，主要代码片段整理出来分享一下，应该还是有点意义的。

* 把复用工具整理成可完全复用的通用工具；
	复用工具要真正能够通用才行。