-
Notifications
You must be signed in to change notification settings - Fork 16
/
Copy pathSummaryReport.txt
58 lines (39 loc) · 2.82 KB
/
SummaryReport.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
# “电商评论观点挖掘”比赛 总结
标签: NLP 比赛 总结
[2019.9.2] xmxoxo
-----------------------------------------
## 参赛总结
初赛已经截止了,目前得分是0.725,排名是82,看来进入复赛是不太可能了。
不过参加初赛这个过程还是挺有收获的,还是需要总结一下。
### 我的收获
* 一个完整的参赛项目。
之前的参赛项目都比较零碎,这个算是比较完整的参赛项目了,从项目日志,阶段目标,提交结果,在一周内完成。
* 完整使用了github的合作功能。
因为有两个人合作,使用github的合作功能来完成,虽然中间也有插曲,也算是体验了一下远程合作。
* 对于复杂问题多模型方式有了更深的理解。
这次比赛内容不是一个模型就可以解决的,选用了多个模型进行组合。
多模型之间的数据连接,前后关联就是最重要的关注点。
* 积累了一些可复用的工具
在整个项目中,虽然模型离开了比赛失去了作用,但是一些工具是可以复用的,为以后类似的比赛和工作提供了方便。
这些工具有:序列标注结果提取工具; 分类结果提取工具;模型评估工具;自动化作业流程工具;
* 看到了自己的不足
整个比赛方案其实就是基于BERT的直接fine-turing,并没有深入。
如果整个结果还需要提升,正如之前与教授沟通的那样:“这是个黑盒子,如果不能调整它,我们无法按需求来提升得分”
在NLP上还需要其它的知识来补充。
### 我的遗憾
* 最优结果没能提交
最遗憾的就是初赛结束了,最后一次优化的结果还没有出来,没能及时提交。
主要的原因是一些通用的代码鲁棒性不够,链条后端做一个微调,影响到链条前部的环节修改。
另外一键执行的功能不够弹性,无法直接从中间步骤开始,导致需要手工执行,影响了效率。
* 合作经验不足,沟通不够。
对于团队共同完成比赛,这样的经验太少了。初期分工不够明确,没有及时沟通整个项目的框架;
中间过程中阶段目标也没有及时明确,在沟通上花了不少时间。
* 信息来源获取太窄了。
比赛消息是从群里获取的,知道的时候离初赛结束只剩下一个半星期了。
如果把自己的定位方向放在NLP,应该更多更主动的去了解NLP方向相关的比赛与行业动态。
### TODO
比赛结束了,但想做的事不会结束。虽然没能进复赛,但还是有些后续想做完的事。
* 把参赛日志整理形成成博文;
把参赛思路,主要代码片段整理出来分享一下,应该还是有点意义的。
* 把复用工具整理成可完全复用的通用工具;
复用工具要真正能够通用才行。