- 文献阅读:每两周每人一篇文献,通过一个小时的项目研讨会进行汇报
Motivation : 前人有什么问题?思路哪里来?目的是什么?
Methodology : 具体的 Contribution 是什么(model? training precedure? or task, detail, etc?) 解决问题的方法是什么?
Experiment : 结果不重要,重点是结论,也就是论文对其所提出的创新方法的评估,和论文提出模型的一些重要性质
- 代码技术提升:这个是当下最重要的任务,通过 Github 关注进度
Github 上优秀项目代码:先 fork 到自己的 repo 里面,clone 到本地,用注释写笔记,然后把笔记 commit&push 到 Github. 要求补充学习代码所import 的包(入门即可,会看 API 文档即可)
Python 学习:廖雪峰的 Python 教程,看到“面向对象编程”即可,或者“正则表达式”。(其实 Python 要学的这几个部分之前按创研都讲过)
PyTorch 实战 :尤其是看和咱们课题相关的部分, 实战代码上传 Github. 如淘宝书 《PyTorch 实战》、CSDN/知乎等 "XXX 实战"、Bilibili "xxx实战"等等。(其实 PyTorch 要学的部分之前创研都讲过)
可选项:Leetcode :有数据结构与算法基础的,可以在这里锻炼代码能力,刷题代码上传 Github
*优先完成 Github 优秀项目代码学习,Python/PyTorch 实战可以置后(如果之前创研活动上学得比较扎实的话),没有数据结构与算法基础的,不用刷 Leetcode
- 学习论文相关知识,并会写其代码!
- 代码技能突破:熟读不如手过一遍
每人用一周时间选择一个喜欢的但是不复杂的课题强相关神经网络模型,复现出来,一边复现,一边学习相关的代码知识
- 理论知识学习:建立起初步的理论知识基础
NNDL : nndl.github.io 这本书要尽量读完
可选项:课题相关理论:如 CV 组的计算机视觉、图像处理等相关理论书籍,如 NLP 组的统计自然语言处理、知识图谱、图神经网络、计算语言学等相关理论书籍
*读 NNDL 书时,请先阅读书籍最后的“数学基础”附录章节,如果实在不理解,或者实在不理解书中的数学推导,可以跳过
- 文献阅读:同上,预计每周每人一篇
- 项目代码实现:最晚暑假开始三周后着手进行项目代码实现
代码实现主力为袁梓钊、李瑞琦(CV组),张毅博、孙肇泽(NLP组)
代码实现副力为王泽坤、侯亚鲲(两组)
注意!不是生写!建立在 Github 上前人已完成项目的基础上写!举两个例子:如 Transformer 结构不必自己生写,调用 Hugging Face 的 Transformer 包即可;如 StyleGAN 中的一些函数,也不必生写,调用 StyleGAN 自己开源的代码(里面的函数)即可!
- 自由安排,下面是闲暇时间的推荐任务(从优先到不优先):
欣赏 Github 优秀项目代码
读 NNDL 理论书
文献阅读
自己写个小项目
产出有学术意义的 idea
- 任务接续:张毅博、王泽坤进行,全员留校
王泽坤:主要负责 CV 项目的代码实现接续工作
张毅博:主要负责 NLP 项目的代码实现接续工作
- 项目代码实现:该阶段核心任务
最晚期中考试前至少要完成 runnable version!
期末考试=寒假开始前:至少要完成 good version
- 困难攻坚:针对代码、理论难点进行攻坚创新
攻坚主力:王泽坤
攻坚副力:理论水平足够的队员
攻坚队伍一方面联系老师寻求技术解决方案,另一方面会给代码队伍提出需求,要求代码队伍快速完成需求更新项目代码(删、改、甚至推翻)
- 项目代码实现:该阶段核心紧急任务,全员留校(除春节前后5-10天外)
最晚春节前完成 displayable version
最晚开学前完成 optimal version
- 困难攻坚:针对代码、理论难点进行攻坚创新,消融实验等的设计
- 补充实验:进行消融实验等,由项目代码实现主力进行
- 学术论文写作与发表:这是这段时期的核心任务
论文写作主力:王泽坤
论文写作副力:全员
论文修改:指导教师
发表参考:IJCAI 2022, ICCV 2022, NAACL 2022 Workshop, PRICAI 2022, SIGKDD 2022; 英文期刊;中文期刊;申请专利(软件著作权)等
*别不小心一稿多投了!
- 参赛论文写作与答辩:全员共同准备。