写在博士生开始前

这周末就是博士生开学典礼了,对自己的近况进行一个简单的介绍与总结。

近况

这一学年的显式收获是一篇 CIKM 2019 的 short paper。在经过 IJCAI 以一个大概 borderline 的分数被拒、拆出一部分当作本科毕设后,这份工作终于可以准备收尾了。同时,我也要去寻找一个能够支撑我整个博士生研究的新方向了。

为什么不再做当前的时间序列分析方向了?简单来说,单纯的时间序列所包含的信息量较少,简单而更具有可解释性的一系列传统方法已经有很好的表现。在这种情况下,使用深度学习来进行预测或者分类不一定能够表现更好,同时还会有解释性差、计算量大等问题。另外一点是,时间序列分析目前确实不是学术界研究热点,它可能更适合有大量可用数据的工业界研究人员进行挖掘来真正创造经济效益,而不适合作为一个只能用着开源数据集、还需要在一个研究领域耕耘至少五年的博士生的选题。

能中论文,当然会陷入短暂的兴奋中。但是收到邮件没过半天,我又回到沮丧的常态中。首先邮件中的评审意见里对这篇论文列举了很多问题,大多数都是我早已心知肚明的:没有在更多更大的公共数据集上进行实验、没有用实验证明我们的方法到底适用于有什么特点的数据、没有展现参数的设置如何影响模型的总体表现,等等。总而言之,没有对论文中提出的每个结论设计缜密的实验来证明。

更为深层的原因是,在这个月里,我渐渐发现这一年我好像并没有什么什么实质的进步。我仍然效率低下、没有做好时间管理、经常废弃既定的学习计划,作息紊乱、无法集中注意力、迷失在杂乱的信息流中,得过且过、不求甚解。看似阅读了很多论文,了解了一个领域,研究出一种方法,发表了一篇会议。实际上每次随便找了两篇论文浅浅看过就开始拿别人的东西堆叠想模型,对整个领域/方向/任务没有将顶会论文全部搜查一遍,对共性问题没有深入思考,甚至连 evaluation metrics 该采用哪些为什么都没有总结和思考过。最终的结果就是,成长速度奇慢。

博一的主要目标

  1. 最主要的目标当然是把所有课程顺利修完。
  2. 对未来的研究方向进行考察。考虑因素包括(在五年后)有较好的发展前景、对外部条件要求不高、出成果不是非常困难、符合自己兴趣。考察过程中要全面地了解领域现有任务、问题、方法、领军学者/机构。
  3. 夯实理论基础。每次选定书/课学习就坚持下来,控制在一个月内学习完成。回想一下,本科阶段最大的提升之一就在于坚持修完了吴恩达深度学习课程。
  4. 通过论文复现练习和数据竞赛来提高编程、调参等水平。数据竞赛方面的最终目标在 Kaggle 能在一场比赛中持续参加并获得银牌以上。
  5. 能够及时将感兴趣的论文/blog 消化到能和别人随口讲清楚的程度。每周尽量读一篇和当前研究方向不太相关的、近期顶会的 best paper 或者引起广泛讨论的 paper,来理解并吸收其他领域的思路。
  6. 发表一篇自己较为满意、对领域有贡献的论文。

最后,我在考虑把博客翻修一下。