-
Notifications
You must be signed in to change notification settings - Fork 18
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Graph Collection] 建一个能够想得到的所有的 GitHub 图数据的列表 #32
Comments
有些数据是可以构建的,这也是基础性工作。我认为需要有一个驱动才好往下进行。 |
好问题,大家可以想想~ |
基于以上形成一个 GitHub 图数据研究框架:https://xlab2017.yuque.com/msdpvs/me6vqg/dekucm?singleDoc# 《🍀GitHub 图数据研究框架》 |
我认为这个图网络没必要全域数据,只需要找到一定数量级的数据维度即可:
中等规模数据集分析(节点在1W-10W的数据集) |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
GitHub 上的图数据是我们的重点研究对象,因此根据我们平时在参考文献、实践观察、贡献开发等过程中,提炼出的各种图数据进行归纳总结,是一项基础性的工作,举例如下,欢迎大家一起来收集:
1、Fol-Graph / Spo-Graph
GitHub 上 Follow 社交关系做组成的一个图,节点为 GitHub 上的注册开发者,是一个典型的社交网络图。与此类似的还有一个 Sponsor Graph,即 Sponsor 了该开发者的开发者。
2、WFS-Graph
这是一类二部图,一类节点为开发者,一类节点为项目,WFS 分别代表 GitHub 上的三类典型事件:Watch、Fork、Star,大致代表了“长期关注”、“参与意愿”、“支持点赞”。
3、Dep-Graph
Dependency Graph 代表了开源组件之间的依赖关系,出了 GitHub 上本身有一些以外,从软件供应链的视角,可以构建更加全面完整的组件依赖关系,是研究供应链下开源软件的重要工具。
4、Cont-Graph
Controbution Graph 也是一类二部图,由开发者与项目两类节点组成,开发者通过 Issue、Comment、PR、Text/Code Commit 等等,代表了开发者与项目之间的贡献关系。
5、Coll-Graph
collaboration Graph 代表了协作关系图,有两类,一个是由于开发者在同一个 Issue、PR、repo 等上面进行贡献所生成的开发者协作网络(节点为开发者),另一个是由于同一个人同时在不同的 Issue、PR、repo 等上面进行贡献所生成的项目协作网络(节点为 Repo),都是非常值得研究的图结构。
6、@-Graph
在项目协作的过程中通过@来提醒开发者,是一个常见的动作,因此,由@行为,所构建的一个协作网络也是一个不错的视角来研究开发者这种日常相对更加紧密的协作行为。
7、Ref-Graph
开源协作中的交叉引用非常普遍,同一个或跨项目之间的,issue 和 issue 之间的引用,PR 和 issue 之间的引用,以及仓库之间的链接引用等等,都构成了引用关系。
具体参考这个 Issue:#3
8、Int-Graph
Interactive Graph 是更加细粒度的在 Issue 与 PR 中的评论回复关系所构建的图。具体参考这个 Issue:X-lab2017/open-research#55
9、Rea-Graph
Reaction Graph 是通过 Reaction emoji 方式,建立起来的开发者之间的社交链接,具有情感关系的一种网络图,也是一个不错的视角。具体可以参见:X-lab2017/open-wonderland#145
10、Pro-Graph
在项目管理的过程当中,也会存在各种细粒度的操作,分配、参与、提醒等,都是把人链接起来的点,合适的视角与数据采集方式,也能有出乎意料的功效。
以上只是部分的建图思路,还能继续挖掘出各种各样的图来,特别是,上面这些图还是可以组合的,更够形成更加复杂、语义丰富的关系图,为各类不同视角下的研究,提供了很好的基础工具,欢迎大家多挖掘,多提出~
The text was updated successfully, but these errors were encountered: