Skip to content

Latest commit

 

History

History
15 lines (13 loc) · 709 Bytes

README.md

File metadata and controls

15 lines (13 loc) · 709 Bytes

Chinese VTB Corpus

中文虚拟主播观众弹幕语料库

Alt

收录范围:

2020 年 2 月起,更新中

数据来源:

前端项目 GitHub 指路

数据格式:

  • comments.txt 是弹幕,highlights.txt 是形目留言(SC);
  • txt 文件每一行即一条弹幕;
  • 文件夹按 年/月/日 排列;
  • clip_comments 文件夹下为直播中弹幕,off_comments 文件夹下为未开播时弹幕。