Chinese VTB Corpus 中文虚拟主播观众弹幕语料库 收录范围: 2020 年 2 月起,更新中 数据来源: matsuri.icu(by brainbush) 前端项目 GitHub 指路 数据格式: comments.txt 是弹幕,highlights.txt 是形目留言(SC); txt 文件每一行即一条弹幕; 文件夹按 年/月/日 排列; clip_comments 文件夹下为直播中弹幕,off_comments 文件夹下为未开播时弹幕。