用300vw数据集进行基于视频的关键点检测,应该怎样进行预处理?

请问您知道300VW数据集train和test是怎么划分的吗 还有test里三个场景 是数据集里就划分好的吗?为啥我这个数据集没有分类 只有总共114段视频 我看别的论文里都是针对三个场景的测试集进行指标比较的