一,数据获得和筛选
该作者在B站影视-影视剪辑分区下进行检索,使用的是B站自带的搜索功能,而非python之类的编程工具。输入关键词润玉邝露角色名,还有演员名搜索得到的。大部分的视频会投在这个分区下,但不排除个别未在此分区中。根据润玉邝露cp 的特征,采用 “润玉"and "邝露” ,“罗云熙”and"杜雨宸“ 基本可以检索到99%的玉露及玉露衍生视频。要想穷尽,应包括更多关键词,但使用B站的搜索框,便成了大量手动。可以但不必要,在简化的搜索式下,结果仍有很高的概括性。
润玉相关的关键词包括 “润玉”,“罗云熙”,“容齐”,”上官透“,”周小山“,”申赫“,“袁帅”,”秦明“ 等等。(我太懒,未能穷举)。
邝露相关关键词:”邝露“,”杜雨宸“,”谢韫之“,”纪小行“,”梅溪寒“,”鹿玥“ 等等。(我太懒,未能穷举)。
关于一些定义
作者将播放量超过一万的视频定义为热门视频。
筛选
得到结果后,该作者首先依据标题进行筛选,排除非主角,排除cut等不符合她设定标准的cp视频。因为她需要分析13对CP,这个准则是适用的。但对于玉露来说,必然会出现遗漏数据,比如散落在“意难平”盘点中的玉露,自制剧中非主角的玉露等等。