在这个项目中,我负责数字人训练所需的大量含有人脸的视频的准备工作。我编写了 Python 代码,代码逻辑如下:
1.使用 Python的 subprocess 模块运行 shell 命令,调用 yutto 工具下载B站视频。yutto 是一个用于从B站下载视频的开源工具。
2.利用 MoviePy 库将长视频分割成多个5秒的短视频。
3.使用 dlib 库执行人脸检测,每15帧进行一次人脸检测。如果在检测到的短视频中存在人脸,就保留下来。
4.将保留下来的含有人脸的视频段落整理和存储,以供后续的数字人训练使用。
5.删除没有检测到人脸的视频段落,以减少数据集的大小和冗余。