职位ID:151379
需要一个Python代码,可以对视频按特征切割。视频时对手机上的聊天应用录屏,带声音,当把视频里的声音提取出来后,不知道某段声音是谁说的。截屏中列出了聊天者的名字列表,当前说话人名字背景高亮或有个图标(程序参数控制),需要识别出这个说说话人的图片,并ocr出来,然后提取他说的语音出来为单独文件,记录说话起始结束时间,这些信息放入JSON。最后合并为一个大的JSON,包含各段说话人信息与语音文件名。
工程师完善技术能力和项目经验,更易接到订单
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
需求方请加需求方端客服沟通需求,工程师请加工程师端客服浏览推送职位