视频特效工厂是一款支持图片/视频抽象艺术化、美颜修复以及静音删除(即删除录音中空白部分并拼接音频)、pdf转docx、docx转pdf、图片转文字、提高图片分辨率等功能的软件,可自动批量生成多种卡通肖像,并对照片、视频进行抽象风格处理,对图片和视频进行美白、磨皮等细节修复和优化,同时可实现批量pdf与docx之间转换、图片转文字,极大提高工作效率。 同时,还能对手机、录音笔等录制的音频文件中的静音部分进行删除,自动、快速、批量删除音频文件中的空白片段、停顿间隔部分,并拼接有声部分。适用于警方调查、各类取证类长录音文件的静音片段去除。
这个项目是一个AI特效平台,其中包含很多AI模块,我主要负责底层AI算法实现,以及项目整体把控,其中涉及的到算法ocr识别,语音识别,pdf转docx,doc转pdf、照片艺术画等风格迁移等,这些模块都是以插件形式加载的,所以这个项目框架很复杂