项目描述:
为了提升剧本评估效率与减少人员成本,基于公司的剧本评估和数据使用需求,从零搭建了西部影视大数据综合服务平台,实现剧本评估全生命周期的自动化内容解析,日常数据分析使用的影视剧资料基础、票房统计数据。
责任描述(核心人员):
• 需求细节梳理,业务功能设计,底层表(分层化)的设计(基础层-中间层-展示层);
• 工程框架的搭建,开发环境搭建,配置,基础组件,公共工具类,公用组件开发;
• 负责项目核心功能(各元素识别、标记、拆分,结构化)开发,算法的调研与实现(社交网络、情感脉络、冲突表现算法);
• 负责底层各类型(影视剧、影人、制作公司)、各维度的数据汇总、老化处理,海量原始数据的导入、清洗、梳理、流转、汇总以适配项目使用。
主要成果:
• 通过Mysql load data的方式实现海量数据(十万级别)入库,导入效率1s左右;
• 社交网络算法、剧情冲突表现算法调研与过程实现,社交网络算法获得了发明专利;
• 引入Hanlp自然语言模型框架实现元素标记、识别。