5年左右数据科学从业经验,先后服务于美国500强数据驱动类金融机构、大数据公司。研发Github Python算法包获得50万+下载量。具有理工和金融复合背景,熟悉Python、SQL,了解Docker、ES。
项目一:
变量聚类Python算法包研发。变量聚类是一种很好的降维算法,这里有一个简短的描述:
1、选择要拆分的群集;
2、通过查找前两个主成分,执行正交旋转,并将每个变量分配给与之具有更高平方相关性的旋转分量,将所选簇分成两个簇;
3、变量被迭代地重新分配到集群,以最大化由群集组件所占的方差。
我的职责:全栈;负责算法的设计和优化、Python package开发、案例测试、文档编写、打包上线、疑问解答。
项目二:
金融机构数据分析平台(Web)。实现业务数据、核心经营指标、模型在网页端的筛选、展示和可视化,覆盖市场数据跟踪、交易数据分析、客户数据分析等,可视化类型包括表格、折线图、柱状图、堆积图、扇形图、地图、桑基图等。
我的职责:全栈;负责环境搭建、数据流程梳理、产品设计、产品开发、业务流程梳理、数据分析、模型建立、可视化开发等。
变量聚类Python算法包研发。变量聚类是一种很好的降维算法,这里有一个简短的描述: 1、选择要拆分的群集; 2、通过查找前两个主成分,执行正交旋转,并将每个变量分配给与之具有更高平方相关性的旋转分量,将所选簇分成两个簇; 3、变量被迭代地重新分配到集群,以最大化由群集组件
金融机构数据分析平台(Web)。实现业务数据、核心经营指标、模型在网页端的筛选、展示和可视化,覆盖市场数据跟踪、交易数据分析、客户数据分析等,可视化类型包括表格、折线图、柱状图、堆积图、扇形图、地图、桑基图等。 我的职责:全栈;负责环境搭建、数据流程梳理、产品设计、产品开发