对数据挖掘,大数据处理,机器学习,模式识别,时间序列分析,自然语言处理,有深入的理解与实践经验。
CDA2级建模分析师,CDA3级数据科学家持证人,工信部认证大数据分析师。
熟练掌握python及其数据分析语言,能熟练运用数据分析包如pandas等。
"2021 XBOT PARK" Outstanding Project Award (first place),获300万投资,项目孵化。
典型业务:异常公司预警模型的构建
利用公开的非结构化新闻,构建一个风险预测模型,提前六个月预测目标公司的运营情况。自定义了风险词权重计算方法(RFC),根据专家词汇获得特定的风险特征。
经历了用户真实痛点的挖掘过程与硬科技产品的开发流程,负责数据驱动的产品定位与技术调研。
第一个阶段是洗碗机的选品:除了看行业报告与参加行业峰会外,我选择最迅速的一个调查方式是从京东,亚马逊等线上爬取评论量与销量相对多的洗碗机品牌,数据形式包括结构化数据与非结构数据,经过处理得到国内不同地区与国外如日本对洗碗机品牌的选择倾向,人群品牌进行标签对应,然后结合值得信赖的线上线下报告如艾瑞网的报告对洗碗机进行选品。
第二阶段主要是寻找机会点:线上大样本调查通过微博,小红书,b站,youtube,淘宝等搜索引擎的评论区爬取相关洗碗机文本数据包括好评差评等,通过异常点检测删虚假评论,将数据进行归类统计后生成不同品牌洗碗机的相应词云图与矩形树图等;线下跟进小样本用户访谈,团队交流后系统生成不同权重的访谈问题,量化调研指标,将经过用户填写的问题矩阵转成二维,发现样本的聚类后形成的几个中心点,结合图论发现用户隐含的关注的关于选择洗碗机考虑的观点所在。线上线下结合助力产品定位。
第三阶段为技术调研:在经历痛点的挖掘后我们对心中的理想产品有了初步定位,对相关方向与第一阶段得到的爆款洗碗机进行技术调研,我在这块负责专利挖掘,制定了初步的专利挖掘手册,方法论采用的是WIPO开源专利分析手册,研究了包括方太,老板,西门子等,对洗碗机技术的发展有了比较系统的了解,并选择excel为初步的专利库,将有需要的专利录入方便查看交流,专利不同维度的有机组合也会产生新的机会点。
通过咸鱼,猪八戒网等网络平台协助顾客完成预测型数据挖掘,描述型数据挖掘如聚类、关联规则、序列模式等和可视化等服务,总订单量超30+,用户包括硕博和工作人员等,得到过不少客户的高度赞扬。
典型业务:分析和预测某银行定期存款产品的销售情况
利用数据挖掘建立分类预测模型,预测客户是否可以接受定期存款产品。这有益于银行盈利,增加客户价值,实现成本效力最大化的人力配置。通过使用优化曲线、网格搜索和启发式算法和改变概率阈值来确定响应客户需求,最大化客户价值。
项目职责:
总结归纳分析手册以记录数据科学领域的不断学习和所遇项目问题的解决方案
项目描述:
目前手册页数300+,在本版块还列举了做过项目的截图。
项目职责: 完成端到端的齿轮箱故障检测算法设计 项目描述: 利用小波包分析进行特征转换,对由传感器得到的电机齿轮数据进行频谱分析,模型配置后选用不同启发式算法进行超参数调优,最后应用FOA-RVM进行故障分类,运用seaborn进行图表达绘制。
帮助某985高校课题组设计自动特征工程模块,主要实现对录入的实验数据先经由数据预处理操作如:噪声消除,空值填补,空值大于50%的字段转为指示变量,xgboost空值填补。再对数据经由统计检定及随机森林筛选删除不相关变量与冗余变量。最终得到特征矩阵用于实验室后续实验。 在