擅长用Python, R和Tableau进行数据挖掘,数据分析,数据可视化,云计算和机器学习。目前于美国乔治敦大学攻读数据分析硕士学位。
编程语言和工具: Python, R, SQL, Excel;
数据可视化工具: Tableau, Plotly, ggplot2, Matplotlib, igraph, NetworkX, Seaborn;
统计学: Distribution, Probability, ANOVA, Statistical Inference, Hypothesis Testing, Bayes Theorem;
数据科学实习生 (Data Science Intern)
操作SQL数据库 (Valentina DB),来存储、读取100K+条用户信息,并使用Python和R对用户进行描述性分析。
研究助理 (Research Assistant)
用Python, R, Stata和Excel为学者在会计、金融、运营管理的研究中提供数据收集、分析、可视化的技术支持;
独立编写一款Python程序,从SEC EDGAR数据库中下载并处理1994-2019年的SC13D, 10-K和10-KSB文件,并提取日期、参与者、持股数量、交易目的等信息,并导出1M+条记录。
This program is used to parse and extract information from SC13D filings from SEC EDGAR database for the further study of trading activities
数据:402900 对Quora上的提问。 Conducted EDA and created histograms, word cloud, etc. - 描述性分析 Processed data (tokenization, stemming) and perform