# 技术栈
- Python
- NLP 相关
- 正则匹配
- 文本清洗, 格式净化
- 文本切词, 词性标注
- 结构性信息提取
- 网络爬虫
- 针对学术类网站的爬虫
- 针对政府类网站的爬虫 (非工商部)
- 精通反爬策略
- 网络通讯
- Flask 框架
- 文档读写
- excel 脚本读写精通
- docx 脚本读写精通
- pdf (非扫描版) 脚本读写精通
- JavaScript
- 有丰富的业余项目经验
# 业务 (项目) 能力
- 项目管理
- 独自负责过多个爬虫和数据处理项目
- 良好的模块化设计思想
- 对面向对象的深刻理解, 对项目逻辑中的抽象思维
- Git
- 掌握基础的 Git 操作
- API 文档
- 严谨, 可靠的文档编写能力
- 对文档格式和排版有极高的自我要求
# 其他
- 有 Android 开发经验
- 对音视频脚本有研究
## Elsevier Scival 系列爬虫
**内容:**
通过对 Scival 数据接口的 Python 封装, 实现 Scival 学者指数, 实体概览数据向人才库专家报告的对接和自动化转换.
**业绩:**
1. Scival 学者指数自动化工具
2. Scival 实体概览自动化工具
3. 全球人才报告模板生成工具
## Scopus 系列爬虫
**内容:**
围绕 Scopus 学者, 文献, 机构三大数据引擎构造系列爬虫和自动化工具, 实现 Scopus 数据与平台专家库的对接, Scopus 数据与前台的对接, 以及为其他数据组成员提供数据源.
**业绩:**
1. Scopus 学者检索与自动化匹配 (机器推断匹配) 系统
2. Scopus 学者指标获取工具
3. Scopus 机构检索与匹配系统
4. Scopus 文献检索与匹配系统
## Gesip NLP System
**内容:**
对来源繁杂的专家简介, 学术新闻资讯等内容进行实体关系抽取, 并形成入库所需的结构化字段.
**业绩:**
1. 自定义语法机与格式机
2. 实现对两院专家简介的结构化解析
## 全球人才推荐名录 / 报告
**内容:**
与同事合作完成全球人才推荐名录的编写, 并单独提供数据转换.
**业绩:**
1. 参与选定名录名单来源及获取方案
2. 制作报告模板生成器
3. 与前端工程师完成数据对接
## AE 脚本 Cast 样式字幕脚本
**内容:**
一个业余项目. 使用 Adobe JSX 语法开发的一款字幕向上滚动脚本 (类似于电影片尾的演员表). 只需导入普通 ass 字幕文件, 即可转换为滚屏字幕.
**业绩:**
按时制作完成并交付, 客户评价满意.
## Sublime 插件 LK Omni Paste
**内容:**
一个业余项目. 使用 Python 开发的 Sublime 插件. 使 Sublime 支持在 Markdown 写作中粘贴剪切板图片和本地附件.
**业绩:**
项目开源已发布.
https://blog.csdn.net/Likianta/article/details/101878704
一款针对 Scopus 学者库制作的辅助搜索可视化工具, 帮助数据组人员更方便地查找学者信息. 该程序具有以下特点: 1. 对中文人名到拼音的自动转换 2. 支持识别和拆分中英文复姓人名 3. 支持研究领域搜索参数 4. 支持机构搜索参数 5. 支持按发文和
调用百度 AI 图像接口, 对网络图片中的人物以指定尺寸裁剪. 该工具用于批量裁剪从网络下载的专家图片.
LK 字幕脚本工具是一款基于 Adobe ExtendScript 编写的 AE 脚本工具, 旨在提升字幕组在制作 AE, Pr 视频任务时的效率.
LK 字幕脚本工具是一款基于 Adobe ExtendScript 编写的 AE 脚本工具, 旨在提升字幕组在制作 AE, Pr 视频任务时的效率.