ID:218642

琴韵微凉

爬虫开发师

  • 公司信息:
  • 中财绿指(北京)信息咨询有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

四年工作经历
精通编程语言:Python,JavaScript,C++
特殊技能:网络爬虫技术(Web Crawling), 自然语言分析( Natural Language Processing)
项目经验:
1.利用Scrapy模拟登陆淘宝,爬取淘宝商品信息,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,对数据进行定制处理,如逆透视,标准化分析,分类等,输出至 Excel。
2.根据客户要求,对拉丁语系文本进行分析与测试,基于机器学习,统计机器学习,利用Pandas,NLTK,Scikit-learn(sklearn)等第三方库进行文本分析。自然语言处理(NLP),达到语言处理任务的实现。综合运用各种算法,进行算法选择与优化,决策树,if-then,统计模型等。
3.定时爬取东方财富网股票数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,再输出至数据库 MongoDB 。
4.利用Scrapy定时爬取链家某市房源数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,同时根据关键词分类整理 。

项目经验

项目经验:
1.利用Scrapy模拟登陆淘宝,爬取淘宝商品信息,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,对数据进行定制处理,如逆透视,标准化分析,分类等,输出至 Excel。
2.根据客户要求,对拉丁语系文本进行分析与测试,基于机器学习,统计机器学习,利用Pandas,NLTK,Scikit-learn(sklearn)等第三方库进行文本分析。自然语言处理(NLP),达到语言处理任务的实现。综合运用各种算法,进行算法选择与优化,决策树,if-then,统计模型等。
3.定时爬取东方财富网股票数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,再输出至数据库 MongoDB 。
4.利用Scrapy定时爬取链家某市房源数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,同时根据关键词分类整理 。

案例展示

  • Scrapy实现链家某市房源数据采集

    Scrapy实现链家某市房源数据采集

    利用Scrapy爬取链家某市房源数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,同时根据关键词分类整理,同时对数据进行定制处理,如逆透视,标准化分析,分类 等。

  • 淘宝数据爬取、分析

    淘宝数据爬取、分析

    利用Scrapy模拟登陆淘宝,爬取淘宝商品信息,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,再对数据进行定制处理,如逆透视,标准化分析,分类 等,输出成 Excel格式 。

  • NLP拉丁语系文本分析

    NLP拉丁语系文本分析

    根据客户要求,利用自然语言处理(NLP),对拉丁语系文本进行分析与测试,利用Pandas,NLTK,Scikit-learn(sklearn)等第三方库进行文本分析。基于机器学习,统计机器学习,综合运用各种算法,进行算法选择与优化,决策树,if-then,统计模型等,达到语言处理

  • 东方财富网数据爬取

    东方财富网数据爬取

    实时爬取东方财富网股票数据,利用定制head和随机IP应对反爬虫机制,同时用 Pandas 库对数据进行整理,再输出至数据库 MongoDB 。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    2
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服