ID:382926

星星

大四学生、Java后端工程师、Python网络爬虫

  • 公司信息:
  • 中南财经政法大学
  • 工作经验:
  • 4年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 武汉
  • 全区

技术能力

Java软件开发能力:
架构设计:能够设计和实现复杂的Java软件架构,包括微服务架构和模块化设计。
性能优化:精通Java性能调优,能够对应用程序进行性能分析和优化。
框架熟练:熟练使用Spring、MyBatis等主流Java开发框架。
数据库操作:能够高效地使用JDBC和ORM框架进行数据库操作和事务管理。
单元测试:重视代码质量,熟练使用JUnit、Mockito等工具进行单元测试和集成测试。
DevOps实践:熟悉持续集成/持续部署(CI/CD)流程,能够使用Jenkins、GitLab CI等工具实现自动化构建和部署。
Python爬虫开发能力:
爬虫框架:熟练使用Scrapy、BeautifulSoup、lxml等Python爬虫框架和库。
数据解析:能够高效地解析HTML和XML数据,提取所需信息。
API交互:能够利用Python的requests库与RESTful API进行交互,获取数据。
反爬虫策略:具备识别和绕过常见反爬虫机制的能力,如代理池管理、动态User-Agent、Cookies处理等。
分布式爬虫:能够设计和实现分布式爬虫架构,提高数据抓取效率。
数据存储:熟悉使用Python进行数据存储,包括文件系统、数据库(如MySQL、MongoDB)和NoSQL存储。
异常处理:能够编写健壮的爬虫代码,有效处理网络异常和数据解析错误。

项目经验

一、基于Spring Boot和MyBatis Plus的定制化订货系统
该项目是一个企业级的B2B订货平台,旨在为客户提供一个高效、便捷的在线订货解决方案。技术栈主要基于Spring Boot框架,利用其自动配置和微服务支持,以及MyBatis Plus作为ORM工具,简化数据库操作并提高开发效率。系统特点包括:
1.高性能架构:通过Spring Boot的异步处理和缓存机制,优化了系统性能,支持高并发处理。
2.动态权限控制:实现了基于角色的访问控制(RBAC),动态管理用户权限,确保系统的安全性。
3.数据一致性:采用分布式事务管理,确保在多服务环境下数据的一致性和完整性。


二、基于Selenium的淘宝网爬虫
该项目是一个自动化的网络爬虫,用于从淘宝网抓取商品信息,包括价格、销量、用户评价等关键数据。技术实现主要依赖于Python语言和Selenium库,模拟用户浏览器行为进行数据抓取。项目亮点包括:
1.高效的数据抓取:利用Selenium的WebDriver,实现了对JavaScript渲染页面的高效抓取。
2.反爬虫策略应对:通过代理IP池、动态更换User-Agent等技术手段,有效规避了淘宝的反爬虫机制。
3.数据清洗与分析:对抓取的数据进行清洗和分析,提取有价值的商业信息,为市场分析和决策提供支持。
4.分布式爬虫架构:设计了分布式爬虫架构,提高了数据抓取的效率和稳定性,同时降低了单点故障的风险。

案例展示

  • 基于selenium库的淘宝网数据爬虫

    基于selenium库的淘宝网数据爬虫

    基于Selenium的淘宝网爬虫 该项目是一个自动化的网络爬虫,用于从淘宝网抓取商品信息,包括价格、销量、用户评价等关键数据。技术实现主要依赖于Python语言和Selenium库,模拟用户浏览器行为进行数据抓取。项目亮点包括: 高效的数据抓取:利用Selenium的We

  • 基于SpringBoot的定制化订货系统

    基于SpringBoot的定制化订货系统

    基于Spring Boot和MyBatis Plus的定制化订货系统 该项目是一个企业级的B2B订货平台,旨在为客户提供一个高效、便捷的在线订货解决方案。技术栈主要基于Spring Boot框架,利用其自动配置和微服务支持,以及MyBatis Plus作为ORM工具,简化数据库

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服