爬虫

企业服务-数据服务 东仔

这个爬虫程序主要步骤包括: 创建Excel文件并设置表头。 使用代理池获取代理,防止被目标网站封锁。 爬取指定页面的HTML内容。 解析HTML内容,提取所需数据。 将数据写入Excel文件。 处理多个页面并保存结果。 程序中还包含一些防止错误的措施,比如在请求和解析过程中检查响应状态码和HTML内容的存在。这个爬虫程序可以根据需要进一步扩展和优化,如增加更多的错误处理机制或改进数据提取方法。...

爬虫
爬虫
爬虫

OCR软件

工具-办公软件 东仔

这段代码实现了一个基本的PyQt5应用程序框架,主要步骤如下: 导入所需的库和模块。 设置窗口的标题和图标路径。 定义一个函数来创建并显示主窗口,设置其标题和图标,并启动事件循环。 在程序入口处调用该函数,以启动应用程序。 在具体的实现中,Image2Text模块中的Image2Text类应该定义了应用程序的主要窗口和其内部的功能逻辑。这个入口代码为该应用程序提供了一个运行的框架,并添加了一些基本的窗口设置。...

OCR软件
OCR软件
OCR软件

爬虫

人工智能-其他 东仔

该项目通过 Selenium 和 BeautifulSoup 结合的方式,自动化爬取 交易猫(Jiaoyimao) 网站上的新闻信息,并将新闻标题、内容和发布时间存储到 CSV 文件中,便于后续数据分析或处理。 核心功能: 自动化访问网页: 使用 Selenium 模拟浏览器访问交易猫新闻页面,绕过反爬机制。 采用无头模式(Headless Mode)减少资源消耗。 控制页面加载时间,确保数据完整抓取。 网页数据解析: 使用 BeautifulSoup 提取新闻标题、内容和发布时间。 解析网页 DOM 结构,精准获取需要的数据。 数据存储: 将抓取的数据保存到 交易猫....

爬虫
爬虫
爬虫

智能客户助理系统

人工智能-机器人 东仔

本项目开发了一款 智能客户助理系统,集成 DeepSeek AI 对话模型,旨在通过 自然语言处理(NLP) 技术,为企业提供 智能客服、技术支持和客户沟通 解决方案。用户可通过 Gradio 前端界面进行交互,系统根据客户档案生成个性化的 AI 对话体验。 智能客户画像: 通过 JSON 数据结构 存储客户信息,包括姓名、公司、职位、行业、兴趣点和沟通偏好。 生成定制化的 系统提示词,确保 AI 根据客户背景提供专业化回复。 DeepSeek API 对接: 通过 DeepSeek API 进行智能对话,支持上下文理解。 采用 动态温度控制 和 最大 token 限制,优化生...

智能客户助理系统
智能客户助理系统
------ 加载完毕 ------
联系需求方端客服