项目名称:AI 动漫风格生成器
技术栈:Python (Flask, OpenCV, PyTorch), JavaScript (HTML/CSS), Stable Diffusion, ControlNet
项目描述
开发了一款基于深度学习的 AI 动漫风格生成器,支持用户上传图片并生成动漫风格的线稿和完整画风。项目集成了 StableDiffusion 和 ControlNet 模型,通过 Flask 提供后端服务,前端实现图片上传、线稿生成和画风迁移功能。
核心功能
图片上传与预览:支持用户拖拽或选择图片上传,实时预览上传的图片。
线稿生成:基于 OpenCV 实现图片线稿生成,提供黑白素描效果。
画风迁移:集成 Stable Diffusion 和 ControlNet 模型,根据用户输入的指令生成动漫风格图片。
结果展示与下载:生成结果实时展示,并提供下载链接。
技术亮点
深度学习模型集成:
使用 PyTorch 加载和运行 Stable Diffusion 和 ControlNet 模型,支持 GPU 加速。
动态选择数据类型(torch.float16 或 torch.float32),确保模型在 CPU 和 GPU 上均可运行。
前后端交互:
使用 Flask 构建 RESTful API,处理图片上传、线稿生成和画风迁移请求。
前端通过 Fetch API 与后端交互,实现异步请求和动态内容更新。
文件处理与存储:
使用 OpenCV 处理图片,生成线稿并保存到指定目录。
通过 Flask 的 send_from_directory 提供文件下载功能。
用户体验优化:
实现拖拽上传、实时预览和错误提示功能,提升用户交互体验。
使用 CSS 美化界面,确保页面布局简洁美观。
项目成果
成功实现图片上传、线稿生成和画风迁移功能,生成效果符合预期。
支持多种图片格式(PNG、JPG、JPEG),最大上传文件限制为 16MB。
项目代码结构清晰,模块化设计便于维护和扩展。