深度学习与计算机视觉: 熟练掌握 PyTorch、TensorFlow 等深度学习框架,具备扎实的计算机视觉理论知识,包括图像分割、点云配准、目标检测等。
生成模型与图像处理: 熟悉 Diffusion Models、GANs 等生成模型,具备图像处理、风格迁移、图像压缩等方面的实践经验。
模型优化与部署: 具备模型量化、剪枝等优化技术经验,熟悉 ONNX 模型转换与部署,能够在 Orin 等嵌入式平台上进行模型优化。
算法设计与实现: 具备较强的算法设计与实现能力,能够针对特定问题提出创新解决方案,并将其转化为高效的代码实现。
科研能力: 具备良好的科研素养,能够阅读和理解学术论文,并将其中的方法应用于实际项目中。
团队协作与沟通: 具备良好的团队协作精神和沟通能力,能够与团队成员高效合作,共同完成项目目标。
个性化多主题文本到图像生成: 在 Dream Diffusers 项目中,我成功地将多个个性化概念融入到 Pixel-Art 中,并通过语义分割和概念保留损失函数等创新技术,提升了模型在多主题重构、艺术渲染和属性修改等方面的表现。
低重叠点云配准: 在 Masked Point Cloud Registration 项目中,我提出了一种将 MaskNet 与 Multi-Level DCP 相结合的新方法,显著降低了 RTE 指标,并提高了配准精度。
自动泊车与车道线检测: 在 SenseTime 实习期间,我设计并实现了用于自动泊车感知的道路实例分割端到端建模流程,并提出了实时 ARD 车道线跟踪和 3D 车道线检测框架,取得了优于现有技术的性能。
用于有损压缩的隐式神经表示: 在中科院计算所实习期间,我通过集成低比特网络量化,改进了 SIREN 模型,实现了更高的压缩率、更低的精度损失和更高的 PSNR。
在 SenseTime 实习期间,我参与了自动驾驶感知系统的研发,主要负责自动泊车和车道线检测模块。 自动泊车: 设计并实现了用于自动泊车感知的道路实例分割端到端建模流程,通过准确分割道路区域,为车辆提供可靠的泊车引导。 车道线检测: 提出了实时 ARD 车道线跟踪框
Dream Diffusers 是一个基于扩散模型的文本到图像生成项目,旨在实现个性化多主题图像生成。作为项目负责人,我带领团队实现了以下创新: 多主题融合: 将多个个性化概念融入到 Pixel-Art 中,使得生成的图像更具创意和表现力。 语义分割与概念保留: 开发了创