为了解决基于深度Q网络(DQN)的路径规划任务面临的样本效率低下、收敛速度慢、内存需求量大等问题,更快更好的在复杂环境中准确跟踪目标。在深度强化学习技术的基础上,提出了在移动传感器上使用D3QN算法实现对目标的路径规划。D3QN算法有三个方面的优势,一是通过一种优先经验回放机制,提高样本效率;二是通过将动作的选择和动作的评估分别用不同的值函数来实现,降低过估计的影响;三是通过改变网络架构,提高收敛速度和效果。并且采用GNU Radio软件平台和Python语言进行仿真验证。通过实验表明,与DQN方法相比,D3QN的方法能够有效地降低系统能耗、提高处理任务的实时性,提供了显著的速度改进和鲁棒性。