传统图像处理算法,ISP pipline,机器学习算法,深度学习算法,优化算法
麦克风阵列,波束形成语音增强算法(线性约束最小方差准则(LCMV)的实现:
使用麦克风阵列作为语音引号接收器,接收到多路语音信号后,通过后端传统波束形成信号处理方法,
对语音信号进行增强,使用到的波束形成器是线性约束最小方差准则下的:
1、广义旁瓣消除(GSC)波束形成器
2、最小方差无畸变(MVDR)波束形成器
深度学习语音增强算法实现:
经过传统方法增强后的语音,仍有可以提升的空间,而且,波束形成可以形成多路输出,为多通道深度
学习语音增强提供充足的信息。使用深度学习方法对经过波束形成后的语音做进一步增强。
1、 多通道卷积神经网络(CNN)
2、 多通道循环神经网络(使用 RNN 中的长短期记忆网络(LSTM))
一、三维重建项目准备
1、 深度信息获取设备调研
2、 KinectFusion 各算法及整个流程学习及整理
二、米仓平面三维重建
1、 使用 Intel Realsense D435 深度相机获取米仓的点云,进行多视角下点云拼接,获取整个米仓平面
的三维结构。
硬件设备:Intel Realsense D435 深度相机、NVIDIA TX2 平台
软件:机器人操作系统(ROS)、C++、OpenCV、PCL
流程:使用拓展卡尔曼滤波,融合电机提供的位姿和视觉 2D-3D(PNP 方法)解算的位姿,得到相对稳
定的位姿,通过稳定的位姿,将不同视角下的稠密点云进行拼接,得到米仓平面完整的三维结构。