- 岗位职责
1. 负责Kaldi语音识别开发,声学模型、语言模型在多场景下的性能优化;
2. 负责非流式/流式端到端语音识别的模型调研、开发和训练,解码算法开发等。
3. 负责VAD、说话人分离等功能的优化;
4. 负责语音合成、文本分析、韵律分析算法开发,以及韵律控制、声音复刻、对话场景语音合成等方向的调研工作;
5. 负责声纹识别调研开发工作。
- 岗位要求
1. 本科以上学历,有语音识别、语音合成、文本前端分析、声纹识别开发经验者优先;
2. 具备深度学习模型优化基础,熟悉TensorFlow或Pytorch等开源工具;
3. 熟悉Kaldi框架、有声学模型/语言模型实战经验者优先;
4. 熟悉端到端语音识别框架(ESPNet、WeNet等)者优先;
5. 熟悉python和shell,使用过C++或Java,熟悉数据结构知识;
6. 具备较强的学习能力,以及良好的团队意识。