腾科职业培训学校
没有解决您的问题?扫描二维码加入博睿云交流群畅所欲言吧!
使用帮助

全部课程> 语音处理

语音处理

来源:腾科职业培训学校

  • 2023-06-13  -  2025-06-12 30课时(建议每周学习2小时)
  • 自主模式

已有2166人报名学习

  • 课程概览
  • 授课讲师
  • 课程大纲
  • 课程概览
  • 授课讲师
  • 课程大纲

语言识别是一门研究如何让计算机能够理解和处理人类语言的学科。这门课程旨在介绍语言识别的基本原理、技术和应用,以及相关领域的最新研究进展。

课程概览

课程内容:

  1. 语音信号处理基础: 介绍语音信号的特性和数字信号处理的基本概念,包括音频采样、滤波、频谱分析等。

  2. 语音特征提取: 学习如何从语音信号中提取有用的特征,如短时能量、过零率、梅尔频率倒谱系数(MFCC)等。

  3. 隐马尔可夫模型(HMM): 研究HMM在语言识别中的应用,包括声学建模和语言建模。

  4. 音素识别: 探讨音素识别的基本原理和方法,包括基于HMM的音素识别算法和训练过程。

  5. 语音识别系统架构: 介绍典型的语音识别系统架构,包括前端特征提取、声学建模、语言模型等组成部分。

  6. 深度学习在语音识别中的应用: 引入深度学习技术在语音识别中的应用,包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等。

授课讲师

魏志伟

腾讯云社区年度最佳作者,csdn博客专家。 参与iVX低代码平台网站海外版编写重构,编写小型开源Web框架。 熟练掌握C、Python、Java等语言;PythonWeb、Android开发、计算机视觉、自然语言处理。 熟悉js、kotlin等语言;熟悉vue、react等前端框架。熟悉OpenCV、Sklearn、Pytorch等框架和模块。熟悉各种神经网络,如DNN、CNN、RNN、word2vec,熟悉attention机制以及bert预训练模型。 上课理论实践结合,例子新颖,案例贴近生活,把技术带入生活。 循循善诱,平易近人;注意启发和调动学生的积极性,课堂气氛较为活跃;例题丰富,不厌其烦,细心讲解,虚心并广泛听取学生的意见和反馈信息,做到及时修正和调整自己的知识的传授方式。

课程大纲
  • 第1章语音处理介绍
  •     第1节语音处理介绍
  •     第2节语音预处理基础
  •     第3节语音信号分析及特征提取
  • 第2章语音识别
  •     第1节语音识别
  • 第3章语音合成
  •     第1节语音合成
  • 第4章传统声学模型GMM-HMM
  •     第1节GMM
  •     第2节HMM
  •     第3节GMM+HMM
节数上课时间星期一 星期二星期三星期四 星期五星期六星期天
第1节08:00 - 08:40
第2节09:00 - 09:40
第3节10:00 - 10:40
第4节11:00 - 11:40
第5节14:00 - 14:40
第6节15:00 - 15:40
第7节16:00 - 16:40
第8节17:00 - 17:40
天数上课日期上课时间内容