杂志信息网-创作、查重、发刊有保障。

平滑去噪方法研究毕业论文

发布时间:2024-07-07 12:31:17

平滑去噪方法研究毕业论文

图像在采集和传输中会不可避免的受到噪声的污染,影响人们对图像的理解和分析处理。图像去噪的目的就是滤除噪声,减少噪声的影响,使图像信息更加真实的呈现。本文简单介绍了图像噪声的分类及常用的图像的去噪方法,对传统的中值滤波方法进行了分析,并针对传统的中值滤波方法存在的不足,提出自适应中值滤波方法,并在MATLAB软件上进行了编程和仿真。结果表明自适应中值滤波方法对噪声密度较大的图像比传统中值滤波有更好的滤波效果。本文第一章对数字图像处理常用方法,图像噪声的分类和主要去噪方法等基础知识做了介绍,并对MATLAB软件发展主要组成和功能进行了概括,同时对用于图像处理的MATLAB主要函数进行了介绍。第二章对图像的中值滤波方法的原理和算法进行介绍,并分析其不足,提出自适应中值滤波器的设计。第三章对自适应中值滤波器的原理和设计算法做了分析,并在MATLAB软件上进行了编程和仿真,对处理结果进行比对、归纳。最后,对本论文做了总结。

题目基于小波变换的图像去噪方法研究学生姓名陈菲菲学号 1113024020 所在学院物理与电信工程学院专业班级通信工程专业1 101 班指导教师陈莉完成地点物理与电信工程学院实验中心 201 5年5月 20日 I 毕业论文﹙设计﹚任务书院(系) 物理与电信工程学院专业班级通信 1 101 班学生姓名陈菲菲一、毕业论文﹙设计﹚题目基于小波变换的图像去噪方法研究二、毕业论文﹙设计﹚工作自 201 5年3月1日起至 201 5年6月20 日止三、毕业论文﹙设计﹚进行地点: 物理与电信工程学院实验室四、毕业论文﹙设计﹚的内容 1、图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。常用的图像处理方法有图像增强、复原、编码、压缩等。一般图像的能量主要集中在低频区域中,只有图像的细节部的能量才处于高频区域中。因为在图像的数字化和传输中常有噪声出现,而这部分干扰信息主要集中在高频区域内,所以消去噪声的一般方法是衰减高频分量或称低通滤波,但与之同时好的噪方法应该是既能消去噪声对图像的影响又不使图像细节变模糊。为了改善图像质量,从图像提取有效信息,必须对图像进行去噪预处理。设计任务: (1 )整理文献,研究现有基于小波变换的图像去噪算法,尝试对现有算法做出改进; (2 )在 MATLAB 下仿真验证基于小波变换的图像去噪算法。 2 、要求以论文形式提交设计成果,应掌握撰写毕业论文的方法, 应突出“目标,原理,方法,结论”的要素,对所研究内容作出详细有条理的阐述。进度安排: 1-3 周:查找资料,文献。 4-7 周:研究现有图像去噪技术,对基于小波变换的图像去噪算法作详细研究整理。 8-11 周: 研究基于小波的图像去噪算法,在 MATLAB 下对算法效果真验证。 12-14 周:分析试验结果,对比各种算法的优点和缺点,尝试改进算法。 15-17 周:撰写毕业论文,完成毕业答辩。指导教师陈莉系(教研室) 系( 教研室) 主任签名批准日期 接受论文( 设计) 任务开始执行日期 学生签名 II 基于小波变换的图像去噪方法研究陈菲菲( 陕西理工学院物理与电信工程学院通信 1 101 班,陕西汉中 72300 0) 指导教师: 陈莉[摘要] 图像去噪是信号处理中的一个经典问题, 随着小波理论的不断完善,它以自身良好的时频特性在图像去噪领域受到越来越多的关注。基于小波变换的去噪方法有很多

小到耳塞大到隔音墙,都是不错的选择

安装隔音板,隔音材料,隔音棉都能隔音。

图像平滑去噪毕业论文

1 基于形态学运算的星空图像分割 主要内容: 在获取星图像的过程中,由于某些因素的影响,获得的星图像存在噪声,而且星图像的背景经常是不均匀的,为星图像的分割造成了极大的困难。膨胀和腐蚀是形态学的两个基本运算。用形态学运算对星图像进行处理,补偿不均匀的星图像背景,然后进行星图像的阈值分割。 要求: 1> 图像预处理:对原始星空图像进行滤波去噪处理; 2> 对去噪后的图像进行形态学运算处理; 3> 选取自适应阈值对形态学运算处理后的图像进行二值化; 4> 显示每步处理后的图像; 5> 对经过形态学处理后再阈值的图像和未作形态学处理后再阈值的图像进行对比分析。 待分割图像 直接分割图像 处理后的分割图像 2 基于数字图像处理的印刷电路板智能检测方法 主要内容: 通过对由相机实时获取的印刷电路板图像进行焊盘识别,从而提高电子元件的贴片质量,有效提高电路板的印刷效率。 要求: 1> 图像预处理:将原始彩色印刷电路板图像转成灰度图像,对灰度图像进行背景平滑和滤波去噪; 2> 对去噪后的图像进行图像增强处理,增强边缘提取的效果。 3> 对增强后的图像进行边缘提取(至少两种以上的边缘提取算法); 4> 显示每步处理后的图像(原始电路板图像可自行查找); 5> 图像处理后要求能对每个焊盘进行边缘提取,边缘清晰。

图像去噪方法的研究摘要图像中的噪声会妨碍人们对图像的理解,而图像去噪的目的就是去除图像中的噪声,提高人们对图像的认识程度,以便对图像作进一步地处理。本论文的主要工作就是对图像的去噪方法进行了一定的介绍,并对其中的一些去噪算法作了进一步地研究,给出了几种新的图像去噪算法,在实验中这几种新的算法也取得了比较理想的去噪效果。 本文为了去除图像噪声,保留图像的边缘特征,提高峰值信噪比PSNR,最终得到清晰的重构图像,进行了研究改进.传统的去噪方法没有区分小波变换后高频部分中噪声信息和边缘特征信息,所以虽然能去除图像中的噪声,但是不能较完全的保留图像的边缘信息。针对这一缺点,本文首先对图像进行边缘检测。通过小波边缘检测方法确定边缘特征点的位置。在对小波变换后的各高频子带进行闺值处理时,保持非边缘特征点所在位置的小波系数在值去噪时不变,只对边缘点小波系数进行处理。这样就能既有效地去除噪声信息又能保留好边缘特征信息。理论分析和实验结果表明,与传统的去噪方法相比,本文方法能较好的保留图像的边缘信息的保留图像的边缘信息,并且提高了图像的峰值信噪比。关键词:图像处理;去噪;空域;频域;小波

在本文中,我们介绍了 KAZE 特征,这是一种在非线性尺度空间中的新型多尺度 2D 特征检测和描述算法。以前的方法通过构建或近似图像的高斯尺度空间来检测和描述不同尺度级别的特征。然而,高斯模糊不尊重对象的自然边界,并在细节和噪声方面进行了同等程度的平滑处理,从而降低了定位精度和独特性。相比之下,我们通过非线性扩散滤波在非线性尺度空间中检测和描述二维特征。通过这种方式,我们可以使模糊局部适应图像数据,减少噪声但保留对象边界,获得优越的定位精度和独特性。非线性尺度空间是使用有效的加性算子分裂 (AOS) 技术和可变电导扩散构建的。我们对基准数据集进行了广泛的评估,并在可变形表面上进行了实际匹配应用。尽管由于非线性尺度空间的构建,我们的特征比 SURF 的计算成本更高,但与 SIFT 相当,但我们的结果显示,相对于以前的最先进方法,在检测和描述方面的性能都向前迈进了一步。

多尺度图像处理是计算机视觉中的重要工具,我们可以自动从不同尺度空间提取出感兴趣的检测点。对于每一个检测点都可以获得一个不变的局部描述子。这种多尺度特征算法在现代计算机视觉框架中非常重要。

多尺度的基本思路非常简单:通过使用适当的函数滤波原始图像以增加时间或比例来创建图像的缩放空间。例如高斯尺度空间,通过对原始图像做不断增加标准差的高斯核卷积实现。对于更大的核值,我们获得更简单的图像表示。随着图像多尺度表示,我们可以在图像不同尺度空间和分辨率下检测和描述特征。一些作者也展示了在一些通用假设下,高斯核及其部分导数集是尺度空间分析的光滑核。然而,需要注意的是,高斯尺度空间只是线性扩散的一个例子,因为其他的线性尺度空间也是有可能的。

高斯核可能是表征图像尺度空间最简单的方式,但不是唯一的。然而它有些缺点。在高斯尺度空间中,选择粗略尺度的优点在于减少噪声以及突出结构。其代价是损失了局部的准确性。原因在于高斯模糊不会保留物体的自然边界,在所有尺度下对噪声和图像的细节进行相同的平滑。高斯模糊越大,我们在粗糙尺度空间中局部区域检测特征的损失越大。

使模糊局部适应图像数据似乎更合适,这样噪声就会模糊,但细节或边缘仍将无效。为了实现这一点,提出了不同的非线性尺度空间方法对高斯尺度空间方法进行改进。一般来说,非线性扩散方法的性能远优于线性扩散方法,并且在图像分割或去噪等不同应用中获得了令人印象深刻的结果。然而,据我们所知,本文是第一篇利用高效方案在多尺度特征检测和描述的背景下利用非线性扩散滤波的论文。利用非线性散射技术,通过非线性尺度空间在不同尺度上检测和描述图像区域,可以提高图像的重复性和清晰度。

非线性扩散滤波在特征检测和描述等实际计算机视觉部件中应用不多的一个原因可能是大多数方法的效率低下。这些方法通常包括通过前向欧拉方法对函数进行离散。欧拉方法需要非常小的步长来收敛,因此需要多次迭代才能达到所需的规模和高计算成本。Weickert等人偶然地介绍了非线性扩散滤波的有效方案。这些方案的背景之一是使用加法算子分裂(aos)技术。通过aos方法,可以得到任意步长的稳定非线性尺度空间。aos方案的一个关键问题是求解线性方程的三对角系统,这可以通过高斯消元算法的一个特殊变体Thomas算法来实现。

本文提出在非线性尺度空间中实现特征的自动检测和描述。本文介绍了如何利用有效的aos技术和可变电导散射来构造非线性尺度空间,以及如何在不同的图像变换下获得具有高重复性和显著性的特征。我们在标准评估框架中详细评估了我们的新特性,以及使用变形曲面的实际图像匹配应用。

我们的特征被命名为Kaze,向规模空间分析之父Iijima致敬。Kaze是一个日语单词,意思是风。在自然界中,风被定义为大尺度上的气流,通常由非线性过程控制。在此基础上,对图像域中的非线性扩散过程进行了模拟。本文的其余部分安排如下:在第二节中,我们描述了相关的工作。第三节简要介绍了非线性扩散滤波的基本原理。第4节详细说明了kaze特征算法。最后,第5节和第6节分别给出了详尽的实验结果和结论。

特征检测与描述是计算机视觉中一个非常活跃的研究领域。在许多不同的应用中,获得在不同的图像变换(如视点、模糊、噪声等)下显示出高重复性和独特性的特征是非常重要的。最流行的多尺度特征检测和描述算法是尺度不变特征变换(SIFT)和快速增强鲁棒特征(SURF)。

sift特征是特征检测和图像匹配的里程碑,在移动机器人和目标识别等领域仍有广泛的应用。在SIFT中,通过高斯尺度空间得到高斯差分算子(DOG)结果的最大值和最小值。为了建立尺度空间,计算了高斯模糊金字塔的原始图像。比例空间由不同的子级和倍频程组成。对于一组检测到的特征,基于检测到的关键点的局部感兴趣区域上的主梯度方向构造描述符。然后定义了一个通常由4×4个子区域组成的矩形网格(根据主方向),并建立了由其大小加权的梯度方向直方图,得到128个元素的描述符向量。

受SIFT的启发,Bay等人提出了surf检测和描述符。surf特征在重复性、显著性和鲁棒性方面表现出更好的结果,但同时由于使用了积分图像,可以更快地计算,这意味着不同尺度的高斯导数可以通过简单的方形滤波器近似,而不必计算整个高斯尺度空间。与SIFT类似,定义了一个由4×4个子区域组成的矩形网格(根据主方向),并计算了每个区域的HAAR小波响应之和(以感兴趣的关键点为中心的高斯加权)。最终的描述符维度通常是64或128的扩展计数器。Agrawal和Konolige通过使用中心环绕检测(CenSurE)和修改的surf(m-surf)描述符对surf进行了一些改进。m-surf是原surf描述符的一个变体,但它处理了较好的描述符边界效应,并采用了更为稳健和智能的两阶段高斯加权方案。

这些方法和随后的许多相关算法都依赖于高斯尺度空间和高斯导数集作为尺度空间分析的光滑核。然而,重复一次,高斯尺度空间不保留对象和平滑的自然边界,在所有尺度上都同等处理细节和噪声。通过非线性扩散滤波,可以获得比以前基于高斯尺度空间的算法具有更高重复性和显著性的多尺度特征。与surf或CenSurE相比,计算成本略有增加,我们的结果显示,在特征检测和描述方面,性能有了很大的提高。

非线性扩散方法将图像亮度随尺度的增大而变化描述为控制扩散过程的某些流函数的发散。这些方法通常用非线性偏微分方程(PDES)来描述,因为所涉及的微分方程的非线性性质将图像的亮度扩散到非线性尺度空间。方程1给出了经典的非线性扩散公式: 其中 和 分别表示散度和梯度运算。

由于传到函数 的引入,使得扩散自适应图像局部结构成为可能。函数 取决于图像局部的微分结构,并且函数既可以表示标量也可以表示张量。时间 为尺度参数,值越大表示图像越简单。本文中,将关注可变传导扩散,即在各尺度层级中使用图像的梯度幅度控制扩散。

在计算机视觉领域首次提到非线性扩散滤波由Perona和Malik提出,令函数 与梯度幅值相关,为了减少在局部边缘的计算损失,更多平滑区域而不是边界。通过这种方式,函数 可以被定义为: 其中 表示原始图像 的高斯平滑版本的梯度。Perona和Malik为传到函数 描述两个不同的方程: 其中参数 为对比度因子控制扩散等级。函数 有利于高对比度边界, 有利于大区域而不是小区域。Weickert为扩散率迅速下降的区域提出略微不同的扩散函数:在边缘两侧平滑比在边上平滑效果更好。与区域间模糊相比,选择性平滑更倾向于区域内平滑。这个函数称为 ,定义如下: 对比度参数 可以手动选择,也可以根据图像梯度的一些估计值自动选择。对比度参数决定梯度是应该增强还是取消。本文中我们采用经验值,将 设置为原始图像平滑版本梯度值直方图的70%,在我们的实验中这个经验值通常取得很好的结果。然而,对于某些图像,对对比度参数进行更详细的分析可能会得到更好的结果。图1描述了Perona和Malik方程中不同参数 值的传导函数 。通常,对于较高的 值,只考虑较大的梯度。

非线性扩散滤波中的偏微分方程没有解析解。因此,需要使用数值方法来近似微分方程。扩散方程的一种可能的离散化方法是所谓的线性插值或半隐式格式。在向量矩阵表示法中,方程1的离散化可表示为: 式中, 是一个矩阵,对每个维度的图像传导进行编码。在半隐式格式中,为了计算解 ,需要解一个线性方程组。 的解可通过以下方式获得: 半隐式格式对于任何步长都是绝对稳定的。此外,它还为任意大的时间步长创建了一个离散的非线性扩散尺度空间。在半隐式格式中,需要求解线性方程组,其中系统矩阵为三对角且对角占优。托马斯算法是著名的三对角系统高斯消元算法的一种变体,它可以非常有效地求解此类系统。

在这一部分中,我们将介绍我们在非线性尺度空间中进行特征检测和描述的新方法。给定一幅输入图像,我们使用AOS技术和可变传导扩散建立非线性尺度空间,直至最大演化时间。然后,我们通过非线性尺度空间检测出感兴趣的二维特征,这些特征显示了Hessian响应的尺度归一化行列式的最大值。最后,我们计算关键点的主方向,并得到一个考虑一阶图像导数的尺度和旋转不变描述符。现在,我们将描述公式中的每个主要步骤。

我们采用了与SIFT中类似的方法,以对数步长将尺度空间离散化,以一系列 级和 层排列。请注意,我们始终使用原始图像分辨率,而不会像在SIFT中那样在每个新的级上执行任何下采样。级和层由离散的上标 和上标 确定。级和层通过以下公式映射到其相应的尺度 : 式中, 是基本比例级别, 是过滤图像的总数。现在,我们需要将像素单位 中的离散尺度级别集转换为时间单位。这种转换的原因是非线性扩散滤波是按时间项定义的。在高斯尺度空间的情况下,图像与高斯标准偏差 (以像素为单位)的卷积相当于对图像进行一段时间的滤波 。我们应用这种转换以获得一组演化时间,并通过以下映射 将尺度空间 转换为时间单位 : 这里必须提到的是,我们使用了映射 仅用于获得一组演化时间,由此我们构建非线性尺度空间。一般而言,在每个滤波图像 处的非线性尺度空间中,所得图像不对应于原始图像与标准偏差 的高斯的卷积。然而,我们的框架也与高斯尺度空间兼容,因为我们可以通过将扩散函数 设置为等于1(即常数函数)来获得高斯尺度空间的方程。此外,只要我们在非线性尺度空间中演化,除与对象边界对应的强图像边缘外,大多数图像像素的传导函数趋于恒定。

给定一幅输入图像,我们首先用标准偏差 的高斯核卷积图像,以减少噪声和可能的图像伪影。根据该基础图像,我们计算图像梯度直方图,并按照第节所述的自动程序获得对比度参数 。然后,给定对比度参数和一组演化时间 ,使用AOS方案(对于任何步长都绝对稳定)以迭代方式构建非线性尺度空间是很直观的: 图2描述了高斯尺度空间和非线性尺度空间(使用 传导函数)在给定相同参考图像的几个演化时间内的比较。可以观察到,高斯模糊对图像中的所有结构进行平滑处理,而在非线性尺度空间中,强图像边缘保持不变。

为了检测感兴趣的点,我们计算了Hessian的尺度归一化行列式在多个尺度水平上的响应。对于多尺度特征检测,需要针对尺度对微分算子集进行归一化,因为通常空间导数的振幅随着尺度的减小而减小: 其中 分别为二阶水平导数和垂直导数, 为二阶交叉导数。给定非线性尺度空间 的滤波图像集,我们分析检测器在不同尺度水平 下的响应。我们搜索尺度和空间位置的最大值。在除 和 之外的所有滤波图像中执行极值搜索。在当前 、上一层 和下一层 的大小为 的矩形窗口上搜索每个滤波图像的极值。为了加快搜索极值,我们首先在3×3像素的窗口上检查响应,以便快速丢弃非最大值响应。最后,使用亚像素精度估计关键点的位置。

一阶和二阶导数集通过不同导数步长 的 Scharr滤波器进行近似。二阶导数通过在所需导数坐标中使用连续Scharr滤波器进行近似。这些滤波器比其他流行的滤波器(如Sobel滤波器或标准中心差分滤波器)更接近旋转不变性。请注意,尽管我们需要为每个像素计算多尺度导数,但我们在描述步骤中节省了计算工作量,因为我们重复使用在检测步骤中计算的同一组导数。

寻找主方向 。为了获得旋转不变描述符,需要估计以关键点位置为中心的局部邻域中的主导方向。与SURF类似,我们在半径为 的圆形区域中发现主方向,采样步长为 。对于圆形区域中的每个样本,一阶导数 和 使用以兴趣点为中心的高斯加权。然后,将导数响应表示为向量空间中的点,并通过对覆盖 角的滑动圆段内的响应求和来确定主方向。从最长矢量中获得主方向。 构建描述符 。我们使用的M-SURF描述符适用于我们的非线性尺度空间框架。对于尺度为 的检测特征,在 矩形网格上计算尺寸为 的一阶导数 和 。该网格分为 个子区域,大小为 ,重叠为 。每个子区域中的导数响应以子区域中心为中心,用高斯( )加权,并求和为描述符向量 。然后,使用高斯( )对每个子区域向量进行加权,其定义在 的掩模上,并以感兴趣的关键点为中心。当考虑关键点的主方向时,矩形网格中的每个样本将根据主方向旋转。此外,还根据主方向计算了导数。最后,长度为64的描述符向量被归一化为单位向量以实现对比度不变性。

数字图像去噪方法研究论文

③在弹出的对话框里,可以单击“Preset”下的选项,选择设置噪音的消除模式。也可以通过拖动滑块来设置消除噪音大小,左面的滑快代表噪音的最低限度,滑块越往上去除噪音的效果越好,但对原来的声音文件损失也就越大。

自己录制的音频往往带有噪音,去除的方法很多,下面介绍用 Sound Forge除掉噪音的具体操作过程。①打开自己录制的声音文件,播放听听声音效果。②选择“Effects”菜单下的“Noise Gate”命令。③在弹出的对话框里,可以单击“Preset”下的选项,选择设置噪音的消除模式。也可以通过拖动滑块来设置消除噪音大小,左面的滑快代表噪音的最低限度,滑块越往上去除噪音的效果越好,但对原来的声音文件损失也就越大。④单击“OK”按钮。

小到耳塞大到隔音墙,都是不错的选择

图像在采集和传输中会不可避免的受到噪声的污染,影响人们对图像的理解和分析处理。图像去噪的目的就是滤除噪声,减少噪声的影响,使图像信息更加真实的呈现。本文简单介绍了图像噪声的分类及常用的图像的去噪方法,对传统的中值滤波方法进行了分析,并针对传统的中值滤波方法存在的不足,提出自适应中值滤波方法,并在MATLAB软件上进行了编程和仿真。结果表明自适应中值滤波方法对噪声密度较大的图像比传统中值滤波有更好的滤波效果。本文第一章对数字图像处理常用方法,图像噪声的分类和主要去噪方法等基础知识做了介绍,并对MATLAB软件发展主要组成和功能进行了概括,同时对用于图像处理的MATLAB主要函数进行了介绍。第二章对图像的中值滤波方法的原理和算法进行介绍,并分析其不足,提出自适应中值滤波器的设计。第三章对自适应中值滤波器的原理和设计算法做了分析,并在MATLAB软件上进行了编程和仿真,对处理结果进行比对、归纳。最后,对本论文做了总结。

语音去噪算法研究论文

安装隔音板,隔音材料,隔音棉都能隔音。

图像在采集和传输中会不可避免的受到噪声的污染,影响人们对图像的理解和分析处理。图像去噪的目的就是滤除噪声,减少噪声的影响,使图像信息更加真实的呈现。本文简单介绍了图像噪声的分类及常用的图像的去噪方法,对传统的中值滤波方法进行了分析,并针对传统的中值滤波方法存在的不足,提出自适应中值滤波方法,并在MATLAB软件上进行了编程和仿真。结果表明自适应中值滤波方法对噪声密度较大的图像比传统中值滤波有更好的滤波效果。本文第一章对数字图像处理常用方法,图像噪声的分类和主要去噪方法等基础知识做了介绍,并对MATLAB软件发展主要组成和功能进行了概括,同时对用于图像处理的MATLAB主要函数进行了介绍。第二章对图像的中值滤波方法的原理和算法进行介绍,并分析其不足,提出自适应中值滤波器的设计。第三章对自适应中值滤波器的原理和设计算法做了分析,并在MATLAB软件上进行了编程和仿真,对处理结果进行比对、归纳。最后,对本论文做了总结。

与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 任务分类和应用 根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。 前端前端处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。最常用的前端处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要任务就是消除环境噪声对语音的影响。目前通用的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。处理声学特征 声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。常用的一些声学特征* 线性预测系数LPC:线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对 LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特征的广泛使用。与LPC这种预测参数模型类似的声学特征还有线谱对LSP、反射系数等等。* 倒谱系数CEP:利用同态处理方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数。对LPC倒谱(LPCCEP),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以提高特征参数的稳定性。* Mel倒谱系数MFCC和感知线性预测PLP:不同于LPC等通过对人的发声机理的研究而得到的声学特征,Mel倒谱系数MFCC和感知线性预测 PLP是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。Mel刻度是对这一临界带宽的度量方法之一。MFCC的计算首先用FFT将时域信号转化成频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换DCT,取前N个系数。PLP仍用德宾法去计算LPC参数,但在计算自相关参数时用的也是对听觉激励的对数能量谱进行DCT的方法。声学模型语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。本节和下一节分别介绍声学模型和语言模型方面的技术。HMM声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、Viterbi算法和前向后向算法。语音识别中使用HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模,一个音素就是一个三至五状态的HMM,一个词就是构成词的多个音素的HMM串行起来构成的HMM,而连续语音识别的整个模型就是词和静音组合起来的HMM。上下文相关建模:协同发音,指的是一个音受前后相邻音的影响而发生变化,从发声机理上看就是人的发声器官在一个音转向另一个音时其特性只能渐变,从而使得后一个音的频谱与其他条件下的频谱产生差异。上下文相关建模方法在建模时考虑了这一影响,从而使模型能更准确地描述语音,只考虑前一音的影响的称为Bi- Phone,考虑前一音和后一音的影响的称为Tri-Phone。英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素解码状态的聚类进行模型参数的共享。聚类的结果称为senone。决策树用来实现高效的triphone对senone的对应,通过回答一系列前后音所属类别(元/辅音、清/浊音等等)的问题,最终确定其HMM状态应使用哪个senone。分类回归树CART模型用以进行词到音素的发音标注。 语言模型语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。常用的是二元的Bi-Gram和三元的Tri-Gram。语言模型的性能通常用交叉熵和复杂度(Perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney平滑。 搜索连续语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。搜索所依据的是对公式中的声学模型打分和语言模型打分。在实际使用中,往往要依据经验给语言模型加上一个高权重,并设置一个长词惩罚分数。Viterbi:基于动态规划的Viterbi算法在每个时间点上的各个状态,计算解码状态序列对观察序列的后验概率,保留概率最大的路径,并在每个节点记录下相应的状态信息以便最后反向获取词解码序列。Viterbi算法在不丧失最优解的条件下,同时解决了连续语音识别中HMM模型状态序列与声学观察序列的非线性时间对准、词边界检测和词的识别,从而使这一算法成为语音识别搜索的基本策略。由于语音识别对当前时间点之后的情况无法预测,基于目标函数的启发式剪枝难以应用。由于Viterbi算法的时齐特性,同一时刻的各条路径对应于同样的观察序列,因而具有可比性,束Beam搜索在每一时刻只保留概率最大的前若干条路径,大幅度的剪枝提高了搜索的效率。这一时齐Viterbi- Beam算法是当前语音识别搜索中最有效的算法。 N-best搜索和多遍搜索:为在搜索中利用各种知识源,通常要进行多遍搜索,第一遍使用代价低的知识源,产生一个候选列表或词候选网格,在此基础上进行使用代价高的知识源的第二遍搜索得到最佳路径。此前介绍的知识源有声学模型、语言模型和音标词典,这些可以用于第一遍搜索。为实现更高级的语音识别或口语理解,往往要利用一些代价更高的知识源,如4阶或5阶的N-Gram、4阶或更高的上下文相关模型、词间相关模型、分段模型或语法分析,进行重新打分。最新的实时大词表连续语音识别系统许多都使用这种多遍搜索策略。N-best搜索产生一个候选列表,在每个节点要保留N条最好的路径,会使计算复杂度增加到N倍。简化的做法是只保留每个节点的若干词候选,但可能丢失次优候选。一个折衷办法是只考虑两个词长的路径,保留k条。词候选网格以一种更紧凑的方式给出多候选,对N-best搜索算法作相应改动后可以得到生成候选网格的算法。前向后向搜索算法是一个应用多遍搜索的例子。当应用简单知识源进行了前向的Viterbi搜索后,搜索过程中得到的前向概率恰恰可以用在后向搜索的目标函数的计算中,因而可以使用启发式的A算法进行后向搜索,经济地搜索出N条候选。 系统实现 语音识别系统选择识别基元的要求是,有准确的定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。听写机:大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型参数,识别时,将基元串接成词,词间加上静音模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行解码。针对汉语易于分割的特点,先进行分割再对每一段进行解码,是用以提高效率的一个简化方法。对话系统:用于实现人机口语对话的系统称为对话系统。受目前技术所限,对话系统往往是面向一个狭窄领域、词汇量有限的系统,其题材有旅游查询、订票、数据库检索等等。其前端是一个语音识别器,识别产生的N-best候选或词候选网格,由语法分析器进行分析获取语义信息,再由对话管理器确定应答信息,由语音合成器输出。由于目前的系统往往词汇量有限,也可以用提取关键词的方法来获取语义信息。 自适应与强健性 语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。提高系统鲁棒性,是要提高系统克服这些因素影响的能力,使系统在不同的应用环境、条件下性能稳定;自适应的目的,是根据不同的影响来源,自动地、有针对性地对系统进行调整,在使用中逐步提高性能。以下对影响系统性能的不同因素分别介绍解决办法。解决办法按针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)分为两类。前者需要寻找更好的、高鲁棒性的特征参数,或是在现有的特征参数基础上,加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)模型。说话人自适应的特征方法有说话人规一化和说话人子空间法,模型方法有贝叶斯方法、变换法和模型合并法。语音系统中的噪声,包括环境噪声和录音过程加入的电子噪声。提高系统鲁棒性的特征方法包括语音增强和寻找对噪声干扰不敏感的特征,模型方法有并行模型组合PMC方法和在训练中人为加入噪声。信道畸变包括录音时话筒的距离、使用不同灵敏度的话筒、不同增益的前置放大和不同的滤波器设计等等。特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波,模型方法有倒谱平移。 微软语音识别引擎 微软在office和vista中都应用了自己开发的语音识别引擎,微软语音识别引擎的使用是完全免费的,所以产生了许多基于微软语音识别引擎开发的语音识别应用软件,例如《语音游戏大师》《语音控制专家》《芝麻开门》等等软件。 语音识别系统的性能指标 语音识别系统的性能指标主要有四项。①词汇表范围:这是指机器能识别的单词或词组的范围,如不作任何限制,则可认为词汇表范围是无限的。②说话人限制:是仅能识别指定发话者的语音,还是对任何发话人的语音都能识别。③训练要求:使用前要不要训练,即是否让机器先“听”一下给定的语音,以及训练次数的多少。④正确识别率:平均正确识别的百分数,它与前面三个指标有关。小结以上介绍了实现语音识别系统的各个方面的技术。这些技术在实际使用中达到了较好的效果,但如何克服影响语音的各种因素还需要更深入地分析。目前听写机系统还不能完全实用化以取代键盘的输入,但识别技术的成熟同时推动了更高层次的语音理解技术的研究。由于英语与汉语有着不同的特点,针对英语提出的技术在汉语中如何使用也是一个重要的研究课题,而四声等汉语本身特有的问题也有待解决。

普通话对英语语音的迁移作用摘 要: 本文在论述语言迁移理论本质的基础上,分析了影响迁移的因素,对汉英两种语言对比,从音素、音位、声调/语调语言、重音和节奏等层面分析了普通话对英语学习的负迁移作用,以便更好地帮助学生克服普通话的负迁移影响,促进英语语音的学习。关键词: 普通话;英语语音;语言迁移;对比研究The Transferring Effect of Mandarin on English PhoneticsLin YuhangDepartment of Foreign Languages and Literatures, Zhangzhou Teachers College 01021225Abstract: This paper is meant to help the Chinese English-learners to overcome the negative phonetic transfer and promote the study of English phonetics by dealing with language transfer theories, analyzing the factors affecting language transfer, comparing and analyzing some phonetic features of the Chinese and English languages, such as phone, phoneme, tone/intonation language, stress and words: Mandarin; English phonetics; language transfer; comparative analysis语音过关是英语学习的关键,同时也是难点。然而,外语界对语音教学问题的探讨却明显少于其他领域,这难免有些“避重就轻”之嫌。将英汉两种语音进行对比研究,对比教学,不失为一种良策,如张凤桐教授编著的《英国英语语音学和音系学》就是按照这一指导思想编写的教材。对比研究的理论基础是语言迁移,同时,对比研究和教学是正视语言迁移作用的科学方法和手段。然而就在将两种语音进行对比教学的过程中,产生了一些似是而非的说法,例如“普通话好,英语语音就好”是其中最具代表性的。这一说法过分夸大了语际间的正迁移作用,而忽略了负迁移作用。应该说这一问题的答案是不确定的。世界上有各种各样的语言,虽然各种语言有其相通的一面,但每一种语言都有其特有的语音体系,并有自己独特的发音规律。要全面正确地了解普通话对英语语音的迁移作用,就应该在认识语言迁移的本质和产生语言迁移因素的基础之上,将英汉语音、音位相关的方面作科学的对比研究。一、 语言迁移概念及其实质奥苏伯尔的认知结构迁移理论代表从认知的观点来解释迁移的一种主流倾向,然后有符号性图式理论、产生式理论、结构匹配理论与情境性理论等迁移理论。根据奥苏伯尔的认知结构迁移理论,“迁移是一种认知活动,体现了个体主动的心理加工过程”[1]。但也存在分歧,一些研究者着眼于各理论在更高层次上的概括,将迁移概括为“一种学习中习得的经验对其他学习的影响,是新旧经验的整合过程”[2],这种整合过程可以通过同化、顺应与重组三种方式实现,其实质是原有认知结构与新学习的相互影响、相互作用,从而形成新的认知结构的过程。迁移(transfer)作为一个心理术语,是指已获得的指示、技能、方法等对学习新知识、技能的影响。迁移是人类认知的一个普遍特征。在外语学习中,迁移“指的是人们已经掌握的知识在新的学习环境中发挥作用的心理过程”[3],主要是母语及母语学习经历对学习新语言的影响。语言迁移可分为正迁移(positive transfer)和负迁移(negative transfer)。如果某个外语结构在母语中有对应结构,或母语对外语的学习起促进作用,在学习中就会出现正迁移现象。但是如果某个结构在母语中没有对应的结构,或者两种语言中的对应结构有差异,也就是说,母语对外语的学习起干扰或抑制作用,就会产生反面的迁移,从而影响外语的学习,这就是学习中的负迁移现象。系统的语言迁移研究可追溯到上个世纪四五十年代的语言学家弗赖伊斯()和雷多()。他们从斯金娜()的行为主义心理学理论出发,认为“学习是刺激与反应的强化,是习惯的形成,是新旧知识的联结。因而在外语学习中,母语这种先前语言学习的习惯会对新的外语学习产生迁移作用”[4]。基于这一观点,他们认为“外语学习的主要困难是由两种语言的差异引起的,学习的主要任务就是找出并克服这种差异”[4],据此他们提出了对比分析假说(contrastive analysis hypothesis),即“将学习者的母语(mother tongue/native language)与目标语(target language)进行各方面的比较分析,找出两者的差异,解释或预测外语学习中已经或将要出现的困难与错误,并以此为指导教材的编写和教学活动。”[4]20世纪60年代末,乔姆斯基提出了语言习得机制( language acquisition device)假说和普遍语法 (universal grammar)理论。他认为:“人类语言结构存在着普遍性(language/linguistic universals),这种语言的普遍性反映了人类的经验过程,反映了人类获得新知识能力的普遍性”[5]。也就是说,人类生来就有自然学习语言的能力,它植根于人的内在机制,即语言习得机制。格林伯格( )通过对跨语言调查(cross-linguistic surveys)特别是对语序的分析来研究和证明语言的普遍性。总之,无论是强调母语迁移作用的对比分析假说,还是强调人类语言的普遍性而忽视母语迁移现象的普遍语法理论,都从不同的方面说明了正是各种语言具有一定的共性,母语才会对外语学习产生积极影响的正迁移作用,同时每种语言所具有的特殊性又使母语迁移对外语学习产生一定的负面影响,即负迁移。二、语言迁移产生的因素语言迁移绝非简单的母语与外语或第二语言间的迁移,也不是两种语言间的相似性或共同性就能决定迁移的程度。相反,它涉及各种不同类型的迁移,也涉及不同的主客观因素。任何迁移形式的产生都受到许多主客观因素的制约。影响英语语音学习迁移的因素很多,包括学习材料间的共同因素、对材料的理解程度、知识经验的概括水平、定势作用、认知结构的清晰性和稳定性及知识的运用等。奥苏伯尔认为,认知结构的3个变量影响新的学习或迁移的发生。认知结构即学生头脑中的知识结构,从广义上讲,它是学生已有观念的全部内容及其组织;从狭义上讲,它是学生在某一特殊领域中的观念的全部内容及其组织。认知结构变量就是学习者应用他的原有知识同化新知识时,原有认知结构在内容和组织方面的特征。影响陈述性知识迁移的变量是:可利用性、可辨别性和稳定性。此外,有学者认为以下问题与语言迁移密切相关。首先,情境特征引起的关注。情境包括最初的学习情境和后来的迁移情境,两种情境是否相似影响迁移水平。研究发现,物理的和社会的场景也是整个学习中重要的、有意义的组成部分。不同的场景或情境,其学习与迁移可能不同。因此,真实的英语学习情境,如外语角等,有助于将学得的语言知识与语言技能迁移到实际情境中去。其次,强调迁移的主动性与通达性。通达体现了学习者的主观能动性,意味着学习者可在迁移机会出现时,顺利地提取有关的经验或可利用的资源。有效的学习者有强烈的内部动机来调节自己的语言学习活动,如主动识别先前的语言学习与目前任务的相关性,识别恰当的语言使用和语言迁移情境,主动提取可利用的资源等,这些都是语言迁移产生的必要条件。三、 对比研究中普通话对英语语音的迁移作用对比研究是建立在美国学者雷多(R. Lado) 1957年提出的“对比分析(contrastive analysis)”基础上的一种语言分析方法。雷多的对比研究是一种在语音、语法和文化层次上对第一语言和第二语言进行严格的、逐一比较的体系。该对比研究的理论基础和焦点是语言迁移。语言的对比研究有助于人们认识语言间的区别和联系。李庭芗先生指出,“英、汉语在语音方面有哪些相同和相异的地方,是每个英语教师所必须了解的。英、汉对比的知识能帮助教师根据英、汉语的异同,预见学生在学习中的难点和重点,从而在教学方法上采取相应措施,以提高英语教学的质量”[6]。要学好英语语音,首先要了解哪些音是汉语中没有的,哪些音容易受汉语语音的干扰,英、汉语音之间怎样互相干扰的。普通话学习者在英语语音学习中产生的迁移,虽然不完全是具体知识的迁移,却是普通话发音习惯、发音部位的迁移,也是一种发音技能的迁移。对两者进行音素(phone)、音位(phoneme)及音节(syllable)等方面作系统的对比研究,无疑会促进找准正迁移作用的条件,而减少负迁移产生的干扰,有助于英语语音的学习。语音的最小单位是音素,但是在言语交际中能区别意义的最小语音单位是音位。音位分为音段音位(segmental phonemes)和超音段音位(super-segmental phonemes)两种,前者包括元音、辅音,元音与辅音、辅音与音在词中的组合,即音位组合或音节;后者则指重音(stress),音程(length),节奏(rhythm),音调(tone),语调(intonation)及音渡(juncture)等。以下是两种语言音位的对比分析和迁移作用的情况:1. 元音、辅音和声母和韵母属于印欧语系日耳曼语族的英语有20个元音、28个辅音。英语的音位是区别词义的最小单位。属于汉藏语系汉语的音位和英语一样,也是区别词义的最小单位。普通话是汉语的代表语言,有辅音音位,即声母22个,韵母31个。声母一般位于音节的开头,韵母是声母后的一部分,一般由元音或元音加辅音/n、n^/构成,如/B、o、Bi、en、uBn^/等韵母。英语元音分为单元音和双元音;普通话的元音分为单韵母和复韵母。英语的单元音数量比普通话的单韵母要多,而且分得细。普通话里只有6个单韵母;英语有12个单元音,而且分为前、中、后元音。其中/I、U、e、A、Q/等单元音在普通话中找不到近似的音,很难说普通话说得好的人一定就能发好这些音和包含这些音位的单词和句子。而在普通话中 能找到的近似音如/i、u/,前者发音的舌位比英语更靠前,后者则更靠后[7]。另外,普通话的复韵母/ei、Bi、Bo、ou/和英语的双元音/eI、aI、au、EU/虽都以强元音为主,向弱元音方向滑动。但是,普通话滑动较快,而且并没有达到弱元音的位置,念起来两音浑然一体;英语的双元音滑动较明显,两者相对独立,普通话较好的人很容易将like误念成/lak/或/lek/。值得注意的是两者在发音的部位和口形上都存在差异。发复韵母/ei、Bi、Bo、ou/的口形张得小于发双元音/eI、aI、aU、[U/,但舌位略靠后[7]。当然,能掌握汉语中的渐强复韵母,如/iB、ie、uB、uo/的学习者更容易发好英语中的双元音/I[、Z[、U[/。普通话和英语里都有三元音,其发音方法各不相同:发普通话三元音的方法是由弱到强,再由强到弱,中间的元音紧张度强,形成一个音节,如/iBo、uBi、ioU、iBo/等;英语的三元音由双元音加/[/组成,但不是出现在同一个音节里,其发音方法是由强到弱,再由弱到次强。普通话和英语的辅音音位也存在异同。英语的辅音多数是清浊成对的,如 /p、b/,/t、d/,/k、g/等;而普通话的辅音多数分为送气和不送气的清辅音,如/p、b、t、d、k、g、j、q、x、zh、ch、sh、z、c、s/等,浊辅音只有/r、m、n、l、ng/5个。汉语的送气和不送气区别意义;英语的清浊可以区别词义,影响元音的长度和同化相邻的辅音,如/lIt/中的/I/就发得比/lId/中的/I/短促,浊音能延长前面带的元音。又如元音/R:/在 caw,cord,caught三个单词中的音程不同,在caw中发音最长,在cord中次之,caught中则最短。此外,英语中的辅音根据所处的位置不同和所连接的音位的关系,产生音位变体(allophone)。如音位/t/在不同的发音环境中,它的发音是不一样的,在top中是送气的(aspirated);在stop中是不送气的(unaspirated);在certain中是鼻腔爆破(nasalized plosive);在little中是舌边爆破(lateral plosive);在that kid中是不完全爆破(incomplete plosive);在that day中是失去爆破(loss of plosive)。这些现象是英语中特有的,普通话再好,如果没有具备该语音知识,也学不好英语语音。诚然,普通话语音系统中的一些音位与英语的某些音位无大差别。比如,鼻辅音(nasal)在两种语音系统中构成一个自然类,可以用同样的区别特征加以描述,/m/,/n/,/N/可分别描述为〔+辅音性,+鼻音性,-后部性,+双唇性〕;〔+辅音性,+鼻音性,-后部性,+齿龈性〕;〔+辅音性,+鼻音性,+后部性,+软颚性〕。能发好普通话鼻辅音的学习者,语言的正迁移作用就能让他正确发好英语的鼻辅音。但学习者更应关注的那些和普通话发音的部位和方法有差异的近似音和汉语中根本没有的音位,如/W、T/,/F、V/,/tF、dV/等,不管普通话说得多地道的学习者,不加强练习,也不容易发好齿摩擦音(dental fricative)/W、T/,颚龈摩擦音(palato-alveolar fricative)/F、V/和颚龈塞擦音(palato-alveolar affricate)/tF、dV/。特别值得注意的是以下辅音在普通话和英语中的不同描述:/s、z/在英语中为齿龈摩擦音(alveolar fricative);在汉语中前者为齿摩擦音(dental fricative),后者为齿塞擦音(dental affricate)。/h/在英语中为喉擦音(glottal fricative);在汉语中为软颚摩擦音(velar fricative)。/r/在英语中为无摩擦延续音(approximate);在汉语中为卷舌摩擦音(retroflex fricative)[7]。2.音位组合—音节对比音节既是语音学中的一个概念,也是音位学中的重要概念。对音节的定义说法不一。就其结构而言,“音节是由一个或一系列音位构成的语音结构”[7](P20)。音节通常由起音(onset),领音(peak)和收音(coda)构成,领音一般是元音(vowel),起音和收音常常是辅音(consonant)。英语音节构成形态要比普通话音节构成复杂得多。具体形态如下:英语音节:V-VV-VVV-CV-CVV-CVVV-VC- VCC-CCVV-CVC-CVVC-CCV-VCCC-CCVC-CC CVC-CCCVVCC-CCCV-CCVVC-CCVVCC-CCVCC C-CCVCCCC-CVCC-CVCCC-CVCCCC汉语音节:V-VV-VVV-CV-CVV-CVVV-VC-CVC- CVVC从以上对比中可看出,普通话的音节结构比较简单,通常是单辅音加元音;英语音节的首、尾常常出现辅音群(consonant clusters)如 must tempt texts thousandths等。换言之,普通话中只有单辅音型的音节,没有辅音群型的音节。辅音群型的音节成为中国学习者,包括能说标准普通话学习者的语音难点。学习者习惯于在读英语辅音群中夹带元音,如把green念成/^[ri:n/。另外升调时容易从词尾的辅音开始,试图把它拉的很长,因而很费力,发出的音也很不规范。这是因为汉语的音节除/n/和/ng/两个鼻辅音外,都以元音结尾,即为开音节,而且节峰前最多只有一个辅音;而英语的音节节峰前最多可有三个辅音,如/sprIt/等,而节峰后最多可有四个。由于两种语言的音节系统不同,学生易将汉语的音节特征转移到英语学习中。3.语调语言(intonation language)和声调语言(tone language)汉语中的每一个字(或音节)都有一个区分字义作用的声调, 如/mā/妈,/má/麻,/mǎ/马,/mà/骂,/mB/吗,语音学家称汉语为声调语言;然而在英语中,单词的音调不改变它的词义,如book/buk/在读成平调、升调或降调时始终是“书”的意思,但英语的单词被用于句子时,就要赋予它一定的语调,来表达说话者的态度、语气等,这种语调的核心一般放在语句的末尾,所以语音学家把英语叫做语调语言。如:This is your↘seat.句未的降调表示肯定的语气,但 This is your ↗seat?表示疑问的口吻,以求取得对方的证实。汉语句子的语调也常常落在句未的重读字上,但由于这个重读字本身又有固定的声调,其实际语调必然受到该字本身的声调和所需语调的共同影响,即在原来字调的基础上,按所需语调去稍加调制、改变,使它既不完全失去原来的声调,又符合所需语调的要求。如:“这是我的球↘。”句中的“球”字本身是升调(阳平),而句末要求用降调,实际话语中只能采取折衷的办法,把“球”字的升调上升幅度减少一些。又如:“你的书↗,还是他的?”句中“书”字原本是高平调(阴平),而句子中间需要升调,语言实践中只能是把“书”字在原来的高平调后面接着稍微升高一些,成为高平调加升调。可见,由于汉语语调受字调的限制,升降规则比英语复杂,升降的幅度也要小。中国学生由于受汉语的这种声调、语调的负迁移影响,讲英语时往往语调平平,抑扬不太分明,升降起伏较小,很难学会英语那种梯级下降型的语调。近年来,语音学家趋向于更加强调英语语调的重要性,认为元音辅音是英语本身,而语调是英语的灵魂。假如元音辅音念得很准,而语调不对,听起来就不像英语。相反,假如元音辅音读得有些毛病,但语调正确,听起来还像英语。既然英语语调这样重要,那么我们要学好英语就必须注意汉语和英语在语调上的区别,努力在说英语时克服汉语语调的影响,勤学苦练,逐步掌握英语语调。4.其他语音方面的负迁移英语单词没有辨义的声调,重音是重要的语音要素,有区别词义的作用,如:´converse(名词,相反的事务),con´verse(动词,交谈)。在汉语词组中起辨义作用的是声调而不是重音,声调比重音在话语中具有更加重要的作用,除词尾含有虚词的词组(如桌子、木头等)和个别词组(如爸爸、妈妈等)外,大部分词组中的每个字都读成同样的轻重程度,如教师、电话、汽车、天气等。这种母语特点迁移到英语学习中,常常使初学者读多音节英语单词是重读、轻读音节不明甚至重音错位,如把´diligent读成´di´li´gent,di´ligent或dili´gent。在节奏和韵律方面,汉英之间的差别也很大。汉语是以音节(字)为计时单位的,而英语则以重音为计时单位的。汉语中,音节(字)的数目是韵律的基础,除了一些助词念得较快较含糊外,一般每个字所占用的时间大致相等,读得也清清楚楚。例如古诗中总是根据每行的字数来决定它的韵律或节奏,如柳宗元的《江雪》:千山鸟飞绝,万径人踪灭。孤舟蓑笠翁,独钓寒江雪。即使音节(字)有思想表达上所需的轻重之分,也不像英语那么明显、分明,所以,一般字较多的一句话所占用的时间,要比字较少的一句话占用的时间长,如“他有汽车。”和“他有一辆上海产的汽车。”但在英语中,重音和轻音是交替出现的,而重读音节才是节奏的基础、主体。重读音节总是声调较高,响度较大,发音清楚,所占时间较长;而轻读音节则声调较低,响度小,读得快而含糊,所占时间较短。所以,重音与重音之间总是保持大致相等的实际距离。重音之间的轻读音节越多,就读得越快越含糊。如:“Ann ´found the ´book she ´lost at ´last.”和“E´lizabeth ´found the ´article she was ´studying at the ´library.”前一个句子有8个音节,后一句却有19个音节,但两个句子同样只有5个重读音节。为了保持每两个重读音节之间所用时间大致相等,重读音节之间的轻读音节所占用的时间就不完全相同。后句话中,第一和第二个重读音节之间,第二和第三个重读音节之间分别由2个和1个轻读音节,而第三和第四个重读音节之间,第四和第五个重读音节之间各有4个轻读音节,为了保持5个重读音节之间大致相等的时间距离,第三至第五重读音节之间的轻读音节就要读得轻而快。中国学生对英语的这一特点较难把握,往往是按汉语习惯把每个音节(字)说得都很清楚,而不习惯把几个轻读音节压缩在一起,快速而含糊地读出来,因而听起来不是很自然。另外,在音节的衔接(juncture)方面,英语有汉语中所没有的连读(liaison)现象,也会给初学者带来一定的困难。在英语学习中,许多人可以发好一个单词的音,却说不出流畅、连贯的句子;能听懂英语单词,却听不懂连贯的句子。这种现象,我认为,主要原因之一就是他们没有掌握好英语中的连读。英语中有许多词是以辅音结尾的,在与紧接他们后面的一个词词首的元音连起来念,就产生了连读现象。但实际上汉语中也存在这种连读,只是我们平常没有意识到。汉语的连读一般出现在感叹句中,如:我的天哪! Wo de tiBn B好苦哇! HBo ku B然而汉语的连读范围不像英语连读现象那么普遍,而且大多数字以韵母结尾,使连读受到很大限制,所以学生在碰到英语连读时就会感到非常困难,同时也极大地限制了学生的听力发展。同化现象也是英语中最常见的一种音变现象,在连贯的说话或朗读中,音与音之间的相互影响是很自然的。其实,在汉语中也存在着类似的现象,如:面包 miBn-bBo → miBm-bBo难免 nBn-miBn → nBm-miBn这里的“面”和“难”都以/n/结尾,但因为受后面音/b/和/m/(双唇音)的影响,因此,“面”、“难”后面的/n/音就同化为双唇音/m/了。音渡指语音结构中两个音段界限之间的停顿过渡。普通话和英语两种语言中,音渡都有辨义功能,普通话好的学习者,一般能够注意英语音渡,但要完全掌握,仍然需要大量实践。四、结束语普通话和英语在发音的特征与规律、音位的数量与性质等方面都存在异同,而且差异性大于相似性,在二者相似性较强的方面,正迁移作用较为明显;二者差异表现明显的方面,负迁移作用却占了上风。既然普通话在英语语音学习中有“正迁移”和“负迁移”两方面的双重作用,因此,在英语语音教学中教师应与学生一起,尽量克服普通话对英语语音学习的干扰,促进普通话对英语语音学习的积极作用。在教学中教师帮助学生克服干扰时要突出要害,使学生深刻理解两种语言在发音方法以及语言表达方式上的异同。根据对比分析的理论观点,通过描写、选择、对比、预测对比分析的步骤,对普通话和英语进行科学的结构分析,找出两者之间的区别,以及区别程度的大小。通过这种有意识地对英汉语音系统进行对比分析,帮助学生做出有意义的概括,培养学生英汉语音系统差异的敏感性。正如吕淑湘在《中国人学英语》一文中指出:对于中国学生最有用的帮助就是让他认识英语和汉语的差别,对每一个具体问题,都尽可能用汉语的情况来跟英语作比较,让他通过这种比较得到更深刻的体会。中国学生必须认识到汉语、英语的差异,警惕汉语的干扰,尽量在英语学习中克服,避免汉语的干扰,这样才能更有效全面地学习英语。通过以上的讨论,很难说普通话好的学习者,英语语音就一定好;也不能说普通话不好的学习者英语语音就一定不好。影响英语语音学习迁移的因素很多,包括普通话和英语之间的异同因素、个体对异同因素的理解程度、知识经验的概括水平。此外,情境也参与迁移活动;学习者的主观能动性、个体特征等都是语言迁移得以产生的必要条件。普通话对英语语音的迁移作用绝非是单一的,两种语言之间的相似性也不能决定迁移的程度,它涉及多种不同的主客观影响因素,应综合考虑。孤立地研究某一因素或某一类型的迁移,不利于真正揭示迁移的本质,对英语语音学习也无实质性的助益。普通话好,只能说从语言学习的态度、方法等方面具备了发生语言迁移的可能性,但是否能克服语言负迁移的影响,真正发挥语言正迁移的作用于英语学习,还需要学习者发挥主体作用,了解一定的英语语音、音位理论知识,按照英语的语音、音位规律,掌握发音技巧,通过大量的训练,才能有较好的英语语音,说地道的英语。参考文献:1. D. .Educational Psychology:A Cognitive View〔M〕.New York:Holt,Rinehart and Winston,1968.2. 冯忠良.结构—定向教学的理论(上)[M].北京:北京师范大学出版社,1992.3. 蒋祖康.第二语言习得研究[M].北京:外语教学与研究出版社,. . Linguistic Across Culture[M].Ann Arbor: University of Michigan Press,. . Syntactic Structure[M].The Huge:Mouton,. 李庭芗.英语教学法[M].北京:高等教育出版社,. 张凤桐.英国英语语音学和音系学[M].成都:四川大学出版社,1998.8. 秦秀白.英语通论[M].武汉:华中师大出版社,1988.

小波去噪阈值算法毕业论文

图像降噪的主要目的是在能够有效地降低图像噪声的同时尽可能地保证图像细节信息不受损失,。图像去噪有根据图像的特点、噪声统计特性和频率分布规律有多种方法,但它们的基本原理都是利用图像的噪声和信号在频域的分布不同,即图像信号主要集中在低频部分而噪声信号主要分布在高频部分,采取不同的去噪方法。传统的去噪方法,在去除噪声的同时也会损害到信号信息,模糊了图像。小波变换主要是利用其特有的多分辨率性、去相关性和选基灵活性特点,使得它在图像去噪方面大有可为,清晰了图像。经过小波变换后,在不同的分辨率下呈现出不同规律,设定阈值门限,调整小波系数,就可以达到小波去噪的目的。小波变换去噪的基本思路可以概括为:利用小波变换把含噪信号分解到多尺度中,小波变换多采用二进型,然后在每一尺度下把属于噪声的小波系数去除,保留并增强属于信号的小波系数,最后重构出小波消噪后的信号。其中关键是用什么准则来去除属于噪声的小波系数,增强属于信号的部分。

导言 损坏的图像往往是在其噪声采集和传输。例如在图像采集,其性能的影像传感器是受多种因素,如环境条件和质量检测的内容本身。例如,在获取图像的CCD相机,轻水平和传感器温度是主要影响因素的数量所产生的噪声的形象。图像传输过程中还损坏,由于干扰的频道用于传输。图像降噪技术,必须消除这种添加剂随机噪声,同时保留尽可能多的重要信号的功能。的主要目标,这些类型的随机噪声去除抑制噪声,同时保持原始图像的细节。统计过滤器一样平均滤波器[ 1 ] [ 2 ] , Wiener滤波器[ 3 ]可用于消除这种噪音,但基于小波变换的去噪方法更好的结果证明不是这些过滤器。一般来说,图像去噪规定之间的妥协,减少噪音和保护重要的图像细节。为了实现良好的性能在这方面,去噪算法,以适应图像的不连续性。小波代表性,自然有利于建设这种空间自适应算法。它压缩在一个重要信息信号转换成相对较少,大量系数,代表图像细节在不同的决议尺度。在最近几年出现了相当数量的研究小波阈值和阈值选取的信号和图像去噪[ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ] ,因为小波提供了一个适当的基础分离噪音信号从图像信号。许多小波阈值技术一样VisuShrink [ 10 ] , BayesShrink [ 11 ]已经证明,效益较好的图像去噪。在这里,我们描述一个有效的阈值去噪技术通过分析统计参数的小波系数。本文安排如下:简要回顾了离散小波变换( DWT域)和小波滤波器银行第二节。小波阈值技术是基于解释第三节。在第四部分提出了新的阈值技术的解释。的步骤在此范围内工作的解释第五节第六节的实验结果这个拟议的工作和其他去噪技术是当前和比较。最后总结发言中给出了第七节。

小波有两个显著特点:一是在时域中都具有紧支集或近似紧支集;二是正负交替的波动性。小波分析是将信号分解成一系列小波函数的叠加,而这些小波函数都是由一个母小波通过平移和尺度伸缩得来的。小波分析理论的一个重要特色是可以进行多分辨率分析。信号可通过多层分解为反映高频信息的细节部分和反映低频信息的概貌部分,通过这种多分辨率分解,信号和噪声通常会有不同的表现,从而达到信嗓分离的目的。金融时间序列去噪处理采用更广泛的方法:非线性阈值处理方法。非线性阈值处理方法又称小波收缩法,该方法的基本原理是基于小波变换的集中能力。即通过小波变换后有用信号的能量集中于少数小波系数上,而白噪声在小波变换域上仍然分散在大量小波系数之上。因而相对来说,有用信号的小波系数值必然大于那些能量分散且幅值较小的噪声的小波系数值。因此,从谱的幅度上(不是谱的位置)看,有用信号和噪声可以实现分离。该方法可分为以下3个步骤:(1)选择合适的正交小波基和分解层数J,对含噪信号进行小波变换分解到J层。(2)对分解得到的小波系数进行闭值处理,可以使用两种处理方法:硬阈值和软阈值法。硬阈值法保留较大的小波系数并将较小的小波系数置零,即:(3)软阈值法将较小的小波系数置零,而对较大的小波系数向零进行收缩,即:学者证明了用软阈值法能使估计信号实现最大均方误差最小化,即去噪后的估计信号是原始信号的近似最优估计。该方法具有广泛的适用性,是应用最为广泛的一种小波去噪方法,其计算速度也很快。

相关百科