# 小波

[原文](https://zhuanlan.zhihu.com/p/22450818)

傅里叶-->短时傅里叶变换-->小波变换

## 一、**傅里叶变换**

傅里叶变换的**不足**

对**非平稳**过程，傅里叶变换有局限性

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nC-NDaPDO8ldCg%2Fimport.png?generation=1586530894854329\&alt=media)做完FFT（快速傅里叶变换）后，可以在频谱上看到清晰的四条线，信号包含四个频率成分。

一切没有问题。但是，如果是**频率随着时间变化的非平稳信号**呢？

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nE0ffacGNrq_bD%2Fimport1.png?generation=1586530897120968\&alt=media)如上图，最上边的是频率始终不变的平稳信号。而下边两个则是频率随着时间改变的非平稳信号，它们同样包含和最上信号相同频率的四个成分。

做FFT后，我们发现这三个时域上有巨大差异的信号，频谱（幅值谱）却非常一致。**尤其是下边两个非平稳信号，我们从频谱上无法区分它们，因为它们包含的四个频率的信号的成分确实是一样的，只是出现的先后顺序不同。**&#x53EF;见，傅里叶变换处理非平稳信号有天生缺陷。它只能获取**一段信号总体上包含哪些频率的成分**，但是**对各成分出现的时刻并无所知**。因此时域相差很大的两个信号，可能频谱图一样。然而平稳信号大多是人为制造出来的，自然界的大量信号几乎都是非平稳的，所以在比如生物医学信号分析等领域的论文中，基本看不到单纯傅里叶变换这样naive的方法。

理解什么是非平稳信号了么。。不是平均分布的，有先后的

## 二、短时傅里叶变换（Short-time Fourier Transform, STFT）

一个简单可行的方法就是——**加窗**。把整个时域过程分解成无数个等长的小过程，每个小过程近似平稳，再傅里叶变换，就知道在哪个时间点上出现了什么频率了。这就是短时傅里叶变换。

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nGcidVJofrkbf5%2Fimport3.png?generation=1586530895628422\&alt=media)图上既能看到10Hz, 25 Hz, 50 Hz, 100 Hz四个频域成分，还能看到出现的时间。两排峰是对称的，所以只用看一排就行了。

使用STFT存在一个问题，我们应该用多宽的窗函数？窗太宽太窄都有问题：![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nIhtHD5rzE2pjN%2Fimport4.png?generation=1586530893744529\&alt=media)所以**窄窗口时间分辨率高、频率分辨率低**，**宽窗口时间分辨率低、频率分辨率高**。对于时变的非稳态信号，

**高频适合小窗口，低频适合大窗口**。然而**STFT的窗口是固定的**，在一次STFT中宽度不会变化，所以STFT还是无法满足非稳态信号变化的频率的需求。

## **三、小波变换**

那么你可能会想到，让窗口大小变起来，多做几次STFT不就可以了吗？！没错，小波变换就有着这样的思路。但事实上小波并不是这么做的。至于为什么不采用可变窗的STFT呢，我认为是因为这样做冗余会太严重，STFT做不到正交化，这也是它的一大缺陷。\
于是小波变换的出发点和STFT还是不同的。**STFT是给信号加窗，分段做FFT**；而小波直接把傅里叶变换的基给换了——将**无限长的三角函数基**换成了**有限长的会衰减的小波基**。这样不仅能够**获取频率**，还可以**定位到时间**了\~

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nKebssHssdTjRP%2Fimport5.png?generation=1586530903971541\&alt=media)

这个基函数会**伸缩**、会平移（其实本质并非平移，而是两个正交基的分解）。缩得窄，对应高频；伸得宽，对应低频。然后这个基函数不断和信号做相乘。某一个尺度（宽窄）下乘出来的结果，就可以理解成信号所包含的当前尺度对应频率成分有多少。于是，基函数会在某些尺度下，与信号相乘得到一个很大的值，因为此时二者有一种**重合**关系。那么我们就知道信号包含该频率的成分的多少。

仔细体会可以发现，**这一步其实是在计算信号和三角函数的相关性。**

**注意：先伸缩，然后计算相关性，跟窗口无关**

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nM3PXbguVrRqrj%2Fimport7.png?generation=1586530898830788\&alt=media)

这两种尺度能乘出一个大的值（相关度高），所以信号包含较多的这两个频率成分，在频谱上这两个频率会出现两个峰。

小波做的改变就在于，将无限长的三角函数基换成了有限长的会衰减的小波基。![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nO95xqDxDz4126%2Fimport8.png?generation=1586530897966169\&alt=media)

从公式可以看出，不同于傅里叶变换，变量只有频率ω，小波变换有两个变量：尺度a（scale）和平移量 τ（translation）。

**尺度**a控制小波函数的**伸缩,平移量**τ控制小波函数的**平移**。**尺度**就对应于**频率(**&#x53CD;比),**平移量**τ就对应于**时间**。

![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nQQJPYgbVFEoZ3%2F9import.png?generation=1586530893773633\&alt=media)

当伸缩、平移到这么一种重合情况时，也会相乘得到一个大的值。这时候和傅里叶变换不同的是，这不仅可以知道信号有这样频率的成分，而且知道它在**时域上存在的具体位置**。 而当我们在每个尺度下都平移着和信号乘过一遍后，我们就知道信号在每个位置都包含哪些频率成分。

### 小波的优势

### ![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nSakLdkJEzuGXH%2F10import.png?generation=1586530895284066\&alt=media)

### ![](https://1237447543-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-M4ZaszQkuLof2XL0b_v%2F-M4Zav0QOp8dmT2IkJTc%2F-M4Zb0nU3M0L6gCp26ZE%2F12import.png?generation=1586530892044229\&alt=media)

**什么是正交化？为什么说小波能实现正交化是优势?**

简单说，如果采用正交基，**变换域系数会没有冗余信息**，变换前后的信号能量相等，等于是用最少的数据表达最大的信息量，利于数值压缩等领域。JPEG2000压缩就是用正交小波变换。比如典型的正交基：二维笛卡尔坐标系的（1,0）、（0,1），用它们表达一个信号显然非常高效，计算简单。而如果用三个互成**120°**&#x7684;向量表达，则会有信息冗余，有重复表达。但是并不意味着正交一定优于不正交。比如如果是做图像增强，有时候反而希望能有一些冗余信息，更利于对噪声的抑制和对某些特征的增强。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://zh-1-peng.gitbook.io/eeg-analysis-note/xiao-bo.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
