python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python最小二乘法拟合曲线

如何使用Python最小二乘法拟合曲线代码详解

作者:张小鸣

最小二乘法Least Square Method做为分类回归算法的基础,有着悠久的历史,下面这篇文章主要给大家介绍了关于如何使用Python最小二乘法拟合曲线的相关资料,需要的朋友可以参考下

一、背景描述

在一个普通的摸鱼早晨,群里居然出现了一个不合时宜颇为突兀的正经问题,原来是一个博士同学需要対实验数据进行曲线拟合并且批量计算出多项式方程

一般来说,这种问题对于经常做实验的同学来说并不陌生,通常使用MATLAB或者Origin Pro这类专业的数据计算软件,甚至Excel也可以实现.

但是作为程序员肯定第一想到的还是使用强大的Python来实现,但是因为本人主要做java开发,python知之甚少,但也知道python强大在各种现成的类库,所以实现估计并不难,按我们就上手试试?

再来一张图更直观的表述下,博士同学就是有多组实验数据,可以分布在坐标系,例如图中的各个散点,而他想做的就是将散点拟合为一条曲线,获得曲线的方程式,从而可以通过输入其他x坐标的值预测结果数据.这在非常多的地方都有极大的用处

二、前期准备

在开始前还是需要対一些基本概念和类库进行了解和介绍,因为并不是专业做研究的,所以对于以下名词只做简单的描述,达到理解并且可以使用的目的即可

最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小

最小二乘法是解决曲线拟合问题最常用的方法。

其基本思路是:事先选定的一组线性无关的函数, 是待定系数 ,拟合准则是使实验数据(笛卡尔坐标系的坐标数据)与待拟合曲线的距离的平方和最小,称为最小二乘准则.

总结来说,我们通常就是使用最小二乘法来做曲线拟合,通过计算最小值来获得多项式的系数与误差数值.

(关于最小二乘法的原理大家可以自行了解,甚至可以让你重新感知到数学逻辑之美)

Python类库

NumPy

NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

Matplotlib

Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。

三、代码实现

这里我们举一个例子来展示下,相信下面这道数学题大家一定不陌生.

某公司为合理定价,在试销期间得到单价x(单位:元)与销售量y(单位:件)的数据如表:

单价(x) 80 82 84 86 88 90

销量(y) 90 84 83 80 75 68

如果换做之前,我们肯定就熟练的直接开始列方程解未知数了,但是现在我已经失去了这项能力,那么不妨使用我们准备好的拟合曲线让程序来帮我们计算下.

话不多说,直接上代码

import matplotlib.pyplot as plt
import numpy as np

# 准备数据,将(x,y)坐标点进行输入
x = np.arange(80, 92, 2)  # x = 80,82,84,86,88,90
y = np.array([90, 84, 83, 80, 75, 68])
# 使用polyfit方法来拟合,并选择多项式,这里先使用2次方程
z1 = np.polyfit(x, y, 2)
# 使用poly1d方法获得多项式系数,按照阶数由高到低排列
p1 = np.poly1d(z1)
# 在屏幕上打印拟合多项式
print(p1)
# 求对应x的各项拟合函数值
fx = p1(x)
# 绘制坐标系散点数据及拟合曲线图
plot1 = plt.plot(x, y, '*', label='origin data')
plot2 = plt.plot(x, fx, 'r', label='polyfit data')
plt.xlabel('x-price')
plt.ylabel('y-amount')
plt.legend(loc=4)  # 指定legend的位置,类似象限的位置
plt.title('polyfit')
plt.show()
plt.savefig('polyfit.png')

代码其实比较简单,输入坐标数据,使用polyfit拟合曲线,输出方程并且将图标画出来,我们来执行下看看结果如何

左边那个就是拟合出来的二次方程,因为格式问题,2次方在上面一行,大家能看懂就行,右边就是这个曲线的图,但是可以看出曲线并不能非常好的贴合散点数据

这里我们将多项式改为3次方式再试一下

z1 = np.polyfit(x, y, 3)

再试一下

可以看出三次方程对于数据的贴合度还是比较好的,而如何选择合适的多项式,或者其他类型函数,比如指数函数,幂函数等就需要人自己的合理选择了.

好了,文章就到这里了,在python强大类库的帮助下,总体还是比较简单的

总结

到此这篇关于如何使用Python最小二乘法拟合曲线的文章就介绍到这了,更多相关Python最小二乘法拟合曲线内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文