Numpy库简介
收藏
Numpy是Python用于科学计算的基础包,也是大量Python数学和科学计算包的基础,不少数据处理及分析包都是在Numpy基础上开发的,比如pandas包就是在其基础上开发的。Numpy的核心基础是ndarray(N-dimensional array,N维数组),即由数据类型相同的元素组成的N维数组。可利用Numpy包提供的数组定义函数array()将数据转化为数组的形式
0
收藏
请登录后评论
基于array()函数,可以将列表、元组、嵌套列表、嵌套元组等给定的数据结构转化为数组,值得注意的是利用array函数之前,事先要导入Numpy
使用:
import numpy
命令,即可将该包导入到脚本文件中并可以使用了。利用内置函数,可以创建一些特殊的数组,比如可以利用ones(n,m)函数创建n行m列元素全为1的数组、利用zeros(n,m)函数创建n行m列元素全为0的数组,利用arange(a,b,c)创建以a为初始值,b-1为末值,c为步长的一维数组。其中a和c参数可省,这时a取默认值为0,c取默认值为1。
数组尺寸,也称为数组的大小,通过行数和列数来表现。通过数组中的shape属性,可以返回数组的尺寸,其返回值为元组。如果是一维数组,返回的元组中仅一个元素,代表这个数组的长度。如果是二维数组,元组中有两个值,第一个值代表数组的行数,第二个值代表数组的列数。我们常见的RGB图片,是个三位数组。元组中有三个值,第一个值代表图片的长,第二个值代表图片的高。第三个是3表示是RGB三个通道。有些带透明度的RGBA图片,第三个是4表示是RGBA三个通道。
numpy数组的运算主要包括数组之间的加、减、乘、除运算,数组的乘方运算,以及数组的数学函数运算。还有一些矩阵的运算。
一般地,假设D为待访问或切片的数据变量,则访问或者切片的数据=D[①,②]。其中①为对D的行下标控制,②为对D的列下标控制,行和列下标控制通过整数列表来实现,但是需要注意①整数列表中的元素不能超出D中的最大行数,而②不能超过D中的最大列数。为了更灵活地操作数据,取所有的行或者列,可以用“:”来代替实现。同时,行控制还可以通过逻辑列表来实现。
数组的切片,也可以通过ix_()函数构造行、列下标索引器,实现数组的切片操作。
在数据处理中,多个数据源的集成整合是经常发生的。对于数组间的集成与整合,主要体现在数组间的连接,包括水平连接和垂直连接两种方式。水平连接函数用hstack()、垂直连接函数用vstack()实现。注意输入参数为两个待连接数组组成的元组。
利用Numpy库中的save函数,可以将数据集保存为二进制数据文件,数据文件后缀名为.npy。也可以保存为npz格式文件。
通过load函数,可以将该数据集加载
通过数据的存取机制,提供了数据传递及使用的便利,特别是有些程序运行结果需要花费大量时间的时候,保存其结果以便后续使用是非常有必要的。
感谢分享!
大家一起学习 一起进步
感谢分享
一起努力