Pandas Series API 手册
Series 是一种一维数组,能够存储任何数据类型(整数、字符串、浮点数、Python 对象等),并且每个元素都有一个标签,称为索引。
以下是 Pandas Series 的常用 API 手册:
Series 构造函数
Series 属性
|
属性
|
描述
|
Series.values
|
返回 Series 的数据部分(numpy 数组)。
|
Series.index
|
返回 Series 的索引。
|
Series.dtype
|
返回 Series 的数据类型。
|
Series.shape
|
返回 Series 的形状(元组形式)。
|
Series.size
|
返回 Series 中元素的数量。
|
Series.name
|
返回或设置 Series 的名称。
|
Series.empty
|
检查 Series 是否为空。
|
Series.nbytes
|
返回 Series 占用的字节数。
|
Series.ndim
|
返回 Series 的维度数(始终为 1)。
|
Series.hasnans
|
检查 Series 是否包含缺失值(NaN)。
|
Series.array
|
返回 Series 的底层数据(Pandas 数组)。
|
Series 方法
数据查看
|
方法
|
描述
|
Series.head(n=5)
|
返回前 n 行数据。
|
Series.tail(n=5)
|
返回后 n 行数据。
|
Series.describe()
|
返回 Series 的统计摘要(如计数、均值、标准差等)。
|
缺失值处理
|
方法
|
描述
|
Series.isnull()
|
检查每个元素是否为缺失值(NaN)。
|
Series.notnull()
|
检查每个元素是否不为缺失值。
|
Series.dropna()
|
删除所有缺失值。
|
Series.fillna(value)
|
用指定值填充缺失值。
|
唯一值处理
|
方法
|
描述
|
Series.unique()
|
返回 Series 中的唯一值。
|
Series.nunique()
|
返回 Series 中唯一值的数量。
|
Series.value_counts()
|
返回 Series 中每个值的频率。
|
排序
|
方法
|
描述
|
Series.sort_values(ascending=True)
|
按值排序。
|
Series.sort_index(ascending=True)
|
按索引排序。
|
索引操作
|
方法
|
描述
|
Series.reset_index(drop=False)
|
重置索引。
|
Series.drop(labels)
|
删除指定索引的元素。
|
Series.get(key, default=None)
|
获取指定索引的值,如果不存在则返回默认值。
|
Series.set_axis(labels)
|
设置新的索引。
|
数据转换
|
方法
|
描述
|
Series.map(arg)
|
根据传入的函数或字典映射 Series 中的值。
|
Series.apply(func)
|
对 Series 中的每个元素应用函数。
|
Series.astype(dtype)
|
将 Series 转换为指定数据类型。
|
Series.to_dict()
|
将 Series 转换为字典。
|
Series.to_frame()
|
将 Series 转换为 DataFrame。
|
Series.to_numpy()
|
将 Series 转换为 numpy 数组。
|
数据操作
|
方法
|
描述
|
Series.copy()
|
复制 Series。
|
Series.append(to_append, ignore_index)
|
追加另一个 Series。
|
Series.replace(to_replace, value)
|
替换 Series 中的值。
|
Series.update(other)
|
用另一个 Series 的值更新当前 Series。
|
Series.clip(lower, upper)
|
将 Series 中的值限制在指定范围内。
|
Series.isin(values)
|
检查 Series 中的值是否在指定列表中。
|
Series.between(left, right)
|
检查 Series 中的值是否在指定范围内。
|
统计计算
|
方法
|
描述
|
Series.sum()
|
返回 Series 中所有值的和。
|
Series.mean()
|
返回 Series 中所有值的平均值。
|
Series.median()
|
返回 Series 中所有值的中位数。
|
Series.min()
|
返回 Series 中的最小值。
|
Series.max()
|
返回 Series 中的最大值。
|
Series.std()
|
返回 Series 中所有值的标准差。
|
Series.var()
|
返回 Series 中所有值的方差。
|
Series.count()
|
返回 Series 中非缺失值的数量。
|
Series.mode()
|
返回 Series 中的众数。
|
Series.quantile(q)
|
返回 Series 中指定分位数的值。
|
时间序列操作
|
方法
|
描述
|
Series.dt
|
访问日期时间属性(仅适用于 datetime 类型的 Series)。
|
Series.dt.year
|
返回年份。
|
Series.dt.month
|
返回月份。
|
Series.dt.day
|
返回日期。
|
字符串操作
|
方法
|
描述
|
Series.str
|
访问字符串方法(仅适用于字符串类型的 Series)。
|
Series.str.lower()
|
将字符串转换为小写。
|
Series.str.upper()
|
将字符串转换为大写。
|
Series.str.contains(pattern)
|
检查字符串是否包含指定模式。
|
实例
importpandasaspd# 创建 Seriess=pd.Series([10,20,30,40],index=['a','b','c','d'],name='MySeries')# 查看数据print(s.head(2))# 输出前 2 行# 缺失值处理s_with_nan=pd.Series([10,None,30])print(s_with_nan.fillna(0))# 用 0 填充缺失值# 唯一值处理print(s.nunique())# 输出唯一值的数量# 排序print(s.sort_values(ascending=False))# 按值降序排序# 统计计算print(s.mean())# 输出平均值
如果需要更详细的信息,可以参考
Pandas 官方文档
。