Pandas技术手册数据分析基础操作指南

Pandas 的技术手册，算是数据入门挺不错的一份资源。不用太厚重的，也不玩术语堆砌，直接从你最常用的几个功能入手——建表、选数据、清洗、聚合、可视化，基本都涵盖了。就像老司机带着你上手开车，流程清晰、操作直白。

Series 和 DataFrame是 Pandas 的基础，一个是一维数组，另一个是二维表格。你可以理解为前者像列表带标签，后者就像 Excel 表，列类型还能混搭，蛮灵活的。

选数据有点多样，.loc适合用标签，.iloc就是按位置来选，配上布尔条件还能做过滤，像df['Age'] > 25这种挺常用。

清洗数据这块也不麻烦，比如缺失值用dropna()、fillna()，重复值用drop_duplicates()，数据类型换一换用astype()。这些操作一行代码搞定，效率还高。

数据合并也好用，像merge()、concat()这些你多用几次就顺手了，配合groupby()做个分组聚合，比如求平均值、统计数量，还能链式操作。

可视化方面，Pandas 直接调plot()用 Matplotlib 底层的绘图功能，响应也快；要画更复杂点的图就接入 Seaborn，比如分布图、热力图都挺方便的。

贴一段实用代码：

import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'City': ['New York', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
print(df)
print(df.loc[0])
print(df.iloc[1])
print(df[df['Age'] > 25])
df['Salary'] = [50000, None, 60000]
df.dropna(inplace=True)
df['Age'] = df['Age'].astype(str)
print(df.groupby('City').mean(numeric_only=True))

如果你刚开始用 Pandas，又不想被文档淹没，这份手册就挺合适的。一步步带你从数据读入到清洗再到，节奏刚刚好。