Helmholtz方程数值求解:嵌入式Trefftz DG方法解析
2026/6/19 18:24:57
Pandas 是 Python 中用于数据分析和处理最流行的开源库之一,建立在 NumPy 之上,提供了高性能、易用的数据结构和数据分析工具。它特别适合处理结构化数据(如表格型或异质型数据)。以下是 Pandas 的基础概念详细介绍:
Pandas 主要有两个核心数据结构:
importpandasaspd s=pd.Series([1,3,5,7],index=['a','b','c','d'])print(s)输出:
a 1 b 3 c 5 d 7 dtype: int64特点:
df=pd.DataFrame({'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'City':['New York','Paris','Tokyo']})print(df)输出:
Name Age City 0 Alice 25 New York 1 Bob 30 Paris 2 Charlie 35 Tokyo特点:
df['Name'])# 从 CSV 读取df=pd.read_csv('data.csv')# 从字典创建data={'col1':[1,2],'col2':[3,4]}df=pd.DataFrame(data)df.head()# 查看前5行df.tail(3)# 查看后3行df.info()# 显示数据概要(类型、非空值等)df.describe()# 统计摘要(均值、标准差、四分位数等)df.shape# 返回 (行数, 列数)df['Name']# 返回 Seriesdf[['Name','Age']]# 返回 DataFramedf.loc[0]# 按标签索引(第0行)df.iloc[0]# 按位置索引(第0行)df.loc[0:1,'Name':'City']# 标签切片df[df['Age']>25]df[(df['Age']>25)&(df['City']=='Tokyo')]注意:使用
&、|而不是and、or,且条件需加括号。
df.isnull()# 检查缺失值(返回布尔 DataFrame)df.dropna()# 删除含缺失值的行df.fillna(0)# 用0填充缺失值df.fillna(method='ffill')# 前向填充df.duplicated()# 检查重复行df.drop_duplicates()# 删除重复行df['Age']=df['Age'].astype('float')pd.to_datetime(df['date_column'])# 转换为日期时间df.groupby('City')['Age'].mean()GROUP BYsum(),mean(),count(),agg()等pd.concat():沿轴拼接多个 DataFramepd.merge():类似 SQL 的 JOIN 操作pd.merge(df1,df2,on='key')pd.pivot_table(df,values='Age',index='City',aggfunc='mean')Pandas 对时间序列有强大支持:
ts=pd.date_range('2025-01-01',periods=10,freq='D')df=pd.DataFrame({'value':range(10)},index=ts)df.resample('W').sum()# 按周重采样df[df.A > 2]['B'] = new_val可能引发警告,应使用.loc。dtype参数指定列类型,或使用chunksize分块读取。| 概念 | 说明 |
|---|---|
| Series | 一维带标签数组 |
| DataFrame | 二维表格结构,核心分析对象 |
| Index | 行/列标签,支持快速查找和对齐 |
| Vectorized Operations | 高效的批量计算 |
| Data I/O | 支持 CSV、Excel、JSON、SQL 等多种格式 |
掌握这些基础概念后,你就可以高效地进行数据加载、清洗、探索和分析了。
如需进一步学习,可参考官方文档:https://pandas.pydata.org/docs/