Python数据分析 Anaconda发行版 Jupyter notebook 安装和文档启动运行机制主界面新建文档工作界面文档结构编辑和命令模式快捷键执行和输出 Markdown单元图片和视频幻灯片导出格式魔法命令 Numpy 基础知识数据类型创建数组数组运算通用函数索引切片迭代添加删除去重形状变换堆积数组分割数组视图和复制广播机制花式索引布尔索引统计方法随机数 Pandas Series DataFrame Index 重建索引轴向上删除条目索引和切片算术和广播函数和映射排序和排名统计和汇总文件读取分块读取写出数据 JSON和Pickle HDF5 EXCEL文件 Web交互数据库交互删除缺失值补全缺失值删除重复值替换重命名轴索引离散化和分箱检测和过滤随机和抽样字符串操作分层索引分层索引进阶合并连接粘合与堆叠重塑 Matplotlib 配置环境使用常识保存图形两种图画接口使用中文线型图颜色线型和标记坐标轴上下限坐标轴刻度图题、轴标签和图例配置图题配置图例颜色条文本、箭头和注释散点图直方图条形图饼图误差线等高线多子图 patch 自定义坐标轴刻度风格样式展示下一步

函数和映射

阅读: 5229 评论：2

一些Numpy的通用函数对Pandas对象也有效：

In [91]: df = pd.DataFrame(np.random.randn(4,3), columns=list('bde'),index = ['one','two','three','four'])

In [92]: df
Out[92]:
              b         d         e
one   -0.522310  0.636599  0.992393
two    0.572624 -0.451550 -1.935332
three  0.021926  0.056706 -0.267661
four  -2.718122 -0.740140 -1.565448

In [93]: np.abs(df)
Out[93]:
              b         d         e
one    0.522310  0.636599  0.992393
two    0.572624  0.451550  1.935332
three  0.021926  0.056706  0.267661
four   2.718122  0.740140  1.565448

当然，你也可以自定义处理函数，然后使用pandas提供的apply方法，将它应用在每一列：

In [94]: f = lambda x: x.max() - x.min()

In [95]: df.apply(f)
Out[95]:
b    3.290745
d    1.376740
e    2.927725
dtype: float64

当然，可以指定按行应用f，只需要设置axis='columns'。也可以将引用函数的返回值设计为一个Series，这样最终结果会是个DataFrame：

In [96]: df.apply(f, axis='columns')
Out[96]:
one      1.514703
two      2.507956
three    0.324367
four     1.977981
dtype: float64

In [97]: def f2(x):
    ...:     return pd.Series([x.min(),x.max()], index=['min','max'])

In [98]: df.apply(f2)
Out[98]:
            b         d         e
min -2.718122 -0.740140 -1.935332
max  0.572624  0.636599  0.992393

还有更细粒度的apply方法，也就是DataFrame的applymap以及Series的map。它们逐一对每个元素进行操作，而不是整行整列的操作。请体会下面的例子：

In [99]: f3 = lambda x: '%.2f' % x

In [100]: df.applymap(f3)
Out[100]:
           b      d      e
one    -0.52   0.64   0.99
two     0.57  -0.45  -1.94
three   0.02   0.06  -0.27
four   -2.72  -0.74  -1.57

In [101]: df['d'].map(f3) # 获取d列，这是一个Series
Out[101]:
one       0.64
two      -0.45
three     0.06
four     -0.74
Name: d, dtype: object

算术和广播排序和排名

评论总数： 2

点击登录后方可评论

总结：apply()是整行整列的操作，applymap()是逐一对每个元素进行操作。

By 用户1382844313 On 2019年3月10日 22:51 回复

补充:apply()对于Series数据来说是逐一对元素进行操作，与map()功能一样。

用户5888865032 回复用户1382844313 2019年8月18日 20:09 回复