数据熊猫社区「DP论坛」

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 180|回复: 0

Python 数据分析常用数据结构——DataFrame介绍

[复制链接]
发表于 2016-11-22 11:51:05 | 显示全部楼层 |阅读模式
    曾经使用R语言进行过数据处理的朋友都知道,DataFrame(数据框)是最常用的数据结构。和R不同,Python中DataFrame并不是原生的数据结构,而是由第三方库pandas提供的。下面将简略陈述DataFrame操作。
1.png
2.png
3.png
4.png
5.png
6.png
7.png
    不知各位看官对pandas包中的loc函数,iloc函数和ix函数三个切片函数的区别是否了解。其实很简单,loc函数切片时的依据是索引名称,而iloc函数切片则引用了索引序号,ix函数则是两种皆可,只是在取行时略有区别。ix函数看似比另外两个函数方便,但ix函数性能相对较低,在做大规模计算时建议使用loc函数和iloc函数。且后续的多重索引就是以loc函数为基础的。
8.png
9.png
10.png
11.png
12.png
上文中数据集iris下载地址以及代码如下:
    谢谢各位看官能够从头看到尾。本文主要陈述了Python中最基础的DataFrame操作,后续将陆续为您呈现分组聚合,多重索引,以及多表组合等相关内容,敬请期待
*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|商业数据分析论坛  

GMT+8, 2017-1-25 01:22 , Processed in 0.420363 second(s), 32 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表