基于Python的大数据分析基础及实战作者: 余本国 出版时间:2018年版内容简介 《基于Python的大数据分析基础及实战》是一本介绍如何用Python 3.6进行数据处理和分析的学习指南。其主要内容包括:Python语言基础、数据处理、数据分析、数据可视化,以及利用Python对数据库的操作、自建Python应用库的共享发布等。 《基于Python的大数据分析基础及实战》分3个部分:第1部分为基础知识,第2部分为实战案例,第3部分为拓展与延伸。本书内容丰富,讲解通俗易懂,非常适合本科生、研究生,以及对Python语言感兴趣或者想要使用Python语言进行数据分析的广大读者。目录第1部分 基 础 篇第1章Python语言基础 /21.0 引子 /21.1 工欲善其事,必先利其器(安装Python) /31.2 学跑得先学走(语法基础) /91.3 程序结构 /111.3.1 Hello World ! /111.3.2 运算符介绍 /121.3.3 顺序结构 /141.3.4 判断结构 /171.3.5 循环结构 /181.3.6 异常 /201.4 函数 /241.4.1 基本函数结构 /241.4.2 参数结构 /251.4.3 回调函数 /281.4.4 函数的递归与嵌套 /281.4.5 闭包 /311.4.6 匿名函数lambda /321.4.7 关键字yield /321.5 数据结构 /351.5.1 列表(list) /351.5.2 元组(tuple) /381.5.3 集合(set) /391.5.4 字典(dict) /401.5.5 集合的操作 /411.5.6 学以致用 /451.6 3个函数(map、filter、reduce) /471.6.1 遍历函数(map) /471.6.2 筛选函数(filter) /481.6.3 累计函数(reduce) /481.7 面向对象编程基础 /501.7.1 类 /501.7.2 类和实例 /511.7.3 数据封装 /521.7.4 私有变量与私有方法 /53本章小结 /54第2章数据处理 /602.1 Anaconda简介 /602.2 Numpy简介 /662.3 关于Pandas /682.3.1 什么是Pandas /682.3.2 Pandas中的数据结构 /682.4 数据准备 /682.4.1 数据类型 /682.4.2 数据结构 /692.4.3 数据导入 /792.4.4 数据导出 /862.5 数据处理 /882.5.1 数据清洗 /892.5.2 数据抽取 /972.5.3 插入记录 /1142.5.4 修改记录 /1172.5.5 交换行或列 /1202.5.6 排名索引 /1222.5.7 数据合并 /1312.5.8 数据计算 /1372.5.9 数据分组 /1412.5.10 日期处理 /143带你飞(数据处理案例) /148本章小结 /160第3章数据分析 /1653.1 基本统计分析 /1653.2 分组分析 /1693.3 分布分析 /1713.4 交叉分析 /1733.5 结构分析 /1743.6 相关分析 /176小试牛刀(相关分析案例:电商数据分析) /178本章小结 /180第4章数据可视化 /1814.1 使用Python对数据进行可视化处理 /1814.1.1 准备工作 /1814.1.2 Matplotlib绘图示例 /1864.1.3 Seabon中的图例 /1984.1.4 pandas的一些可视化功能 /2124.1.5 文本数据可视化 /2174.1.6 networkx网络图 /2184.1.7 folium绘制地图 /2204.2 Python图像处理基础 /2214.2.1 PIL图库 /2214.2.2 OpenCV图库 /224本章小结 /226第5章字符串处理与网络爬虫 /2285.1 字符串处理 /2285.1.1 字符串处理函数 /2285.1.2 正则表达式 /2305.1.3 编码处理 /2375.2 网络爬虫 /2405.2.1 获取网页源码 /2405.2.2 从源码中提取信息 /2415.2.3 数据存储 /2465.2.4 网络爬虫从这里开始 /248本章小结 /260第2部分 实战案例篇第6章词云 /2626.1 安装文件包 /2636.2 jieba功能用法 /2646.2.1 cut用法 /2646.2.2 词频与分词字典 /2656.3 文本词云图 /2696.4 背景轮廓词云图的制作 /2716.4.1 数据准备 /2716.4.2 分词 /2726.4.3 构建词云 /273本章小结 /278第7章航空客户分类 /2797.1 问题的提出 /2797.2 聚类分析相关概念 /2807.3 模型的建立 /2817.4 Python实现代码 /2817.5 分类结果展示与分析 /284本章小结 /287第8章《红楼梦》文本分析 /2888.1 准备工作 /2898.2 分词 /2918.2.1 读取数据 /2918.2.2 数据预处理 /2938.2.3 对红楼梦进行分词 /3018.2.4 制作词云 /3038.3 文本聚类分析 /3128.3.1 构建分词TF-IDF矩阵 /3128.3.2 使用TF-IDF矩阵对章节进行聚类 /3148.4 LDA主题模型 /3228.5 人物社交网络分析 /328本章小结 /334第3部分 拓展与延伸第9章Python字符串格式化 /3369.1 使用%符号进行格式化 /3369.2 使用format()方法进行格式化 /3399.3 使用f方法进行格式化 /341本章小结 /342第10章在Python中操作MySQL数据库 /34310.1 对MySQL的连接与访问 /34410.2 对MySQL的增、删、改、查操作 /34510.2.1 查询操作 /34510.2.2 插入操作 /34610.2.3 更新操作 /34710.2.4 删除操作 /34710.3 创建数据库表 /348本章小结 /349第11章fractal(分形)库的发布 /35011.1 用Python绘制分形 /35111.1.1 分形简介 /35111.1.2 先睹为快 /35111.1.3 绘制方法简介 /35211.2 第三方库发布到PyPi /364本章小结 /369参考文献 /370 上一篇: Unity VR虚拟现实完全自学教程 邵伟 2019年版 下一篇: 小白轻松学Power BI数据分析 宋翔 2019年版