数据探索:使用Pandas库读取了名为air.csv的原始数据,并进行了基本的探索,包括计算缺失值个数、最大值和最小值,并输出到air_data.csv文件。 客户基本信息分布分析:提取了会员入会年份、性别、会员等级和年龄等信息,并使用Matplotlib库绘制了直方图、饼图和箱型图来展示这些信息的分布情况。 乘机信息分布情况分析:分析了客户的最后乘机时间至结束时长、飞行次数和总飞行公里数,并同样使用了箱型图来展示这些信息的分布。 积分信息分布情况分析:提取了会员的积分兑换次数和总累计积分,并绘制了直方图和箱型图来展示这些积分信息的分布。 相关系数矩阵与热力图:计算了关...
导入必要的库:代码开始处导入了requests用于发送HTTP请求,pandas用于数据处理,以及json用于解析JSON格式的数据。 定义API URL:url_city变量存储了用于获取行政区划数据的API地址。 发送HTTP GET请求:使用requests.get方法向url_city发送请求,并存储响应。 解析响应内容:使用json.loads方法将响应内容(JSON格式)解析为Python字典。 转换为DataFrame:将解析后的字典中的data键对应的值转换为Pandas的DataFrame。 提取城市名称和编码:通过两层循环遍历data_city...
导入必要的库:代码开始处导入了requests用于发送HTTP请求,pandas用于数据处理,以及json用于解析JSON格式的数据。 定义API URL:url_city变量存储了用于获取行政区划数据的API地址。 发送HTTP GET请求:使用requests.get方法向url_city发送请求,并存储响应。 解析响应内容:使用json.loads方法将响应内容(JSON格式)解析为Python字典。 转换为DataFrame:将解析后的字典中的data键对应的值转换为Pandas的DataFrame。 提取城市名称和编码:通过两层循环遍历data_city...