相关文章
干货|利用Python自动根据数据生成降雨量统计分析报告
2024-11-10 17:00

作者:小小明

干货|利用Python自动根据数据生成降雨量统计分析报告

简介:Pandas数据处理专家,10余年编码经验,至今已帮助过成千上万名数据从业者解决工作实际遇到的问题,其中数据处理和办公自动化问题涉及的行业包括会计、HR、气象、金融等等,现为菜J学Python核心技术团队成员之一。

新妆宜面下朱楼,深锁春光一院愁。大家好,我是J哥。最近遇到一个有点烧脑的需求,其实也不算烧脑,主要是判断条件过多,对于我这种记忆力差,内存小的人来说容易出现内存溢出导致大脑宕机。也可能是因为我还没有找到能减小大脑内存压力的写法。若读者有更好的解决方案,欢迎在本文文末进行留言噢!后台回复「降雨」二字,可领取本文所用数据集和Word模板,便于大家用Python测试。先看看需求吧:

主要就是要根据左侧的表格自动生成右侧的Word统计报告,实际的各种可能性情况远比图中展示的要更加复杂。好了,直接开始干代码吧!1数据读取import pandas as pddf = pd.read_csv("11月份数据.csv", encoding='gbk')# 当前统计月份month = 11df = df.query('月份==@month')df.head(10)预览数据:

2异常数据过滤查看缺失值数量:pd.isnull(df).sum()结果:区域          0月份          0降雨量(mm)     0降雨距平(mm)    1观测站         0dtype: int64仅一个缺失值数据,可直接删除:df.dropna(inplace=True)3计算观测站降雨量相对往年的变化计算降雨量比往年高,跟往年比无变化,以及比往年低的次数分别是多少:rainfall_high = df.eval('`降雨距平(mm)` > 0').value_counts().get(True, 0)rainfall_equal = df.eval('`降雨距平(mm)` == 0').value_counts().get(True, 0)rainfall_low = df.eval('`降雨距平(mm)` < 0').value_counts().get(True, 0)
print(rainfall_high, rainfall_equal, rainfall_low)
13 1 18
上面的结果中rainfall_high表示降雨量比往年平均水平高的次数,rainfall_equal表示降雨量比往年平均水平持平的次数,rainfall_low表示降雨量比往年平均水平低的次数。于是分情况讨论生成第一段的报告:p1 = f"{month}月份"
if rainfall_low == 0 or rainfall_high == 0:
   if rainfall_equal != 0:
       p1 += f"除{rainfall_equal}个观测站降雨量较往年无变化外,"
   if rainfall_high == 0:
       p1 += f"各气象观测站降雨量较往年均偏低。"
   elif rainfall_low == 0:
       p1 += f"各气象观测站降雨量较往年均偏高。"
else:
   #  10%以内差异认为是持平
   if rainfall_high > rainfall_low*1.1:        p1 += f"大部分气象观测站降雨量较往年偏高。"    elif rainfall_low > rainfall_high*1.1:        p1 += f"大部分气象观测站降雨量较往年偏低。"    else:        p1 += f"各气象观测站降雨量较往年整体持平。"p1结果:'11月份大部分气象观测站降雨量较往年偏低。'4计算各区域降雨量的极值再生成第二段的报告:p2 = ""t = df['降雨量(mm)']p2 += f"各区域降雨量在{t.min()}~{t.max()}mm之间,其中{df.loc[t.argmax(), '区域']}区域的降雨量最大,为{t.max()}mm。"p2结果:'各区域降雨量在0.0~16.0mm之间,其中51a45区域的降雨量最大,为16.0mm。'5分观测站统计让我脑袋疼的地方就是从这里的代码开始的,后面还有更复杂的需求就不公布了。对每个观测站分别统计哪些区域偏高,哪些区域持平,哪些区域偏低:p3s = []for station, tmp in df.groupby('观测站'):    t = tmp['降雨量(mm)']    p3 = f"各区域降雨量在{t.min()}~{t.max()}mm之间,"    rainfall_high_mask = tmp.eval('`降雨距平(mm)` > 0')    rainfall_equal_mask = tmp.eval('`降雨距平(mm)` == 0')    rainfall_low_mask = tmp.eval('`降雨距平(mm)` < 0')
   rainfall_high = rainfall_high_mask.value_counts().get(True, 0)
   rainfall_equal = rainfall_equal_mask.value_counts().get(True, 0)
   rainfall_low = rainfall_low_mask.value_counts().get(True, 0)
#     print(rainfall_high, rainfall_equal, rainfall_low)
   if rainfall_low == 0 or rainfall_high == 0:
       if rainfall_equal != 0:
           p3 += '除'
           p3 += '、'.join(tmp.loc[rainfall_equal_mask, '区域']+'区域')
           p3 += "降雨量较往年无变化外,"
       if rainfall_high == 0:
           p3 += f"各区域降雨量均较往年偏低"
       elif rainfall_low == 0:
           p3 += f"各区域降雨量均较往年偏高"
       t = tmp['降雨距平(mm)'].abs()
       p3 += f"{t.min()}~{t.max()}mm;"
   else:
       if rainfall_equal != 0:
           p3 += '除'
           p3 += '、'.join(tmp.loc[rainfall_equal_mask, '区域']+'区域')
           p3 += "降雨量较往年无变化,"
       #  10%以内差异认为是持平
       if rainfall_high > rainfall_low*1.1:            if rainfall_equal == 0:                p3 += '除'            p3 += '、'.join(tmp.loc[rainfall_low_mask, '区域']+'区域')            p3 += "降雨量较往年偏低"            t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()            if t.shape[0] > 1:                p3 += f"{t.min()}~{t.max()}mm"            else:                p3 += f"{t.min()}mm"            p3 += "外,"            t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()            p3 += f"其余各区域降雨量较往年偏高{t.min()}~{t.max()}mm;"        elif rainfall_low > rainfall_high*1.1:            if rainfall_equal == 0:                p3 += '除'            p3 += '、'.join(tmp.loc[rainfall_high_mask, '区域']+'区域')            p3 += "降雨量较往年偏高"            t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()            if t.shape[0] > 1:                p3 += f"{t.min()}~{t.max()}mm"            else:                p3 += f"{t.min()}mm"            p3 += "外,"            t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()            p3 += f"其余各区域降雨量较往年偏低{t.min()}~{t.max()}mm;"        else:            if rainfall_equal != 0:                p3 = p3[:-1]+'外,'            p3 += f"各区域降雨量较往年偏高和偏低的数量持平,其中"            p3 += '、'.join(tmp.loc[rainfall_low_mask, '区域']+'区域')            p3 += "降雨量较往年偏低"            t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs()            if t.shape[0] > 1:                p3 += f"{t.min()}~{t.max()}mm,"            else:                p3 += f"{t.min()}mm,"            p3 += '、'.join(tmp.loc[rainfall_high_mask, '区域']+'区域')            p3 += "降雨量较往年偏高"            t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs()            if t.shape[0] > 1:                p3 += f"{t.min()}~{t.max()}mm;"            else:                p3 += f"{t.min()}mm;"    p3s.append([station, p3])p3s[-1][-1] = p3s[-1][-1][:-1]+"。"p3s可能是我还没有想出较好的封装方式导致代码变得这么复杂,如果有巧妙解决这个问题的朋友,希望能够加菜J学Python交流群一起探讨。6将组织好的文本写入到word中Word模板文件docxtemplate.docx的内容:一、{{ month }}月各气象观测站降雨量实况(一)降水{{ p1 }}{{ p2 }}{%p for station,p3 in p3s %}{{ station }}:{{ p3 }}{%p endfor %}即:

Python渲染代码:from docxtpl import DocxTemplatetpl = DocxTemplate("docxtemplate.docx")context = {    'month': month,    'p1': p1,    'p2': p2,    'p3s': p3s,}tpl.render(context)tpl.save("11月降雨量报告.docx")执行完毕,得到Word统计分析报告:

    以上就是本篇文章【干货|利用Python自动根据数据生成降雨量统计分析报告】的全部内容了,欢迎阅览 ! 文章地址:http://gzhdwind.xhstdz.com/news/1227.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://gzhdwind.xhstdz.com/mobile/ , 查看更多   
最新文章
2023年三亚旅游攻略:费用、景点与实用建议全解析
引言 三亚,这片海南岛上的热带天堂,以其碧海蓝天和迷人沙滩而闻名,吸引着无数游客前来度假游玩。随着旅游业的不断发展,三亚已经成为中国最受欢迎的旅游城市之一。本文将为您全面解析2023年三亚旅游的费用、景点及实用建议,帮助您规划
社区团购新手指南:轻松入门的实用技巧与步骤
引言:什么是社区团购 在近年来的消费趋势中,社区团购作为一种新兴的购物方式,以其独特的魅力迅速渗透到广大消费者的生活中。社区团购,以城市社区为单位,借助社交媒体和微信群等平台,将居民的购物需求集中起来,从而实现集中采购,以
海底捞官网加盟合作全面解析:开启你的餐饮创业之旅
海底捞官网加盟合作全面解析 想要开启餐饮创业之旅?那么不妨考虑加盟海底捞,这个备受消费者喜爱的火锅品牌。海底捞始终秉承着“用心服务,用美食传递幸福”的经营理念,致力于为顾客提供优质的餐饮体验。 海底捞的优势 作为一个备受欢迎
2024年海底捞打折活动规则详解
引言:海底捞的魅力与创新 海底捞作为国内火锅行业的佼佼者,自成立以来便凭借其独特的服务和优质的食材赢得了无数消费者的青睐。如今,随着市场竞争的加剧,海底捞不仅继续提升产品质量,还不断推出各种打折活动,以吸引更多的顾客。2024
AI视频赚钱真的安全吗?
AI视频赚钱的热潮 随着人工智能技术的不断发展,AI视频赚钱这一概念逐渐走入人们的视野。许多人开始探索利用AI技术来创造收入的可能性。但是,随之而来的疑问是,AI视频赚钱真的安全吗?在这篇文章中,我们将深入探讨这一问题。 AI视频赚钱
社区团购的工作内容解析:如何推动社区消费新模式
引言:社区团购的兴起 近年来,伴随着互联网和移动支付的普及,社区团购这一新兴商业模式迅速崛起。作为一种依托社区基础,结合社交网络的购物方式,社区团购逐渐成为越来越多居民的消费选择。面对不断升级的消费需求,社区团购不仅提升了
旅游景区质量等级划分的依据与标准解析
一、旅游景区质量等级划分的依据 旅游景区质量等级的划分,主要依据景区的自然环境、人文景观、服务设施和管理水平等方面进行评定。在自然环境方面,评定景区的地质构造、地貌特征、气候条件和生态环境等情况;在人文景观方面,评定景区的
优化社区团购运营流程的关键步骤与实战技巧解析
优化社区团购运营流程的关键步骤与实战技巧解析 社区团购作为一种新兴的电商模式,受到了越来越多消费者的青睐。为了更好地运营社区团购业务,提升效益,优化运营流程成为关键。下面将分享一些优化社区团购运营流程的关键步骤与实战技巧。
晚上减肥外卖选择指南:轻盈健康美食推荐!
晚上减肥外卖选择指南:轻盈健康美食推荐! 在现代快节奏的生活中,晚上常常是忙碌工作或繁忙家务之后唯一能够放松的时刻。但很多人由于晚上不懂得如何科学选择食物,导致了肥胖问题愈发严重。今天,我们将为您推荐晚上减肥外卖的轻盈健康
颠覆传统:如何利用AI技术实现视频转换的全新体验
颠覆传统:如何利用AI技术实现视频转换的全新体验 在当今数字化时代,视频已经成为人们生活中不可或缺的一部分。随着人们对视频内容需求的不断增长,提高视频质量显得尤为重要。传统视频转换方式已经无法满足人们对视觉体验的追求。然而,
相关文章