筛选餐饮用户
要对餐饮用户的用气指标进行研究,首先要筛选出餐饮用户,在用户管理系统中并没有单独的餐饮用户分类,其包含在公服营业用户的分类之中。所以需要将餐饮用户从公服营业用户中筛选出来,所用的方法是按照笔者在另一文章"EXCEL在一个字符串中查找多个字符的用法"记载的方法。按照这个方法共从2875个用气数据中筛选出了1240个餐饮用户。
聚类分析
常用的聚类分析方法有:快速聚类、系统聚类和二阶聚类
聚类方法 | 变量类型 | 类别个数 | 建议个案数 | 优势 | 劣势 |
---|---|---|---|---|---|
快速聚类 | 连续变量 | 指定类别数 | $\ge$1000 | 简单、快速;可自定义聚类中心 | 仅限连续变量;聚类结果会受到样本排序影响 |
系统聚类 | 分类变量;连续变量 | 指定类别数范围 | $\le$1000 | 支持个案或变量聚类;可使用不同聚类算法 | 不能同时处理两种类型变量 |
二阶变量 | 分类变量;连续变量 | 自动确定 | $\ge$1000 | 可自动选择最佳聚类数;综合考虑分类和连续变量的重要性 | 分类变量较少时,聚类结果容易受到其分布的影响 |
利用SPSS软件对筛选出的这1240个用户进行系统聚类,指定3~4个分类,发现分成4类较为合理。
系统聚类:系统聚类是将每个样品分成若干类的方法,其基本思想是:先将各个样品各看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品合为一类为止。ssss
聚类结果分析
假设上面的聚类结果是合理的,那么它就应该符合行业标准JGJ64-2017《饮食建筑设计标准》中对饮食行业的分类标准:
建筑规模 | 特大型 | 大型 | 中型 | 小型 |
---|---|---|---|---|
面积($ m^2 $) | $>$3000 | 500~3000 | 150~500 | $ \leq $150 |
座位数(个) | $>$1000 | 250~1000 | 75~250 | $ \leq $75 |
那么根据系统聚类的结果和这些不同类型的座位数和营业面积可以大致计算出不同类型的餐饮用户合理的用气指标:
- 聚类一类对应标准规定的小型用户,其合理用气指标为$0.63m^3/座 \cdot d $ 或 $ 0.32m^3 / 平方米 \cdot d $
- 聚类二类对应标准规定的中型用户,其合理用气指标为$0.85m^3/座 \cdot d $ 或 $ 0.42m^3 / 平方米 \cdot d $
指标验证
集团用气规律手册验证
根据集团公布的《北京市天然气负荷指标、用气规律使用手册(2015)》,餐饮用户的用气指标为座,与根据聚类结果计算出来的用气指标较为吻合,所以聚类结果较为合理。
偷盗气用户验证
以2017查获的一家偷盗气餐饮用户验证
2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | |
---|---|---|---|---|---|---|---|---|---|---|---|
某烤鸭店 | 1726 | 2257 | 2263 | 3332 | 3795 | 2987 | 3337 | 1540 | 5598 | 0 | 8526 |
该用户查获以前月用气量较低,通过百度地图查看其全景,估算其营业面积至少有300立方米,那么计算其查获以前得用气指标为$ 0.29m^3 / 立方米 \cdot d $立方米,远低于前面计算得中型用户得用气指标,从而验证该指标可用于判断异常用气的餐饮用户。