数据分析案例

概述

在当今数据驱动的商业环境中,数据分析已成为企业决策的重要依据。本文将介绍一个完整的数据分析案例,通过Python面向对象编程方法,读取销售数据并进行可视化分析,最终生成每日销售额柱状图。

项目架构设计

1. 数据定义模块 (data_define.py)

首先定义了一个Record类,用于封装销售数据记录:

class Record:
    def __init__(self, date, order_id, money, province):
        self.date = date          # 订单日期
        self.order_id = order_id  # 订单ID
        self.money = money        # 订单金额
        self.province = province  # 销售省份
    
    def __str__(self):
        return f"{self.date},{self.order_id} {self.money} {self.province}"

这个类采用了面向对象的思想,将数据及其相关操作封装在一起,提高了代码的可维护性和重用性。

2. 文件读取模块 (file_define.py)

该模块采用了抽象类的设计模式,定义了一个通用的文件读取接口:

class FileReader:
    def read_data(self) -> list[Record]:
        """抽象方法:读取文件并返回Record对象列表"""
        pass

在此基础上,实现了两个具体的文件读取器:

  • TextFileReader: 读取CSV格式的文本文件
  • JsonFileReader: 读取JSON格式的文本文件

这种设计遵循了开闭原则(对扩展开放,对修改封闭),如果需要支持新的文件格式,只需继承FileReader类并实现read_data方法即可。

3. 主业务逻辑模块 (main.py)

主程序整合了所有功能模块,实现了完整的数据分析流程:

# 1. 读取不同格式的数据文件
text_file_reader = TextFileReader("2011年1月销售数据.txt")
json_file_reader = JsonFileReader("2011年2月销售数据JSON.txt")

# 2. 合并两个月份的数据
all_data: list[Record] = jan_data + feb_data

# 3. 按日期计算每日销售额
data_dict = dict()
for record in all_data:
    if record.date in data_dict:
        data_dict[record.date] += record.money
    else:
        data_dict[record.date] = record.money

# 4. 使用PyEcharts进行数据可视化
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))
bar.add_xaxis(list(data_dict.keys()))
bar.add_yaxis("销售额", list(data_dict.values()))
bar.set_global_opts(title_opts=TitleOpts(title="每日销售额"))
bar.render("每日销售额柱状图.html")

核心技术点

1. 面向对象编程的优势

  • 封装性: 将数据和操作封装在类中,提高代码的可读性和可维护性
  • 继承与多态: 通过抽象类和具体实现类,实现代码的灵活扩展
  • 类型提示: 使用类型注解提高代码的清晰度和IDE的智能提示

2. 数据处理流程

  1. 数据读取: 支持多种文件格式,适应不同的数据源
  2. 数据合并: 将不同时间段的数据整合为统一的数据集
  3. 数据聚合: 按日期分组计算每日销售总额
  4. 数据可视化: 使用PyEcharts生成交互式图表

3. 可视化技术

  • 使用PyEcharts库生成专业级图表
  • 支持多种主题切换,满足不同场景需求
  • 生成HTML格式的交互式图表,便于分享和展示

项目特点

  1. 模块化设计: 各功能模块职责清晰,便于独立开发和测试
  2. 可扩展性: 支持新的文件格式和数据源
  3. 灵活性: 可以轻松调整数据处理逻辑和可视化样式
  4. 实用性: 生成的图表可直接用于业务报告和决策支持

应用场景

这种数据分析框架可应用于:

  • 销售业绩监控与分析
  • 市场趋势研究
  • 业务数据报表自动生成
  • 数据驱动的决策支持系统

总结

通过这个案例,我们展示了如何运用面向对象编程思想构建一个完整的数据分析系统。从数据定义、文件读取、数据处理到可视化展示,每个环节都体现了良好的软件设计原则。这种架构不仅解决了当前的需求,也为未来的功能扩展奠定了基础。

完整源码展示

以下是数据分析案例的完整源码,包含数据定义、文件读取和主业务逻辑三个核心模块。

1. data_define.py – 数据定义类

python

"""
数据定义的类
"""

class Record:
    def __init__(self,data,order_id,money,province):
        self.data = data                # 订单日期
        self.order_id = order_id        # 订单id
        self.money = money              # 订单金额
        self.province = province        # 销售省份

    def __str__(self):
        return f"{self.data},{self.order_id} {self.money} {self.province}"

2. file_define.py – 文件读取类

python

"""
和文件相关的类定义
"""
import json

from data_define import Record


# 先定义一个抽象类用来做顶层设计,确定有哪些功能需要实现
class FileReader:
    def read_data(self) -> list[Record]:
        """读取文件的数据,读到的每一条数据都转换为Record对象,将他们都封装到list内返回即可"""
        pass

class TextFilReader(FileReader):
    def __init__(self,path):
        self.path = path

    def read_data(self) -> list[Record]:
        f = open(self.path,"r",encoding="utf-8")
        record_list:list[Record] = []
        for line in f.readlines():
            line = line.strip()
            data_list = line.split(",")
            record = Record(data_list[0],data_list[1],int(data_list[2]),data_list[3])
            record_list.append(record)

        f.close()
        return record_list


class JsonFilReader(FileReader):
    def __init__(self,path):
        self.path = path

    def read_data(self):
        f = open(self.path,"r",encoding="utf-8")
        record_list:list[Record] = []
        for line in f.readlines():
            data_dict = json.loads(line)
            record = Record(data_dict["date"],data_dict["order_id"],int(data_dict["money"]),data_dict["province"])
            record_list.append(record)

        f.close()
        return record_list



if __name__ == '__main__':
    # a = TextFilReader(r"D:\数据分析\课件资料\资料\第13章资料\2011年1月销售数据.txt")
    # list1 = a.read_data()
    # for record in list1:
    #     print(record)

    b = JsonFilReader(r"D:\数据分析\课件资料\资料\第13章资料\2011年2月销售数据JSON.txt")
    list2 = b.read_data()
    for record in list2:
        print(record)

3. main.py – 主业务逻辑代码

python

"""
面向对象,数据分析案例,主业务逻辑代码
实现步骤:
1、设计一个类,可以完成数据的封装
2、设计一个抽象类,定义文件读取的相关功能,并使用子类实现具体功能
3、读取文件,生产数据对象
4、进行数据需求的逻辑计算(计算每一天的销售额)
5、通过PyEcharts进行图形绘制
"""
from pyecharts.globals import ThemeType

from file_define import FileReader,TextFilReader,JsonFilReader
from data_define import Record
from pyecharts.charts import Bar
from pyecharts.options import *

text_file_reader = TextFilReader(r"D:\数据分析\课件资料\资料\第13章资料\2011年1月销售数据.txt")
json_file_reader = JsonFilReader(r"D:\数据分析\课件资料\资料\第13章资料\2011年2月销售数据JSON.txt")

jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()
# 将两个月的数据合并为一个list来存储
all_data: list[Record] = jan_data + feb_data
print(type(all_data))

# 开始进行数据计算
# {"2011-01-01": 1534,"2011-01-02": 300,"2011-01-03": 650}
data_dict = dict()
for record in all_data:
    if record.data in data_dict.keys():
        # 当前日期已经有记录了,所以和老记录做累加即可
        data_dict[record.data] +=  record.money
    else:
        data_dict[record.data] = record.money
print(data_dict)


# 可视化图表开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))
bar.add_xaxis(list(data_dict.keys()))   # 添加x轴的数据
bar.add_yaxis("销售额",list(data_dict.values()),label_opts=LabelOpts(
    is_show=False
))
bar.set_global_opts(
    title_opts=TitleOpts(title="每日销售额")
)

bar.render("每日销售额柱状图.html")
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇