钟心果

深圳 · 商务数据分析与应用专业 · 2025级

6
课程阶段
30+
课时内容
140+
代码示例
8-10
周学习周期
👩‍💻

个人简介

关于我与我的学习之旅

👋 你好,我是钟心果!

我是一名2025级商务数据分析与应用专业的学生,对数据科学和Python编程充满热情。在这个数据驱动的时代,我相信数据是解读世界的重要工具。

  • 专业方向:商务数据分析与应用
  • 技能方向:Python编程、数据处理、可视化分析
  • 学习目标:掌握Python核心技能,为数据分析奠定坚实基础
  • 未来规划:成为一名优秀的数据分析师,用数据讲述商业故事

💪 我的优势

  • 系统性思维:善于将复杂问题分解为简单的步骤
  • 持续学习:保持对新技术的好奇心和求知欲
  • 实践导向:注重理论与实践相结合的学习方式
  • 细致认真:追求代码的规范性和可读性
📘

第一阶段:Python核心基础

变量、数据类型、运算符、控制流程、函数

1.1 环境搭建与Hello World 入门

让我们从最简单的Hello World开始!这将帮助你熟悉Python编程环境、基本语法和变量使用。

  • 安装Python解释器(Python 3.8+推荐)
  • 使用IDE:VS Code + Python扩展 或 PyCharm
  • print()函数用于输出信息
  • 单行注释以#开头,多行注释用三引号
  • f-string是现代Python的字符串格式化方式
hello_world.py - 第一个Python程序

1.2 数据类型与运算符 入门

Python内置多种数据类型:整数(int)、浮点数(float)、字符串(str)、布尔值(bool)。掌握这些基本类型是编程的基石。

  • 整数(int):如1, 100, -5,支持加减乘除取模运算
  • 浮点数(float):如3.14, -0.5,注意精度问题
  • 字符串(str):用引号包裹,支持拼接、切片、格式化
  • 布尔值(bool):True/False,用于条件判断
  • 类型转换:int(), float(), str(), bool()
data_types.py - 数据类型详解
operators.py - 运算符练习

1.3 控制流程:条件判断 入门

程序需要根据不同条件做出决策。if-elif-else语句让我们能够实现复杂的条件分支逻辑。

  • if语句:最基本的条件判断
  • elif语句:处理多个条件
  • else语句:处理不满足所有条件的情况
  • 三元表达式:简洁的条件赋值
conditionals.py - 条件判断

1.4 循环结构:for与while 基础

循环让我们能够重复执行代码块。for循环适合遍历序列,while循环适合基于条件的重复。

  • for循环:遍历列表、字符串、字典、range对象
  • while循环:在条件为True时重复执行
  • break:跳出循环
  • continue:跳过当前迭代
  • 列表推导式:简洁创建列表的方式
loops.py - 循环结构

1.5 数据结构:列表、元组、字典、集合 基础

Python内置四种核心数据结构,每种都有其独特用途和特性。掌握它们是数据处理的基础。

  • 列表(list):有序可变序列,支持增删改查
  • 元组(tuple):有序不可变序列,更省内存
  • 字典(dict):键值对存储,查找效率高
  • 集合(set):无序不重复元素,支持集合运算
data_structures.py - 数据结构

1.6 函数定义与使用 基础

函数是组织代码的基本单元。良好的函数设计让代码更加模块化、可重用和易维护。

  • 使用def关键字定义函数
  • 参数可以有默认值
  • 使用*args和**kwargs处理不定参数
  • 返回值使用return语句
  • 注意参数作用域(全局vs局部)
functions.py - 函数基础
💡 学习要点:第一阶段的核心是理解Python的基本语法规则和数据结构。建议多动手实践,尝试修改代码中的变量和逻辑,观察输出变化。

📝 阶段一练习题

  • 编写一个计算器函数,可以进行加减乘除运算
  • 实现一个猜数字游戏,让用户猜测1-100之间的随机数
  • 使用列表推导式生成一个包含1-20之间所有偶数的列表
  • 编写一个函数,接受任意多个数字并返回它们的平均值
  • 实现一个简单的学生信息管理系统(使用字典存储学生信息)
🧩

第二阶段:面向对象编程

类与对象、继承多态、魔术方法、设计模式

2.1 类与对象基础 基础

面向对象编程(OOP)是Python的核心范式。类(Class)是蓝图,对象(Object)是实例,理解这两者的关系至关重要。

  • 类定义使用class关键字
  • __init__方法用于初始化对象
  • self参数指向当前实例
  • 实例属性存储对象状态
  • 类属性是所有实例共享的数据
class_basics.py - 类与对象基础

2.2 继承与多态 基础

继承允许我们创建基于现有类的新类,实现代码重用。多态让不同对象可以用相同接口操作。

  • 子类继承父类的属性和方法
  • super()调用父类方法
  • 方法重写(override)实现多态
  • 多重继承需注意方法解析顺序(MRO)
inheritance.py - 继承与多态

2.3 魔术方法 进阶

魔术方法(Magic Methods/Dunder Methods)是双下划线包围的特殊方法,让对象支持各种Python内置操作。

  • __str__: 定义str()和print()的输出
  • __repr__: 定义repr()的输出,用于调试
  • __len__: 支持len()函数
  • __eq__, __lt__等: 支持比较运算符
  • __add__, __sub__等: 支持算术运算符
magic_methods.py - 魔术方法
data_class.py - 数据类
💡 学习要点:面向对象编程的核心是设计。思考什么是对象、对象有什么属性、能做什么操作。设计模式不是死板的规则,而是解决特定问题的经验总结。

📝 阶段二练习题

  • 设计一个银行账户类,包含存款、取款、查询余额功能
  • 创建一个图形类层次结构:Shape -> Circle, Rectangle,包含计算面积和周长的方法
  • 实现一个栈(Stack)类,支持push、pop、peek、is_empty操作
  • 设计一个图书管理系统,使用继承实现电子书和实体书的区别
  • 使用装饰器实现一个函数执行时间统计器
📁

第三阶段:文件与异常处理

文件读写、异常捕获、上下文管理器、日志系统

3.1 文件读写操作 基础

文件操作是数据持久化的基础。Python提供了简洁的文件读写API,支持文本和二进制文件。

  • open()函数打开文件,返回文件对象
  • 模式:'r'读、'w'写、'a'追加、'b'二进制
  • 读取:read()、readline()、readlines()
  • 写入:write()、writelines()
  • 使用with语句自动关闭文件
file_operations.py - 文件读写

3.2 异常处理 基础

异常处理让程序能够优雅地应对错误。使用try-except-finally结构捕获和处理异常。

  • try块:可能发生异常的代码
  • except块:捕获并处理特定异常
  • else块:try执行成功后执行
  • finally块:无论是否异常都执行
  • raise语句:主动抛出异常
exception_handling.py - 异常处理
context_manager.py - 上下文管理器
💡 学习要点:文件操作要养成使用with语句的习惯。异常处理要具体捕获,避免裸的except语句。日志系统对于调试和生产环境都很重要。

📝 阶段三练习题

  • 编写一个学生信息管理程序,支持添加、查询、保存、加载学生数据到JSON文件
  • 实现一个计算器类,捕获各种异常并给出友好的错误提示
  • 创建一个配置文件的读写工具,支持从配置文件读取设置
  • 实现一个带进度显示的文件复制功能
  • 编写一个日志装饰器,记录函数的调用和执行时间
📊

第四阶段:数据分析核心库

NumPy、Pandas、Matplotlib数据处理与可视化

4.1 NumPy数值计算 基础

NumPy是Python科学计算的基础库,提供了高效的多维数组对象ndarray和大量数学函数。

  • ndarray:高效的多维数组,比Python列表快数十倍
  • 向量化操作:无需循环即可对整个数组操作
  • 广播机制:不同形状数组的自动扩展计算
  • 丰富的数学函数:sin, cos, sum, mean, std等
numpy_basics.py - NumPy基础

4.2 Pandas数据处理 基础

Pandas是数据分析的核心库,提供了Series和DataFrame两种主要数据结构,简化了数据清洗和分析。

  • Series:一维带标签数组
  • DataFrame:二维表格数据,类似Excel/SQL表
  • 数据选择:loc、iloc、条件筛选
  • 缺失值处理:isna、fillna、dropna
  • 分组聚合:groupby、agg
pandas_basics.py - Pandas基础

4.3 Matplotlib数据可视化 基础

Matplotlib是Python最流行的可视化库,可以创建各种静态、动态、交互式图表。

  • plot():折线图,展示趋势
  • bar():柱状图,比较数量
  • scatter():散点图,展示关系
  • hist():直方图,展示分布
  • pie():饼图,展示比例
matplotlib_basics.py - Matplotlib基础
data_analysis_project.py - 数据分析项目
💡 学习要点:数据分析的核心流程是:数据获取 → 数据清洗 → 数据分析 → 数据可视化。多动手练习,逐步掌握NumPy的数组操作、Pandas的数据处理、Matplotlib的可视化技巧。

📝 阶段四练习题

  • 使用NumPy生成一个5x5的随机矩阵,计算其特征值和特征向量
  • 读取CSV文件,筛选出特定条件的数据并保存到新文件
  • 使用Pandas处理缺失值,计算某列的平均值并填充缺失位置
  • 创建一个数据仪表盘,同时展示多张图表
  • 实现一个数据分析报告自动生成工具
🤖

第五阶段:AI与机器学习

机器学习基础、Scikit-learn、大模型API

5.1 机器学习基础概念 基础

机器学习是让计算机从数据中学习规律的技术。主要分为监督学习、无监督学习和强化学习。

  • 监督学习:有标签数据,分类和回归
  • 无监督学习:无标签,聚类和降维
  • 模型评估:准确率、精确率、召回率、F1分数
  • 过拟合与欠拟合:泛化能力是关键
ml_concepts.py - 机器学习概念

5.2 Scikit-learn实战 基础

Scikit-learn是Python最流行的机器学习库,提供了完整的机器学习流程API。

  • 统一API设计:fit(), predict(), transform()
  • 丰富的算法:分类、回归、聚类、降维
  • 数据预处理:标准化、归一化、编码
  • 模型选择:交叉验证、网格搜索
sklearn_practice.py - Scikit-learn实战
llm_api_example.py - 大模型API调用
💡 学习要点:机器学习分为数据准备、模型选择、训练评估三步走。大模型API是当前的热门方向,但要注意数据隐私和API成本问题。

📝 阶段五练习题

  • 使用KNN算法对鸢尾花数据集进行分类,并比较不同K值的效果
  • 实现一个简单的垃圾邮件分类器
  • 使用PCA对高维数据进行降维可视化
  • 调用一个大模型API,实现一个智能问答助手
  • 构建一个完整的机器学习pipeline,从数据预处理到模型部署

第六阶段:高级主题与最佳实践

代码规范、测试、Git、性能优化

6.1 代码规范与PEP8 入门

良好的代码规范提高可读性和可维护性。PEP8是Python官方代码风格指南。

  • 缩进:4个空格(不用Tab)
  • 行长度:不超过79字符
  • 命名规范:变量小写下划线,类名大驼峰
  • import顺序:标准库、第三方库、本地库
  • 使用空白符增强可读性
code_style.py - 代码规范示例

6.2 单元测试 基础

单元测试确保代码质量,是可靠软件的重要组成部分。unittest和pytest是常用的测试框架。

  • 测试用例:验证单个功能点
  • setUp/tearDown:每个测试前后的准备和清理
  • 断言:assertEqual, assertTrue, assertRaises等
  • 覆盖率:测试覆盖的代码比例
unit_test.py - 单元测试示例
git_guide.py - Git版本控制概念
💡 学习要点:代码规范让代码更易读,测试让代码更可靠,Git让协作更顺畅。这三点是现代软件开发的基础技能,需要不断练习。

📝 阶段六练习题

  • 使用flake8或pylint检查代码是否符合PEP8规范
  • 为一个数据处理函数编写完整的单元测试
  • 使用Git创建仓库,练习基本的add、commit、push操作
  • 配置pre-commit钩子,自动检查代码风格
  • 使用cProfile分析代码性能,找出瓶颈