AI自动编程驱动的数据分析(第二期)
12月30日
9周
2人
讲师
- tracy1616
- Tracy
资深人工智能科学家, 多年数据分析与人工智能算法开发的行业经验,在计算机视觉、语音处理、自然语言处理和强化学习等领域上都有着丰富的项目实战经验。曾主导开发众多项目与产品,包括公安室内定位系统、公安声纹鉴定系统、内镜医学图像增强系统、中国移动客户满意度分析、广州地铁客流分析、语音风格迁移、垃圾智能分类综合系统等等。
课程简介
课程章节
- 第1课 自动编程与AI数据分析入门
- 1-1 了解大语言模型在数据分析中的作用与优势
- 1-2 自动编程应用场景概览与工具准备
- 1-3 配置分析环境(Python + Jupyter / R + RStudio)
- 1-4 使用大模型自动生成数据读取与预处理代码
- 第2课 数据预处理与探索性分析自动化(EDA)
- 2-1 自动识别数据结构、变量类型、缺失值与异常值
- 2-2 利用Prompt设计自动完成数据清洗和结构审查
- 2-3 自动生成数据摘要与基本统计图
- 2-4 实战案例:用户行为数据的快速洞察与清洗流程
- 第3课 特征工程与变量处理
- 3-1 分类变量编码、数值变量归一化/标准化
- 3-2 时间变量、文本变量的自动特征提取策略
- 3-3 借助LLM构建新变量、识别冗余变量
- 3-4 实战案例:客户订单数据的特征构造与变量降维
- 第4课 回归建模与自动代码生成
- 4-1 回归模型讲解:线性回归、岭回归、Lasso 回归
- 4-2 利用大模型自动构建训练流程与预测逻辑
- 4-3 自动评估模型效果(R²、MSE、残差图等)
- 4-4 实战案例:房价预测自动建模
- 第5课 分类模型与评估解释自动化
- 5-1 分类算法概览:逻辑回归、决策树、随机森林、SVM
- 5-2 自动化生成训练、测试、交叉验证与混淆矩阵分析
- 5-3 使用LLM解释分类模型结果并生成结论摘要
- 5-4 实战案例:用户流失预测、信用风险评估
- 第6课 无监督学习与聚类分析
- 6-1 聚类算法:KMeans、层次聚类、DBSCAN
- 6-2 降维算法:PCA、t-SNE 的自动实现与可视化输出
- 6-3 LLM自动推荐聚类数、生成聚类标签解释
- 6-4 实战案例:电商用户分群、市场细分建模
- 第7课 数据可视化与报告自动生成
- 7-1 使用LLM生成多种图表(条形图、热力图、趋势图等)
- 7-2 自动调整图形样式与注释内容
- 7-3 自动撰写Markdown格式分析报告、摘要与结论段落
- 7-4 实战案例:销售数据可视化仪表盘构建
- 第8课 模型集成与大模型协同优化
- 8-1 理解集成模型原理:Bagging、Boosting、Stacking
- 8-2 构建集成模型(随机森林、XGBoost、LightGBM)
- 8-3 自动比较模型效果并生成推荐报告
- 8-4 实战案例:银行客户信用评分建模
- 第9课 基于Agent的自动数据分析项目实践
- 9-1 将数据分析融入AI Agent,构建自动数据分析智能体,解放生产力
- 9-2 实现从用户输入 → 自动清洗 → 建模 → 生成图表 → 输出报告的完整交互链
学费
学费: ¥400 ( 固定学费: ¥100, 逆向学费: ¥300 )
新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元逆向学费,学习圆满则逆向学费全额返还给学员!
相关课程