博睿云
没有解决您的问题?扫描二维码加入博睿云交流群畅所欲言吧!
使用帮助

全部课程> 天猫订单的数据分析方案

天猫订单的数据分析方案

来源:博睿云

  • 2023-08-29  -  2025-07-06 30课时(建议每周学习2小时)
  • Java程序设计 python程序设计 Linux操作系统
  • 自主模式

已有2386人报名学习

  • 课程概览
  • 授课讲师
  • 课程大纲
  • 课程概览
  • 授课讲师
  • 课程大纲

本项目的数据为2020年2月份天猫某店铺的订单成交数据,共28010条。课程将从实际生产开发环境出发,以Hadoop+Spark作为大数据分析平台、以促进产品销售为目的对项目数据进行分析操作,通过数据分析,进而明确销售现状,挖掘潜在规律,发现存在问题,提出可行性建议,进而为优化经营起到助力作用。

课程概览
本课程共有八章,具体内容如下:
第一章介绍Linux环境的安装与搭建,包括操作系统CentOS的安装,JDK环境的安装,MariaDB的安装。
第二章介绍Hadoop集群的搭建,并初步了解Hadoop的使用。
第三章介绍Hadoop的HDFS分布式文件系统,介绍Maven的使用。
第四章介绍MapReduce分布式计算框架的使用。
第五章介绍Spark的安装,以及讲解Scala编程语言。
第六章介绍Spark的使用,包括Spark编程和SparkSQL编程。
第七章介绍本课程项目会用到的PythonWeb前端框架、Web应用程序框架,并把本课程的数据可视化项目初步搭建起来。
第八章结合我们前面学过的所有内容,编写SparkSQL程序做数据处理,将结果保存在数据库,最后利用Python做数据可视化。
授课讲师

伍伟邦

10年项目开发经验,5年教学经验。曾带领团队主导研发CRM大型项目,精通华为大数据平台与数据挖掘知识体系。

课程大纲
  • 第1章Linux环境搭建
  •     第1节Linux环境的安装
  •     第2节Linux环境中的JDK安装
  •     第3节MariaDB的安装
  • 第2章Hadoop集群搭建
  •     第1节Hadoop安装前的准备
  •     第2节Hadoop的安装
  •     第3节Hadoop的使用
  • 第3章HDFS分布式文件系统
  •     第1节HDFS的概念
  •     第2节Maven的安装与使用
  •     第3节HDFS的API操作
  • 第4章MapReduce分布式计算框架
  •     第1节MapReduce编程实践
  • 第5章Scala语言基础
  •     第1节Spark的安装
  •     第2节Scala编程基础
  • 第6章Spark大数据处理框架
  •     第1节Spark编程基础
  •     第2节Spark编程进阶
  •     第3节SparkSQL编程
  •     第4节SparkSQL编程进阶
  • 第7章PythonWeb框架
  •     第1节ECharts的使用
  •     第2节Python连接数据库
  •     第3节PythonWeb项目搭建
  • 第8章天猫订单数据分析
  •     第1节Spark数据分析
  •     第2节数据可视化
节数上课时间星期一 星期二星期三星期四 星期五星期六星期天
第1节08:00 - 08:40
第2节09:00 - 09:40
第3节10:00 - 10:40
第4节11:00 - 11:40
第5节14:00 - 14:40
第6节15:00 - 15:40
第7节16:00 - 16:40
第8节17:00 - 17:40
天数上课日期上课时间内容
相关课件 更多
  • docx

    1.Linux基础知识

    大小:3.7MB

    2023-08-28

  • docx

    2.Hadoop集群搭建

    大小:344.17KB

    2023-08-28

  • docx

    3.Maven的概述

    大小:3.65MB

    2023-08-28

  • docx

    4.MapReduce分布式计算框架

    大小:1.82MB

    2023-08-28

  • docx

    5.Scala语言基础

    大小:1.5MB

    2023-08-28

  • docx

    6.Spark大数据处理框架

    大小:2.29MB

    2023-08-28