贵州民族大学人文科技学院

本科毕业论文(设计)任务书

学院:大数据与信息工程学院  年级:2020 专业班级:数据科学与大数据技术1

学生姓名

杨新萌

指导教师

张其其格

职称

讲师 

论文(设计)题目

基于Hive的企业销售订单数据分析与可视化

毕业 论文(设计)工作 内容

本研究是基于Hive对企业销售订单进行数据分析及可视化,顺应目前经济市场,企业都注重对销售数据进行分析,从数据分析的角度可以调整销售策略来达到该企业的销售目标。

本设计是基于Hive企业销售订单数据分析与可视化,主要设计步骤为将已有数据转为excel通过excel进行数据清洗和数据预处理,将数据上传到HDFS文件系统、使用Hive进行数据分析,分析结果存储在 HDFS文件系统、使用Sqoop工具将分析结果传输到 MySQL进行数据管理,然后用IDEA创建springboot文件进行数据可视化,最终得出一些数据和结论来解释目前的问题,并为未来解决企业产品销售难题提出更加具体的解决方案也为销售产品的方向提供一个较为基础的数据支撑。因此,其主要的研究内容为:

(1)研究分析某一产品主要销售地区。

(2)研究分析产品中销售TOP前10。

(3)热销品牌分析

(4)价格区间统计

指导教师:          

系 主 任:              

学院院长:             

备注

该表由学生与指导老师共同讨论后,确定论文题目,并在“工作内容”栏填写“完成论文撰写所需完成的主要任务”。

核心算法代码分享如下:

## 启动hadoop
cd /data/hadoop/sbin
sh /data/hadoop/sbin/start-all.sh

## 启动hive 

cd /data/hive

nohup hive --service metastore &

nohup hive --service hiveserver2 &

============hive+hadoop离线计算命令无脑复制
mysql数据库命名:qy2024

mkdir /data/qy2024 
cd  /data/qy2024 

--hive 建库
DROP DATABASE IF  EXISTS qy2024;
CREATE DATABASE IF NOT  EXISTS qy2024;
use qy2024;
show tables;

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐