伪分布式大数据分析流程总结

伪分布式大数据分析流程总结总结一下今天分析的总体流程，并且记录一下作者踩过的坑。按照时间顺序记录。作者打算按照某位博主的流程建立伪分布式大数据环境，分析数据。首先先下载好需要用的所有文件。#2020年Windows系统在虚拟机上安装ubuntu时，电脑蓝屏重启问题。一、情况基于以下几点：1、windows系统也比较新。2、安装的虚拟机的版本是VMware-workstation-full-15.5

1静1一

141人浏览 · 2021-07-05 16:47:23

1静1一 · 2021-07-05 16:47:23 发布

按照时间顺序记录并总结在hadoop伪分布式集群中进行数据分析，过程中遇到的问题。
首先先感谢两位博主创作的内容。

参考链接

伪分布式大数据分析具体流程链接: https://blog.csdn.net/qq_42800581/article/details/106248006.
安装虚拟机，消除蓝屏问题链接: https://blog.csdn.net/SpringWJN/article/details/114665990

过程中遇到的问题及解决办法

作者打算按照参考链接中的博主的文章建立伪分布式大数据环境，分析淘宝双十一购物相关数据。
首先先下载好需要用的所有文件。

2020年Windows系统在虚拟机上安装ubuntu时，出现电脑蓝屏重启问题。

一、情况基于以下几点：
1、windows系统也比较新。
2、安装的虚拟机的版本是VMware-workstation-full-15.5.2-15785246。
3、安装ubuntu-16.04.6-desktop-amd64之后，出现了电脑蓝屏重启的情况。

二、解决过程以及办法：

作者查阅了大量资料，并作多次尝试，都无效，直到看到这位博主的文章，安装了他用的新版本VMware-workstation之后，问题解决。感谢这位博主。

ubuntu-16系统打开之后，页面较小的问题

一、问题描述：
按照第一位博主的内容建立伪分布式集群时，刚开始在虚拟机中打开ubuntu-16，会出现页面比较小的情况。
二、解决过程：
按照这位博主的操作继续走，页面就会自动恢复正常。对于本小白来说，还挺神奇的。
于此同时，还存在一个问题，就是在ubuntu系统中，浏览器失效的同时，其他应用有网。不过不影响复制粘贴这位博主的代码。在物理机的浏览器上复制即可。
基于这一篇详细的博文，伪分布式大数据分析流程成功走完。
同时，为了加深对这一过程的理解，本文将梳理一下hadoop伪分布大数据分析的流程这篇博客。