大数据最全R语言进行描述性统计分析_r tables of numerical summaries(2)，2024年最新《大数据开发面试题及解析》分享给大家

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新需要这份系统化资料的朋友，可以戳这里获取data

2401_84166327

1044人浏览 · 2024-05-07 07:08:53

2401_84166327 · 2024-05-07 07:08:53 发布

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

data <- read.csv(“student_BMI.csv”)

提取BMI数据

bmi_data <- data$BMI

使用sort对BMI进行排序

sorted_bmi <- sort(bmi_data)
print(“Sorted BMI:”)
print(sorted_bmi)

使用rank对BMI进行排名

bmi_rank <- rank(bmi_data)
print(“BMI Rank:”)
print(bmi_rank)

使用order获取排序的顺序索引

bmi_order <- order(bmi_data)
print(“BMI Order:”)
print(bmi_order)


### 任务2


随机产生21名学生的高数和英语成绩向量，并加入到上题产生的数据框中。

随机生成高数和英语成绩向量

set.seed(123) # 设置随机种子以确保结果可重现
math_scores <- round(runif(21, min = 60, max = 100), 2) # 随机生成高数成绩
english_scores <- round(runif(21, min = 60, max = 100), 2) # 随机生成英语成绩

将随机生成的高数和英语成绩添加到数据框中

data $Math_Score <- math_scores data$ English_Score <- english_scores


### 任务3：


对BMI，高数，英语成绩进行描述性统计分析。指出这三项的一些描述性指数  
 ，包括最小值、最大值、极差、平均数、方差、标准差、变异系数。

定义函数计算描述性统计指标

describe_stats <- function(x) {
stats <- c(
min = min(x),
max = max(x),
range = max(x) - min(x),
mean = mean(x),
variance = var(x),
sd = sd(x),
coefficient_of_variation = sd(x) / mean(x)
)
return(stats)
}

对BMI、高数和英语成绩进行描述性统计分析

bmi_stats <- describe_stats(data $BMI) math_stats <- describe_stats(data$ Math_Score)
english_stats <- describe_stats(data$English_Score)

输出描述性统计指标

cat(“BMI Descriptive Statistics:\n”)
print(bmi_stats)

cat(“\nMath Score Descriptive Statistics:\n”)
print(math_stats)

cat(“\nEnglish Score Descriptive Statistics:\n”)
print(english_stats)


### 问题4


有50个小区水稻产量的资料如下：  
 37 46 38 38 39 35 35 33 35 36 36 35 38 34 35 37 37 32 36 35  
 39 39 42 33 36 36 38 34 35 38 36 33 33 35 34 28 30 33 35 36  
 34 41 39 43 36 35 26 34 35 31  
 （1）使用hist函数画出其直方图，使用density函数加入密度曲线，使用table统计产量频数，并进行简单分析。

50个小区水稻产量数据

yield_data <- c(37, 46, 38, 38, 39, 35, 35, 33, 35, 36, 36, 35, 38, 34, 35, 37, 37, 32, 36, 35,
39, 39, 42, 33, 36, 36, 38, 34, 35, 38, 36, 33, 33, 35, 34, 28, 30, 33, 35, 36,
34, 41, 39, 43, 36, 35, 26, 34, 35, 31)

绘制直方图

hist(yield_data, breaks = 10, col = “skyblue”, xlab = “Yield”, ylab = “Frequency”,
main = “Histogram of Rice Yield”)

添加密度曲线

lines(density(yield_data), col = “red”)

使用 table 统计产量频数

yield_freq <- table(yield_data)
print(“Frequency of Yields:”)
print(yield_freq)


（2）利用上问的频数分布计算基本统计数，包括样本容量、最小值、最大值、极差、平均数、方差、标准差、变异系数。

计算基本统计数

sample_size <- length(yield_data) # 样本容量
min_value <- min(yield_data) # 最小值
max_value <- max(yield_data) # 最大值
range_value <- max_value - min_value # 极差
mean_value <- mean(yield_data) # 平均数
variance_value <- var(yield_data) # 方差
sd_value <- sd(yield_data) # 标准差
cv_value <- sd_value / mean_value * 100 # 变异系数

输出基本统计数

cat(“Sample Size:”, sample_size, “\n”)
cat(“Min Value:”, min_value, “\n”)

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

数据知识点，真正体系化！**

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

技术共进，成长同行——讯飞AI开发者社区

更多推荐

单电源运放的使用

讯飞AI开发者社区

YOLOv8【卷积创新篇·第8节】RegNet正则化网络设计空间，你不会不懂的吧！

讯飞AI开发者社区

基于PyTorch的农作物病虫害预测模型部署实战

随着农业科技的不断发展，利用人工智能和深度学习来提高农作物生产力已经成为一个重要方向。在众多应用中，农作物病虫害预测模型的部署无疑是农民和农业工作者最为关心的话题之一。随着环境的变化和气候异常的加剧，农作物病虫害的发生愈发复杂，因此，如何通过科学的方法预测并防治这些病虫害成为了提高农业产量、确保粮食安全的关键。本文将基于PyTorch框架，通过具体的实践案例，介绍如何搭建和部署一个农作物病虫害预测