后端——taos数据库优化

拿到需求的第一时间就想到在业务层进行聚合操作，但是后面发现实在是太慢了，统计数据得5分钟，后面优化了之后可以不到5秒钟完成统计。（数据量：400w）对于同一个需求，这样真的快了不少，代码也少了不少，天，之前怎么没想到！在业务层使用stream流实现聚合操作，没有充分利用taos数据库的聚合函数，在数据库层对40w数据做聚合操作只需要不到1s。根据分组条件，使用taos聚合操作在持久层进行聚合操作。

qq_61570366

534人浏览 · 2024-10-21 15:14:51

qq_61570366 · 2024-10-21 15:14:51 发布

这是对之前做的一篇文章的优化——后端——Java Stream流多字段分组业务层实现sql的分组聚合功能。拿到需求的第一时间就想到在业务层进行聚合操作，但是后面发现实在是太慢了，统计数据得5分钟，后面优化了之后可以不到5秒钟完成统计。（数据量：400w）

优化分析

在业务层使用stream流实现聚合操作，没有充分利用taos数据库的聚合函数，在数据库层对40w数据做聚合操作只需要不到1s。

优化步骤：

根据分组条件，使用taos聚合操作在持久层进行聚合操作

在根据分组条件去找其他字段（一条记录即可）

直接上代码

service

@Service
@Slf4j
public class TaosServiceImpl implements TaosService {

    @Autowired
    private TaosMapper taosMapper;

    /**
     * 根据时间区间统计实时数据
     * @param startTime
     * @param endTime
     * @return
     */
    /*
        业务层实现以下sql
        SELECT COUNT(id) weldDuration,weldModel,gatherNo,welderNo,weldStatus,machineId,machineNo,
        machineDeptId,gatherId,gatherDeptId,welderId,welderName,welderDeptId,taskId,taskName,taskNo,SYSDATE(),
        '${startTime}','${endTime}',AVG(electricity),AVG(voltage),AVG(wireFeedRate),AVG(wireDiameter),AVG(wireMaterialsGases),
        AVG(gasesFlow),walkSpeed
        FROM `base_cloud_weldmes_rtdata`.${tableName}
        WHERE weldTime BETWEEN #{startTime} AND #{endTime}
        GROUP BY gatherNo, weldStatus, welderNo
     */
    @Override
    public List<OtcV2RtDataDb> getWeldStatisticsData(String startTime, String endTime) {

        List<OtcV2RtDataDb> totalStatisticsData = new ArrayList<>();

        // 查询数据中的表明
        List<String> tables = taosMapper.showTables();

        // 根据表名和时间区间查询实时数据
        for (String table : tables) {

            // 先查询统计数据的聚合数据
            List<OtcV2RtDataDb> statisticsData = taosMapper.getStatisticsData(startTime, endTime, table);
            // 再查询统计数据的其他字段
            statisticsData.forEach(temp -> {
                OtcV2RtDataDb otherColumn = taosMapper.getStatisticsDataOtherColumn(table, temp.getGatherNo(), temp.getWeldStatus(), temp.getWelderNo());
                setOtherColumn(otherColumn, temp);
            });

            totalStatisticsData.addAll(statisticsData);
        }


        return totalStatisticsData;
    }

    private void setOtherColumn(OtcV2RtDataDb source, OtcV2RtDataDb target) {
        target.setWeldModel(source.getWeldModel());
        target.setMachineId(source.getMachineId());
        target.setMachineNo(source.getMachineNo());
        target.setMachineDeptId(source.getMachineDeptId());
        target.setGatherId(source.getGatherId());
        target.setGatherDeptId(source.getGatherDeptId());
        target.setWelderId(source.getWelderId());
        target.setWelderName(source.getWelderName());
        target.setWelderDeptId(source.getWelderDeptId());
        target.setTaskId(source.getTaskId());
        target.setTaskName(source.getTaskName());
        target.setTaskNo(source.getTaskNo());
    }
}

mapper.xml

<select id="getStatisticsData" resultMap="TdInsertDTOResult">
    SELECT gatherNo, weldStatus, welderNo,
           '#{startTime}' startTime,
           '#{endTime}' endTime,
           COUNT(ts) weldDuration,
           AVG(electricity) electricity,
           AVG(voltage) voltage,
           AVG(wireFeedRate) wireFeedRate,
           AVG(wireDiameter) wireDiameter,
           AVG(wireMaterialsGases) wireMaterialsGases,
           AVG(gasesFlow) gasesFlow
    FROM #{tableName} WHERE weldTime BETWEEN #{startTime} AND #{endTime}
    GROUP BY gatherNo, weldStatus, welderNo
</select>

<select id="getStatisticsDataOtherColumn" resultMap="TdInsertDTOResult">
    SELECT *
    FROM #{tableName}
    WHERE gatherNo = #{gatherNo} and weldStatus = #{weldStatus} and welderNo = #{welderNo} limit 1;
</select>

对于同一个需求，这样真的快了不少，代码也少了不少，天，之前怎么没想到！前面一篇文章就当对stream流groupingBy的学习了

技术共进，成长同行——讯飞AI开发者社区

更多推荐

程序员必学！大模型五大核心技术(MCP/Agent/RAG/RPA/A2A)全解析（收藏版）

讯飞AI开发者社区

构建综合交通运输大模型：驱动交通强国建设的智能技术底座

最后，本文前瞻性地指出了在数据融合、模型复杂性、安全伦理等方面面临的挑战，并提出了相应的对策建议，以期为我国“人工智能+交通运输”的战略实施提供理论参考与实践指引。通过夯实“数据、算法、工具链”三大支柱，成功打造这一强大的智能技术底座，必将为我国构建安全、便捷、高效、绿色、经济的现代化综合交通体系提供核心驱动力，最终实现“人享其行、物畅其流”的美好愿景。通过对桥梁、隧道、轨道等基础设施的实时监测数

讯飞AI开发者社区

自然语言处理（NLP）基础

苹果”可以指一种水果，也可能指Apple 公司；“我今天早上没吃饭”中的“没”是否表示“完全没有”需要结合上下文。NLP 的任务就是让计算机能够“读懂”这些文字和语音，抽取其中的语义信息，从而与人类进行自然交流。简单来说，NLP 是计算机科学、人工智能与语言学的交叉学科。自然语言处理（NLP）让计算机能够理解和生成自然语言，是人工智能最贴近人类日常生活的技术之一。随着深度学习和大模型的发展，NLP