TinyBERT 数据增强

关于tinyBERT论文的解读已经有很多文章了，本文仅仅说明数据增强的步骤。

清风2022

778人浏览 · 2022-09-20 16:35:50

清风2022 · 2022-09-20 16:35:50 发布

TinyBERT 数据增强

TinyBERT: Distilling BERT for Natural Language Understanding

github

关于论文的解读已经有很多文章了，本文仅仅说明数据增强的步骤。

数据增强步骤

1.mask句子中的一个字词

1) 如果该单词的只有一个字

使用语言模型BERT预测出这个位置最有可能的m个词，作为候选集。

2）如果该单词含有多个字

使用GloVe的相似词向量的词汇进行组合，作为候选集。

2. 使用一个阈值p决定，是否将这个被mask的字词随机替换为候选集中的词汇。

3. 对文本中的每个词，重复地执行以上步骤，得到一个新的文本加入增强的数据集。

在这里插入图片描述

技术共进，成长同行——讯飞AI开发者社区

更多推荐

第75篇：AI+金融：智能风控、量化交易与个性化理财

摘要：本文系统性地深入探讨人工智能在金融领域的革命性应用。我们首先解析智能风控：AI如何利用XGBoost、LightGBM、深度神经网络（DNN）与图神经网络（GNN），融合多维度数据（征信、行为、社交、设备），实现信贷反欺诈、信用评分、反洗钱与异常交易检测，提升风险识别精度与效率。详解量化交易：AI如何通过LSTM、Transformer、强化学习（RL）分析海量市场数据（行情、新闻、财报），

讯飞AI开发者社区

AIoT（人工智能物联网）：融合范式下的技术演进、系统架构与产业变革

AIoT并非简单的技术叠加，而是一种全新的系统性范式，其核心在于将AI的感知、学习、推理与决策能力内化于物联网的感知、连接与执行体系之中，实现从“万物互联”向“万物智联”的根本性跃迁。通过分析多维度的行业报告、技术白皮书与实践案例，本文揭示了AIoT在智慧城市、智能制造、智慧医疗、智慧农业等领域的深刻变革，并探讨了其在终端AI化、传输多样化、感知融合化等前沿趋势下的产业生态演化。物联网（IoT）的

讯飞AI开发者社区

企业AI Agent的情感智能：提升员工体验与忠诚度

随着人工智能技术的飞速发展，企业AI Agent在企业运营中的应用越来越广泛。本研究的目的在于深入探讨企业AI Agent的情感智能如何对员工体验和忠诚度产生积极影响。具体范围涵盖了情感智能的理论基础、相关算法原理、实际应用场景以及在企业环境中的实践案例等方面。通过研究，旨在为企业提供切实可行的方案，利用AI Agent的情感智能提升员工的工作满意度和忠诚度，进而促进企业的长期发展。本文共分为十个