为什么Bert之后的nlp模型都只需要标注少量的数据进行训练

Bert之后的nlp模型都只需要标注少量的数据进行训练

星宇星静

145人浏览 · 2023-11-19 12:53:59

星宇星静 · 2023-11-19 12:53:59 发布

首先关于这个问题是我的一个同门提出来的，一直也困扰了我好几天，这几天查阅了相关的资料，也没有很好的解释。根据我自己的理解，我列出了能信服我的几点原因，如下：

预训练的成功使用，这让模型在训练我们自己的数据之前已经具有了对语义理解的能力。
Bert对于语义识别精度十分高，所以只需要很少的预料信息就可以达到较为良好的训练效果。
Bert通过自注意力机制，实现了自监督学习，这让模型有了很好的聚类能力。所以在实现下游任务的时候也有较好的效果。

希望能有大佬能给我系统的解答一下，谢谢！

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI智能体—人工智能工作流与人工智能智能体：真正的区别是什么？

本文探讨了人工智能工作流与智能体的核心区别。工作流是静态、可预测的执行序列（如预处理→嵌入→搜索→总结），适合批处理作业；而智能体能动态感知环境、自主决策（感知→推理→决策循环），具备适应性和工具选择能力。关键差异在于：工作流遵循固定路径，智能体则能根据目标调整策略。架构上，工作流使用Airflow等工具，智能体依赖LangChain等框架。智能体的自主性使其更适用于动态环境，代表下一代AI应用方