20250210更新:

根据李宏毅课程可知,大模型chatgpt基本原理分为三步(每一步都是在做文字接龙,但训练资料不同)

一、依赖大量网上文章、维基百科等资料训练

对资料进行去重,劣质优质划分,过滤等操作,将资料划分为一笔笔训练样本

二、人工标注样本进行有监督训练

三、强化学习

基于模型生成的几个答案进行打分,若打分较高,则微调模型参数,使得模型生成打分高的答案概率较高

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐