2025最新!大模型成长路线入门基础教程:从入门到精通,一篇搞定,赶紧收藏!
当下,讨论任何话题都离不开“大模型”,更不用说关注技术人员成长的话题了,因为,毕竟“大模型”有“干掉”我们的潜质。但技术人员要看到本质,而不能被舆论带偏。吴军博士说:“从原理上看,今天几乎所有的人工智能产品都是复读机”,如果不给它喂我们“治理”得来的知识,那么,它就会用预训练的知识来应付我们。这些模型参数自带的知识是我们想要的吗?它是否符合我们的惯例、遵守我们的规范?不一定!大模型解决问题的方法、
大模型发展如火如荼,“大模型将重塑一切”!的确!我也承认大模型有这个能量,但要重塑“研发形态”,技术人要走的路还很漫长。
当下,讨论任何话题都离不开“大模型”,更不用说关注技术人员成长的话题了,因为,毕竟“大模型”有“干掉”我们的潜质。但技术人员要看到本质,而不能被舆论带偏。吴军博士说:“从原理上看,今天几乎所有的人工智能产品都是复读机”,如果不给它喂我们“治理”得来的知识,那么,它就会用预训练的知识来应付我们。这些模型参数自带的知识是我们想要的吗?它是否符合我们的惯例、遵守我们的规范?不一定!大模型解决问题的方法、理论是我们所掌握的吗?他的方案适合我们长期维护吗?也不一定!所以,应用大模型要慎重!
一、大模型应用的三种形态
如何利用大模型呢?我斗胆在“三次跃迁”路线图上标注一下我认为大模型可以发挥作用的点。画外音:个人观点,仅供参考。
“三次跃迁”遇见大模型⭐️
我用3颗五角星对大模型可能出现的位置进行标注,在不同的时期,使用者以及应用方法均有不同:
- 学习型:在项目交付阶段的早期,面对一个不太了解的领域或问题,首先,大模型可以代替搜索引擎,帮我们查找相关资料,帮助我们尽快对问题总体的结构、局部的细节有一个较好的理解和把握,比如使用秘塔 AI 搜索,可以综合网上资料,大模型知识,进行资料汇总,根据个人要求形成一些报告;其次,针对局部专题性问题,可以尝试找到一些解法思路,甚至是源码示例。这是可以做到的,前提是“局部专题性问题”相对较小、较专,大模型早有准备,其预训练材料中包括了工程算法、语言实现、开源代码库等知识。
- 打磨型:在项目交付阶段的中后期,我们要打造高品质的“正确解法”,首先,提升解决方案的非功能特性能力,比如性能强化、安全加固、管理完善等,“太阳底下没有新鲜事”,针对这些小型专业化目标,其他同行应该已经有了很好的实践经验,大模型能帮助我们查找、分析、甚至给出示例。此时,我们的目标是自主掌控技术并形成自己的解决方案,大模型用来辅助设计和实现。其次,建立更好的知识管理和赋能体系。在治理“场景解决方案”的过程中,会产出大量的图文资料,如何管理这些资料,并尽量在未来工作中提升资料的曝光度和引用率,从而实现资产增值及再生闭环,是一个亟须解决的问题。大模型在辅助资料整理、资产管理、参考引用等方面可以提供帮助。降低资产获得的难度,提升信息整合的品质。
- 专业型:在产品构建阶段,首先,大模型可以辅助低代码平台及解决方案建设,如支持运行底座、模型定义、能力低代码组件等专用技术部件的设计研发;其次,训练(微调或加知识库)出基于自己知识体系的专用模型,用于重塑研发设计、质量检核、交付打包、上线变更等研发流水线;最后,赋能生产交付过程,形成新质生产力。压缩从自然语言需求到可交付软件的中间过程,如将需求沟通、产需编写、原型设计与演示压缩为一个过程,降低从自然语言需求(内部规范的结构化需求)表达到低代码设计工具的使用难度。
从命名上可以看出来,学习型是支持新手学练完成任务的,打磨型用于辅助熟手进行技术精进,专业型帮助高手创造(重塑研发形态),要依赖更深层的大模型研究与应用。如果在产品构建阶段,大模型能力能够嵌入“智能工厂”中,那么在赋能创收阶段,大模型将以“润物细无声”的方式发挥巨大的价值。退一步讲,即便没有对外输出,富含“自己”经验的大模型工具,在内部应用中仍能发挥提质增效的重要作用。
二、大模型发威的关键在于治理
语言大模型能做的事情有三类,第一类是信息形式转换,如机器翻译、需求转代码等;第二类是根据要求产生文本;第三类是信息精简(引自吴军博士讲座)。从信息的输入转出通讯角度看,第一类是对等转换,将输入转换为对应输出即可;第二类是输入小输出大,输出缺少的部分,需要大模型根据要求评估概率用已有知识进行补全,其输出结果存在一定的不确定性;第三类是输入大于输出,大模型根据算法进行信息筛选精简,取决于模型训练学习到的价值观等等。
对照一下我们的使用场景,我们应该主要是使用第一类,即信息形式转换。产品构建阶段的主要任务是建设智能化软件工厂,目的是赋能未来的研发交付过程,主要是将自然语言需求转换成为代码交付件。这类应用难点在于,第一,人类的意图有时无法用人类的自然语言表达准确、完备;第二,即便能够表达准确、完备,这些语言又是如何与组件能力、装配工艺等技术要素对应起来?这也是影响“自己”大模型发威的关键卡点。至于语言大模型的第二、三类应用场景,市场上已经有成熟产品,可以玩玩试试,因为其自身输出带有不确定性,所以,要加强甄别,有监督使用。
回到主题,为什么说“治理”非常重要?因为只有通过治理,才能将所有业务(需求)对应到系统、功能、数据上,形成服务目录;只有通过治理,才能对需求场景(功能类型)进行分类,使需求描述规范化、标准化,甚至是模型化,即用数字化档案的形式,将需求描述成一种完备的信息模型,使用完善的属性定义描述需求的各个侧面;只有通过治理,才能让针对特定场景的解决方案,升级为可复用、能扩展的组件,形成可以直接使用的复用资产;只有通过治理资产支撑新的设计策划,让组装解决方案支持数字化功能建设,以及研发数字化转型。治理形成的知识模板、能力组件、装配方法是指导智能软件工厂建设的重要资产,由软件工厂生产的软件功能产品,又将是前者应用的范例,如此“方法论+实例”就形成了对大模型的高质量输入。
借用大模型技术供应商的话,好的大模型应用场景落地,重点工作都是“脏活、累活”,像模型训练、 Agent 开发、知识库支持等纯技术性工作能找到大把的人来做,也已经做的很成熟。但是到了具体的行业领域,“外来的和尚”不懂业务,如果内部知识结构化、经验复用转换和管理做的不好,“巧妇难为无米之炊”,大模型没有行业领域知识,肯定做不出好的应用。对于我们来讲,治理干的就是“脏活、累活”,是三次“历劫”中具有承上启下作用的关键环节。做治理的人,不要担心、不要迷茫、无需抱怨,坚持做“难、磨耐性”但是正确的事,回报会来,而且是指数级回报曲线。要有耐心不焦虑,“守得云开见月明”。
三、我们的大模型“试验”之路
我接着斗胆猜想,对于“信息形式转换”类的智能软件工厂探索,其可能的路线:第一步,功能的元模型设计。它来自于多年的治理与正确解法。第二步,模型运行平台验证,即核心解决方案建设试产通关。第三步,持续的试点、验证、打磨成为一个标准化的模型解决方案。第四步,将前者的方法论模板、典型案例输入到大模型进行行业模型训练。第五步,打造支撑未来交付的 Agent工具,充分利用人工智能能力,支撑需求完善、设计开发、质量审计等研发场景。
猜想要想得到证实,就得实验。我将技术专项的工作做了一个排序,具备条件了就可以开展。已经相对成熟的解决方案可以先行试点,尽快证实。做到怎么样才算是成熟了?像上述路线提及的,当解决方案有了很多优秀实践案例,能力得到实证之后就基本上可以认定了;不过最好再进一步,建立基于量化方法的成熟度评价模型,用确定的评价维护来显式化定义成熟度水平。
大模型落地路线与进程
最后,大模型会代替程序员吗?答案是:看情况!我认为,具备治理思维和能力,自发开展自我革命,懂得坚持、不掉队的程序员才不会被代替;不管是手懒长期找不到正确解法的、心懒不愿景创新和变化的,还是脑懒孕育不出来新想法的,都有可能被代替,只是时间早晚。
附:Gartner新技术趋势曲线
技术成熟度曲线又叫技术循环曲线,或者直接叫做炒作周期,是指新技术、新概念在媒体上曝光度随时间的变化曲线。
1995年开始,高德纳(Gartner)咨询公司依其专业分析预测与推论各种新科技的成熟演变速度及要达到成熟所需的时间,分成5个阶段。
Gartner 2024年新兴技术成熟度曲线收录的25项颠覆性技术分为四大领域:自主AI、开发者生产力、全面体验以及以人为本的安全和隐私计划。
四、AI大模型学习路线
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案
大模型全套视频教程
200本大模型PDF书籍
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集
大模型产品经理资源合集
大模型项目实战合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
更多推荐
所有评论(0)