大模型|英伟达发布Fugatto音频生成模型
Anthropic发布模型上下文协议Anthropic公司近日发布了模型上下文协议(MCP),这是一款开源工具,旨在实现AI助手与所需信息的直接连接,以支持其回应或执行任务。MCP提供了一个通用接口,可连接至各类数据源,提升AI性能。与OpenAI近期测试的“与应用程序协同工作”功能不同,MCP适用于所有AI系统和数据源。通过MCP,开发者只需一次集成,便可连接任何数据源,避免为每个数据集编写自定
Anthropic发布模型上下文协议
Anthropic公司近日发布了模型上下文协议(MCP),这是一款开源工具,旨在实现AI助手与所需信息的直接连接,以支持其回应或执行任务。MCP提供了一个通用接口,可连接至各类数据源,提升AI性能。与OpenAI近期测试的“与应用程序协同工作”功能不同,MCP适用于所有AI系统和数据源。通过MCP,开发者只需一次集成,便可连接任何数据源,避免为每个数据集编写自定义代码的繁琐。目前,Replit、Codeium和Sourcegraph等编程软件已开始利用MCP构建AI代理,帮助用户完成任务。MCP的推出有望推动AI行业向代理型AI转型,促进AI系统与多数据源的高效连接。
英伟达发布Fugatto音频生成模型
英伟达推出了一款名为Fugatto的生成式AI模型,能够根据语言提示生成音乐和音频。与其他音频生成工具不同,Fugatto可以修改人声和现有音频,创造出全新的声音效果,例如将钢琴演奏转化为小提琴或人声演绎。这一模型还支持细致编辑,如改变音调、口音或情绪表达。尽管模型的输出基于现有数据源,但英伟达强调其创新能力,可叠加不同音频效果,生成独特的“声音景观”。例如,Fugatto可将火车声转化为管弦乐或将愉悦的声音转为愤怒的情感表现。视频展示了模型对音乐、游戏和创作领域的潜力。英伟达暂未公开发布Fugatto,出于安全考量,其团队正在研究如何安全向公众开放该技术。Fugatto的推出表明生成式AI正逐步改变音乐创作和音频设计领域,为创作者提供更多可能性。
苹果年度应用大奖:低调对待AI技术
苹果公布2024年度“iPhone应用大奖”入围名单,显示其仍倾向于传统iOS应用,如视频录制应用Kino、跑步计划应用Runna等。这些应用注重帮助用户完成具体任务,而非突出AI驱动的功能。尽管ChatGPT凭借语音聊天模式和网页搜索功能在市场上表现强劲,但未获任何提名,再次表明苹果对AI技术的低调态度。在45个入围应用中,AI驱动的应用寥寥无几。音乐练习工具Moises、语言学习应用EF Hello等虽带有AI功能,但大多未显著宣传其AI属性。苹果更关注赋能用户创造力的工具,如Procreate Dreams和Adobe Lightroom,展示出对传统生产力工具的偏爱。新增的Apple Vision Pro类别表明苹果正探索更多创新领域。然而,其整体策略依然强调帮助用户完成任务,而非依赖AI技术,凸显了苹果在应用生态系统中的独特定位。
语音代理平台赋能企业应用
PlayAI近日完成2100万美元种子轮融资,由Kindred Ventures领投,Race Capital等多家机构参与。这一资金将用于提升其语音代理平台的开发能力。该平台无需额外模型训练,可快速生成多语言、多风格的自然语音,为企业提供定制化语音AI代理。其最新推出的PlayDialog更新版本支持情感提示,生成具有语气和节奏的逼真语音,同时还发布了PlayNote工具,能高效将PDF、视频和文本转化为播客或演示文稿。Play 3.0 mini模型进一步扩展平台应用,支持30多种语言,覆盖医疗、零售等行业的语音交互场景。市场分析预测,AI语音生成行业未来十年将增长四倍。PlayAI凭借领先技术和灵活应用场景,有望成为企业语音AI解决方案的核心推动者。
Luma AI 推出图像生成新模型
Luma AI宣布推出全新图像生成模型Photon Image Model,并通过Dream Machine平台向创作者和开发者开放。这一高性能模型支持快速生成高质量图像和视频,处理速度比同类模型快800%,并确保用户隐私不被用于训练。Dream Machine平台新增详细提示和图像输入功能,用户可通过文本或图像精准创建复杂场景。同时,Dream Machine更新了直观界面和协作工具,进一步提升用户体验。Luma AI还发布了Photon Image API,允许开发者将其图像生成能力嵌入第三方应用。此外,平台新增多个订阅层级,最低9.99美元,最高99.99美元,面向从业余爱好者到企业用户的多样需求。Luma AI通过这一创新工具,致力于为创作者提供更强大的视觉生成支持,推动创意智能的广泛应用。
谷歌广告垄断案进入关键阶段
谷歌与美国司法部在弗吉尼亚州法庭结束了广告垄断案的闭幕陈述,案件核心在于谷歌是否利用其广告技术系统垄断市场。司法部指控谷歌通过其AdX交易所和发布商广告服务器等产品,压制竞争,阻止发布商设置更高价格。谷歌则辩称其面临激烈市场竞争,引用过往裁决否认垄断行为。法庭关注的焦点包括市场定义和谷歌的统一定价规则是否构成反竞争行为。谷歌删除聊天记录的行为亦成争议,司法部希望法庭推断不利于谷歌的结论。法官预计于2024年底前作出裁决,案件结果或将对数字广告行业产生深远影响。
谷歌向左Meta向右
谷歌与Meta在人工智能(AI)领域的战略差异显著。谷歌的核心业务依赖于搜索引擎广告收入,AI的引入可能削弱这一模式。相比之下,Meta通过AI增强其广告生态系统,提升广告投放效率和用户体验。例如,Meta的Advantage+工具利用AI优化广告展示,提高了广告价格和运营利润率。 此外,Meta还开发了生成式AI功能,帮助广告主创建更具吸引力的内容。 这些举措使Meta在AI应用中更具优势,而谷歌则面临在保持广告收入的同时有效整合AI的挑战。
AI虚构病症引发的信任危机
谷歌AI搜索因虚构病症“Kyloren综合症”引发公众担忧。这一伪造病症由Neuroskeptic于2017年为揭示科学出版漏洞而创造,原为讽刺性文章内容。然而,谷歌的Gemini模型不仅将其误读为真实病症,还添加了虚假的医学细节,表现出高度权威性和准确性。这表明AI在处理讽刺内容或非事实信息时的理解能力存在严重不足。相比之下,Perplexity和ChatGPT较少受误导,能够识别内容的虚假背景或原文意图。这一事件暴露了AI在引用和理解信息时的局限性,以及缺乏对来源上下文的有效解读。传统搜索引擎能识别虚假信息,但AI搜索工具在面对复杂或讽刺性内容时表现出明显缺陷。此外,各大AI公司对错误率问题保持沉默,未系统追踪或公开错误统计数据,进一步加剧了公众对AI工具传播错误信息的担忧。这一案例凸显了加强AI内容审核机制和提升语境理解能力的紧迫性,同时呼吁更透明的错误率披露和改进方向。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)