文本生成

Transformer架构 - 语义

在这里插入图片描述

Transformer架构 - 简介

在这里插入图片描述

Transformer架构 - 组成

在这里插入图片描述

创意编程

最小可行性产品

在这里插入图片描述

氛围编程与MVP开发

发展阶段

  • 传统IDE阶段:2000年 - 2020年
  • AI辅助编程:2021年 - 2024年
  • 氛围编程阶段:2025年 - 至今

编程模式
在这里插入图片描述

图像生成

扩散模型原理

在这里插入图片描述

常用生图模型

  • Stable Diffusion
    • 作为一个开源模型,Stable Diffusion允许哟哦平衡访问模型的checkpoint,并灵活地微调模型以生成各种风格的图像
  • Mid Journey
    • MJ以其艺术性和风格多样性著称,可以在提示词较少的条件下生成质量相对较高的图像
  • Flux
    • 其核心采用了扩散Transformer架构,可以根据文本描述生成高保真图像
  • DALL-E 3
    • 由OpenAI开发,能够从自然语言描述中创建逼真的图像,各方面特点较为均衡,并且在将文本嵌入生成的图像中表现出色

提示词工程

基础构建:提示词要素
  • 主体:精准表述核心对象
    • 主体可以是一个人,地方或事物,任何构成你尝试提示实现目标的核心事物
  • 修饰语:风格强化
    • 添加描述性的单词或短语,缩小生成的响应范围,确保AI保持在跟踪并提供与主题直接相关的信息
  • 形容词:描述细节
    • 添加描述性的细节,为创作提供了更多的方向和特异性
  • 副词:引导画面调性
    • 提供有关如何执行操作的信息来修改动词
  • 介词:表示句子中元素间的关系
    • 为算法做什么,提供上下文和方向
固化提示词:锁定关键特征

通过单词或短语组成巩固词,为提示词增加更清晰和特异性的指示

变化提示词:产生多样性和独特性
权重提示词:分配优先级

将特定值和权重分配给提示词的不同部分,从而影响生成的结果

在这里插入图片描述

AI艺术创作

基础描述公式

[主体对象] + [细节特征] + [环境场景] + [艺术风格] + [画质参数]

一只毛发蓬松的布偶猫(主体),瞳孔呈琥珀色,佩戴镶有蓝宝石的银质项圈(细节),站立于覆盖藤蔓的中世纪城堡露台(场景)。
朦胧的晨雾与逆光渲染(氛围),新古典主义油画风格(艺术风格)。8k 分辨率,超精细纹理(画质)。
风格迁移公式

[主题描述] + [艺术家/作品风格] + [媒介质感] + [时代特征]

末日废墟中的机械蝴蝶(主题),结合萨尔瓦多达利的超现实主义与葛饰北斋浮世绘的波浪纹理(风格),
青铜锈蚀与全系投影的混合材质(质感),22世纪科幻废土美学(时代)。
抽象概念具象化公式

[抽象概念] + [隐喻符号] + [色彩情绪] + [构图手法]

表现时间流逝,破碎的沙漏与生长藤蔓缠绕的钟表,灰蓝色主调与零星的金色光斑,倾斜构图与动态模糊,超现实摄影胶片颗粒质感。
负面提示词防御体系

**[通用缺陷] + [风格冲突] + [内容禁忌] **

负面提示词:低分辨率,模糊,畸变手指,多余肢体,水印,文字,卡通风格(若生成写实需求),过度曝光,塑料质感,恐怖元素。

在这里插入图片描述

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐