### `LLM`
LLM(`Large Language Models`)指的是大型语言模型。这些模型是自然语言处理(NLP)技术的一部分,使用深度学习训练来理解、生成、翻译文本,甚至执行特定的语言相关任务,如问答、文本摘要、编程代码生成等。LLM根据大量文本数据进行训练,以理解语言的结构、含义和上下文。
LLM的关键特征之一是其规模,即模型中包含的参数数量非常庞大。这些参数帮助模型捕获语言的复杂性和细微差别。随着模型规模的增加,它们的理解能力和生成文本的质量也会提高,但同时也会增加所需的计算资源和训练时间。
### `AGI`
AGI(`Artificial General Intelligence`)也称为通用人工智能,指的是一种具有广泛智能的机器,能够理解、学习和应用知识,并能够在宽广范围的环境和任务中进行自主学习、推理、适应和创造,与人类智能相似或等同的水平。
区别于目前广泛应用的专业人工智能(AI)系统,这些系统通常优化和设计用来解决特定问题(如图像识别、语言翻译等),AGI能够跨领域工作,不仅局限于一个具体领域或任务。
AGI的实现将标志着一个重大科技进展,但同时也引发了许多伦理和安全的考量。目前AGI仍然是人工智能领域的一个长期目标,并且尚未实现。
### `AIGC`
AIGC(`Artificial Intelligence Generated Content`)即为人工智能生成内容,是一种内容生产形式。例如AI文字续写,文字转像的AI图、AI主持人等,都属于AIGC的应用。
### AI Agent
`AI Agent` 即智能代理,是一种基于人工智能技术的软件实体,它能够在一定的环境下自主感知信息、处理数据、并采取行动以实现特定目标。这种智能代理能够模拟人类的工作和思考方式,通过类似人类的独立思考和行动来完成一系列简单或复杂的任务。
大语言模型 (`LLM`) 仅限于它们所训练的知识,并且这些知识很快就会过时(每天用最新信息重新训练这么大的模型是不可行的),`LLM`的一些局限主要包括:
* 会产生幻觉
* 结果并不总是真实的
* 对时事的了解有限或一无所知
* 很难应对复杂的计算。
这就是`AI Agent`的用武之地,它可以利用外部工具来克服这些限制。可以将`Agent`视为人工智能大脑或`LLM`操作系统,它使用`LLM`进行推理、计划和采取行动。
### 智能体 `Bot`
是平台对`AI Agent`的抽象定义,即人工智能代理,是一个能够根据人类目标自主思考和规划任务的程序或实体。可以将智能体视为人工智能大脑或`LLM`操作系统,它使用`LLM`进行推理、计划和采取行动(调用工具)。
实际使用过程中,我们更建议为某个具体的应用场景创建专门的智能体,而不是什么工作都交给同一个智能体,只有让智能体做更专注的事情才能做的更加专业。
### 提示词 `Prompt`
简单的理解它是给 AI 模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。AI 模型会基于 prompt 所提供的信息,生成对应的文本或者图片。
针对智能体的提示词可能和对话的提示词略有不同,对话过程中的提示词上下文最多只有5条,智能体的编排提示词可以一直生效,而且通常具有一定的格式规范,更利于智能体执行任务。平台也预设了一些常用的智能体提示词可供用户选择。
### `RAG`
RAG(`Retrieval-Augmented Generation 检索增强生成`)是一种结合了信息检索和文本生成技术的自然语言处理方法,它通过检索相关信息来辅助生成更准确和丰富的文本输出。
RAG的一个关键优势是它可以有效地处理那些不仅依赖于通用知识,而且还需要特定信息源或文档中的知识才能回答的问题。通过直接利用这些来源中的信息,RAG能够提供更加准确和信息含量更高的输出。
### 知识库 `Knowledge Base`
知识库指用于提供信息检索支持的大规模数据集合,包括用户上传到平台的各类文档、表格、数据表等资料,便于用户组织、管理领域知识,知识库可以理解为数据源。
知识库在RAG方案中的作用是多方面的:
* **信息源**:为生成模型提供丰富的背景信息和事实依据,使生成内容更加丰富和准确。
* **提升效率**:通过预先建立的知识库进行检索,可以减少生成模型需要从头计算或推理的信息量,提升处理速度和效率。
* **增强准确性和相关性**:基于检索到的与查询直接相关的信息,生成的内容更加贴近用户的实际需求,提升了回答的准确性和相关性。
因此,在RAG方案中,知识库的构建和质量直接影响到系统的整体性能,包括生成内容的准确度、丰富性和用户满意度。
### 多模态 `Multi Modal`
多模态指的是结合使用两种或两种以上不同类型的模式或信号来进行信息的表达、交流或处理。在计算机科学和人工智能领域,多模态通常涉及到结合文本、图像、音频、视频以及其他传感器数据来提升算法的理解、分析和生成能力。
多模态方法可以帮助系统更全面地理解复杂的信息场景,提高信息处理的效率和效果。
### 多路召回 `Multi-channel Recall`
多路召回是自然语言处理(NLP)和推荐系统中的一种常见策略,旨在从多个维度或渠道同时检索信息或物品,以提高召回质量和覆盖率。在这种策略中,系统会利用多个独立的算法或模型,每个算法或模型专注于从一个特定的角度或依据一个特定的特征来检索信息。
这些不同的召回渠道之后可以被合并或进一步处理,以生成一个综合的、多样化的结果集,从而提高最终推荐或检索结果的准确性和多样性。多路召回在提升用户体验和满足不同用户需求方面发挥着重要作用。
### 微调 `Fine-Tuning`
模型微调(`Model Fine-tuning`)是一种机器学习方法,特别是在深度学习领域中常见。这种方法涉及到在一个预训练的模型基础上,通过对模型进行额外的训练(或“微调”),使其更好地适应于特定任务或数据集。在模型微调过程中,通常会采用较小的学习率,对预训练模型的权重进行小幅度调整,以达到提高模型在特定任务上表现的目的。
模型微调的特点是能够利用预训练模型已经学到的知识,从而在数据量较少的情况下也能达到较好的性能,加速模型的训练过程并提高模型的泛化能力。
### 对齐`Alignment`
人工智能中的对齐是指引导人工智能系统的行为,使其符合设计者的利益和预期目标。一个已对齐的人工智能的行为会向着预期方向发展;而未对齐的人工智能的行为虽然也具备特定目标,但此目标并非设计者所预期。
### Token
在自然语言处理中,我们通常将文本拆分为一个个离散的token,以便于计算机理解和处理在GPT模型中,token是模型接收的最小单位。模型在训练和生成文本时,将输入的文本序列划分为一系列的token,并通过对这些token进行处理和分析来生成响应。
例如:在一个对话中,一句话可以被划分为多个token,包括单词、标点符号等。每个token都有一个对应的编码表示,通常是一个整数。这些编码将文本转换为模型能够处理的数值形式。在使用ChatGPT时,用户通常需要了解自己的输入文本中有多少个token,以确保不超过模型的最大输入限制。
需要注意的是,不同的模型和工具可能对token的定义和处理方式有所不同但总体来说token是指文本处理和分析的最小单位,通常1Token的内容为5 字节的文本,但由于字符编码问题,不同中文字符的token数量并不是固定的,一般通过类OpenAI的接口调用会返回当前内容的token数量大小。
### 向量 `Vector`
向量,物理、工程等也称作矢量、欧几里得向量(`Euclidean vector`) 是数学、物理学和工程科学等多个自然科学中的基本概念。指一个同时具有大小和方向,且满足平行四边形法则的几何对象。理论数学中向量的定义为任何在称为向量空间的代数结构中的元素。
一般地,同时满足具有大小和方向两个性质的几何对象即可认为是向量。向量常常在以符号加箭头标示以区别于其它量。与向量相对的概念称标量、纯量、数量,即只有大小、绝大多数情况下没有方向(电流是特例)、不满足平行四边形法则的量。
### 向量数据库 `Vector Database`
向量数据库是基于智能算法提取需存储内容的特征,转变成具有大小定义、特征描述、空间位置的多维数值进行向量化存储的数据库,使内容不仅可被存储,同时可被智能检索与分析。
### 工具 `Tool`
是平台对智能体能力的抽象,通过工具的配置和组合可以实现多种业务场景需求,工具可以被实际关联到智能体的扩展能力,目前平台提供的工具包括大模型能力(文生图等)、联网查询(必应搜索)、知识库检索(知识管理检索)、函数调用(各种接口)等类型,将来还会拓展更多的工具类型。
- 设计模式系列
- 工厂方法模式
- 序言
- Windows程序注册为服务的工具WinSW
- 基础
- 安装
- 开发规范
- 目录结构
- 配置
- 快速入门
- 架构
- 请求流程
- 架构总览
- URL访问
- 容器和依赖注入
- 中间件
- 事件
- 代码层结构
- 四个层次
- 路由
- 控制器
- 请求
- 响应
- 数据库
- MySQL实时同步数据到ES解决方案
- 阿里云DTS数据MySQL同步至Elasticsearch实战
- PHP中的MySQL连接池
- PHP异步非阻塞MySQL客户端连接池
- 模型
- 视图
- 注解
- @SpringBootApplication(exclude={DataSourceAutoConfiguration.calss})
- @EnableFeignClients(basePackages = "com.wotu.feign")
- @EnableAspectJAutoProxy
- @EnableDiscoveryClient
- 错误和日志
- 异常处理
- 日志处理
- 调试
- 验证
- 验证器
- 验证规则
- 扩展库
- 附录
- Spring框架知识体系详解
- Maven
- Maven和Composer
- 构建Maven项目
- 实操课程
- 01.初识SpringBoot
- 第1章 Java Web发展史与学习Java的方法
- 第2章 环境与常见问题踩坑
- 第3章 springboot的路由与控制器
- 02.Java编程思想深度理论知识
- 第1章 Java编程思想总体
- 第2章 英雄联盟的小案例理解Java中最为抽象的概念
- 第3章 彻底理解IOC、DI与DIP
- 03.Spring与SpringBoot理论篇
- 第1章 Spring与SpringBoot导学
- 第2章 Spring IOC的核心机制:实例化与注入
- 第3章 SpringBoot基本配置原理
- 04.SprinBoot的条件注解与配置
- 第1章 conditonal 条件注解
- 第2章 SpringBoot自动装配解析
- 05.Java异常深度剖析
- 第1章 Java异常分类剖析与自定义异常
- 第2章 自动配置Url前缀
- 06.参数校验机制与LomBok工具集的使用
- 第1章 LomBok工具集的使用
- 第2章 参数校验机制以及自定义校验
- 07.项目分层设计与JPA技术
- 第1章 项目分层原则与层与层的松耦合原则
- 第2章 数据库设计、实体关系与查询方案探讨
- 第3章 JPA的关联关系与规则查询
- 08.ORM的概念与思维
- 第1章 ORM的概念与思维
- 第2章 Banner等相关业务
- 第3章 再谈数据库设计技巧与VO层对象的技巧
- 09.JPA的多种查询规则
- 第1章 DozerBeanMapper的使用
- 第2章 详解SKU的规格设计
- 第3章 通用泛型Converter
- 10.令牌与权限
- 第1章 通用泛型类与java泛型的思考
- 常见问题
- 微服务
- demo
- PHP中Self、Static和parent的区别
- Swoole-Cli
- 为什么要使用现代化PHP框架?
- 公众号
- 一键部署微信公众号Markdown编辑器(支持适配和主题设计)
- Autodesigner 2.0发布
- Luya 一个现代化PHP开发框架
- PHPZip - 创建、读取和管理 ZIP 文件的简单库
- 吊打Golang的PHP界天花板webman压测对比
- 简洁而强大的 YAML 解析库
- 推荐一个革命性的PHP测试框架:Kahlan
- ServBay下一代Web开发环境
- 基于Websocket和Canvas实现多人协作实时共享白板
- Apipost预执行脚本如何调用外部PHP语言
- 认证和授权的安全令牌 Bearer Token
- Laradock PHP 的 Docker 完整本地开发环境
- 高效接口防抖策略,确保数据安全,避免重复提交的终极解决方案!
- TIOBE 6月榜单:PHP稳步前行,编程语言生态的微妙变化
- Aho-Corasick字符串匹配算法的实现
- Redis键空间通知 Keyspace Notification 事件订阅
- ServBay如何启用并运行Webman项目
- 使用mpdf实现导出pdf文件功能
- Medoo 轻量级PHP数据库框架
- 在PHP中编写和运行单元测试
- 9 PHP运行时基准性能测试
- QR码生成器在PHP中的源代码
- 使用Gogs极易搭建的自助Git服务
- Gitea
- webman如何记录SQL到日志?
- Sentry PHP: 实时监测并处理PHP应用程序中的错误
- Swoole v6 Alpha 版本已发布
- Proxypin
- Rust实现的Redis内存数据库发布
- PHP 8.4.0 Alpha 1 测试版本发布
- 121
- Golang + Vue 开发的开源轻量 Linux 服务器运维管理面板
- 内网穿透 FRP VS Tailscale
- 新一代开源代码托管平台Gitea
- 微服务系列
- Nacos云原生配置中心介绍与使用
- 轻量级的开源高性能事件库libevent
- 国密算法
- 国密算法(商用密码)
- GmSSL 支持国密SM2/SM3/SM4/SM9/SSL 密码工具箱
- GmSSL PHP 使用
- 数据库
- SQLite数据库的Web管理工具
- 阿里巴巴MySQL数据库强制规范
- PHP
- PHP安全测试秘密武器 PHPGGC
- 使用declare(strict_types=1)来获得更健壮的PHP代码
- PHP中的魔术常量
- OSS 直传阿里腾讯示例
- PHP源码编译安装APCu扩展实现数据缓存
- BI性能DuckDB数据管理系统
- 为什么别人可以是架构师!而我却不是?
- 密码还在用 MD5 加盐?不如试试 password_hash
- Elasticsearch 在电商领域的应用与实践
- Cron 定时任务入门
- 如何动态设置定时任务!而不是写死在Linux Crontab
- Elasticsearch的四种查询方式,你知道多少?
- Meilisearch vs Elasticsearch
- OpenSearch vs Elasticsearch
- Emlog 轻量级开源博客及建站系统
- 现代化PHP原生协程引擎 PRipple
- 使用Zephir编写C扩展将PHP源代码编译加密
- 如何将PHP源代码编译加密,同时保证代码能正常的运行
- 为什么选择Zephir给PHP编写动态扩展库?
- 使用 PHP + XlsWriter实现百万级数据导入导出
- Rust编写PHP扩展
- 阿里云盘开放平台对接进行文件同步
- 如何构建自己的PHP静态可执行文件
- IM后端架构
- RESTful设计方法和规范
- PHP编译器BPC 7.3 发布,成功编译ThinkPHP8
- 高性能的配置管理扩展 Yaconf
- PHP实现雪花算法库 Snowflake
- PHP官方现代化核心加密库Sodium
- pie
- 现代化、精简、非阻塞PHP标准库PSL
- PHP泛型和集合
- 手把手教你正确使用 Composer包管理
- JWT双令牌认证实现无感Token自动续期
- 最先进PHP大模型深度学习库TransformersPHP
- PHP如何启用 FFI 扩展
- PHP超集语言PXP
- 低延迟双向实时事件通信 Socket.IO
- PHP OOP中的继承和多态
- 强大的现代PHP高级调试工具Kint
- PHP基金会
- 基于webman+vue3高质量中后台框架SaiAdmin
- 开源免费的定时任务管理系统:Gocron
- 简单强大OCR工具EasyOCR在PHP中使用
- PHP代码抽象语法树工具PHP AST Viewer
- MySQL数据库管理工具PHPMyAdmin
- Rust编写的一款高性能多人代码编辑器Zed
- 超高性能PHP框架Workerman v5.0.0-beta.8 发布
- 高并发系列
- 入门介绍及安装
- Lua脚本开发 Hello World
- 执行流程与阶段详解
- Nginx Lua API 接口开发
- Lua模块开发
- OpenResty 高性能的正式原因
- 记一次查找 lua-resty-mysql 库 insert_id 的 bug
- 包管理工具OPM和LuaRocks使用
- 异步非阻塞HTTP客户端库 lua-resty-http
- Nginx 内置绑定变量
- Redis协程网络库 lua-resty-redis
- 动态HTML渲染库 lua-testy-template
- 单独的
- StackBlitz在线开发环境
- AI
- 基础概念
- 12312
- 基础镜像的坑
- 利用phpy实现 PHP 编写 Vision Transformer (ViT) 模型
- 语义化版本 2.0.0