最先进PHP大模型深度学习库TransformersPHP
## 概述
> 最先进的PHP机器学习。在PHP项目中原生运行Transformer
TransformersPHP是一个工具包,PHP开发人员可以轻松地将机器学习魔法添加到他们的项目中。你可能听说过Hugging Face的Python库,它以处理文本而闻名,比如总结长文章,在语言之间进行翻译,甚至是与图像和音频相关的任务。Transformers PHP将这种能力带到了PHP世界。
TransformersPHP被设计为在功能上等同于Python库,同时仍然保持相同的性能和易用性。这个库建立在Hugging Face的Transformers库之上,该库提供了100多种语言的数千个预训练模型。它被设计成一个简单易用的库,供PHP开发人员使用类似于Python库的API。这些模型可用于各种任务,包括文本生成、摘要、翻译等。
TransformersPHP使用ONNX运行时来运行模型,这是开放神经网络交换(ONNX)模型的高性能评分引擎。您可以轻松地将任何PyTorch或TensorFlow模型转换为ONNX,并使用🤗TensorOptimum与TransformersPHP一起使用。
### 使用预训练模型
TransformersPHP背后的核心思想是让你使用已经训练好的模型。“预训练模型”只是从大量文本数据中获得和学习的机器学习模型。它们已经准备好开箱即用,可以执行各种任务。使用TransformersPHP,这些模型直接在PHP应用程序中运行。这意味着您不需要使用外部服务或API来处理数据。一切都发生在本地,在你的服务器上。
### 什么是ONNX?
ONNX引擎看起来似乎是一个复杂的术语,但它本质上是一个高性能引擎,旨在推断和加速机器学习模型。开放神经网络交换(ONNX)格式是该引擎的核心,是机器学习模型的通用格式。这意味着无论最初使用哪个框架来训练模型-无论是PyTorch,TensorFlow,JAX,甚至是经典的机器学习库,如scikit-learn,LightGBM,XGBoost等-可以转换为ONNX格式。这种格式可以在不同的平台上高效运行,包括PHP应用程序。
### 灵感
TransformersPHP的开发受到Xenova/transformers项目的启发,Xenova/transformers项目也是一个类似的使用ONNX运行时的JavaScript项目。这种共享的灵感意味着大多数为Xenova/transformers准备的模型也与TransformersPHP兼容。它在机器学习世界和PHP开发之间创建了一个无缝的桥梁,允许您在应用程序中利用强大的模型。
## 快速浏览
> Python
```python
from transformers import pipeline
# Allocate a pipeline for sentiment-analysis
pipe = pipeline('sentiment-analysis')
out = pipe('I love transformers!')
# [{'label': 'POSITIVE', 'score': 0.999806941}]
```
> PHP
```php
use function Codewithkyrian\Transformers\Pipelines\pipeline;
// Allocate a pipeline for sentiment-analysis
$pipe = pipeline('sentiment-analysis');
$out = $pipe('I love transformers!');
// [{'label': 'POSITIVE', 'score': 0.999808732}]
```
> Javascript
```js
import {pipeline} from '@xenova/transformers';
// Allocate a pipeline for sentiment-analysis
let pipe = await pipeline('sentiment-analysis');
let out = await pipe('I love transformers!');
// [{'label': 'POSITIVE', 'score': 0.999817686}]
```
你可以看到它在不同语言之间是多么的相似,如果你在它们之间切换或学习一种新的语言,这会让你更容易。
## 特性
* **本地模型执行**。直接在PHP项目中部署大量NLP模型,无需依赖外部API即可实现语言理解、文本生成等功能。
* **易于集成**。轻松地将高级AI功能嵌入到您的PHP应用程序中,通过文本分类和实体识别等功能对其进行增强。
* **针对性能进行了优化**。享受快速处理和高效的资源使用,允许跨任何规模的项目提供可扩展的AI解决方案,而不会牺牲速度或性能。
## 安装
您可以通过Composer安装库。这是安装库的推荐方法:
```
composer require codewithkyrian/transformers
```
TransformersPHP所需的所有共享库都将自动安装。如果由于某种原因失败,您可以使用以下命令手动安装它们:
```
./vendor/bin/transformers install
```
> 说明:共享库是特定于平台的,因此在执行代码的目标平台上运行`composer`require或`transformers install`命令非常重要。在大多数情况下,这将是您的开发机器或部署应用程序的服务器,但如果您使用Docker容器,请在该容器中运行`composer require`命令。
就是这样!现在您已经准备好在PHP应用程序中使用TransformersPHP了。
## 预下载模型
默认情况下,当您第一次使用管道或预训练模型时,TransformersPHP会自动从Hugging Face模型中心检索模型权重(ONNX格式)。为了节省时间并增强用户体验,最好提前下载ONNX型号权重,尤其是对于较大的型号。TransformersPHP包含一个命令行工具来促进这一点:
```
./vendor/bin/transformers download <model_name_or_path> [<task>] [options]
```
例如,要下载`Xenova/bert-base-uncased`模型,您可以运行:
```
./vendor/bin/transformers download Xenova/bert-base-uncased
```
## 基本用法
开始使用TransformersPHP的最快和最直接的方法是通过管道API。如果您熟悉Python的Transformers库,您会发现这种方法非常相似。它是一个用户友好的API,将模型与特定任务的所有必要预处理和后处理步骤捆绑在一起。
### 创建管道
要创建管道,您需要指定要使用它的任务。例如,如果你想使用一个管道进行情感分析,你可以创建一个这样的管道:
```
use function Codewithkyrian\Transformers\Pipelines\pipeline;
$classifier = pipeline('sentiment-analysis');
```
第一次运行时,TransformersPHP将下载并缓存默认的预训练模型,以进行即时情绪分析。这个初始设置可能需要一点时间,但随后的运行会快得多。
### 使用不同的模型
每个任务都有一个用于推理的默认模型。但是,您可以指定要使用的其他模型:
```
$classifier = pipeline('sentiment-analysis', 'Xenova/bert-base-multilingual-uncased-sentiment');
```
您还可以指定是否应使用量化模型(默认值为`true`):
```
$classifier = pipeline('sentiment-analysis', quantized: false);
```
### 使用流水线
现在你已经有了管道,使用它就像调用一个函数一样简单。只需提供您想要分析的文本即可:
```
$result = $classifier('I love TransformersPHP!');
```
你会得到情感分析结果
```
['label' => 'POSITIVE', 'score' => 0.9995358059835]
```
你不限于一次一个文本,你也可以传递一个文本数组来获得多个分析:
```
$results = $classifier([
'I love TransformersPHP!',
'I hate TransformersPHP!',
]);
```
输出将为您提供每个文本的情感评分
```
[
['label' => 'POSITIVE', 'score' => 0.99980061678407],
['label' => 'NEGATIVE', 'score' => 0.99842234422764],
]
```
- 设计模式系列
- 工厂方法模式
- 序言
- Windows程序注册为服务的工具WinSW
- 基础
- 安装
- 开发规范
- 目录结构
- 配置
- 快速入门
- 架构
- 请求流程
- 架构总览
- URL访问
- 容器和依赖注入
- 中间件
- 事件
- 代码层结构
- 四个层次
- 路由
- 控制器
- 请求
- 响应
- 数据库
- MySQL实时同步数据到ES解决方案
- 阿里云DTS数据MySQL同步至Elasticsearch实战
- PHP中的MySQL连接池
- PHP异步非阻塞MySQL客户端连接池
- 模型
- 视图
- 注解
- @SpringBootApplication(exclude={DataSourceAutoConfiguration.calss})
- @EnableFeignClients(basePackages = "com.wotu.feign")
- @EnableAspectJAutoProxy
- @EnableDiscoveryClient
- 错误和日志
- 异常处理
- 日志处理
- 调试
- 验证
- 验证器
- 验证规则
- 扩展库
- 附录
- Spring框架知识体系详解
- Maven
- Maven和Composer
- 构建Maven项目
- 实操课程
- 01.初识SpringBoot
- 第1章 Java Web发展史与学习Java的方法
- 第2章 环境与常见问题踩坑
- 第3章 springboot的路由与控制器
- 02.Java编程思想深度理论知识
- 第1章 Java编程思想总体
- 第2章 英雄联盟的小案例理解Java中最为抽象的概念
- 第3章 彻底理解IOC、DI与DIP
- 03.Spring与SpringBoot理论篇
- 第1章 Spring与SpringBoot导学
- 第2章 Spring IOC的核心机制:实例化与注入
- 第3章 SpringBoot基本配置原理
- 04.SprinBoot的条件注解与配置
- 第1章 conditonal 条件注解
- 第2章 SpringBoot自动装配解析
- 05.Java异常深度剖析
- 第1章 Java异常分类剖析与自定义异常
- 第2章 自动配置Url前缀
- 06.参数校验机制与LomBok工具集的使用
- 第1章 LomBok工具集的使用
- 第2章 参数校验机制以及自定义校验
- 07.项目分层设计与JPA技术
- 第1章 项目分层原则与层与层的松耦合原则
- 第2章 数据库设计、实体关系与查询方案探讨
- 第3章 JPA的关联关系与规则查询
- 08.ORM的概念与思维
- 第1章 ORM的概念与思维
- 第2章 Banner等相关业务
- 第3章 再谈数据库设计技巧与VO层对象的技巧
- 09.JPA的多种查询规则
- 第1章 DozerBeanMapper的使用
- 第2章 详解SKU的规格设计
- 第3章 通用泛型Converter
- 10.令牌与权限
- 第1章 通用泛型类与java泛型的思考
- 常见问题
- 微服务
- demo
- PHP中Self、Static和parent的区别
- Swoole-Cli
- 为什么要使用现代化PHP框架?
- 公众号
- 一键部署微信公众号Markdown编辑器(支持适配和主题设计)
- Autodesigner 2.0发布
- Luya 一个现代化PHP开发框架
- PHPZip - 创建、读取和管理 ZIP 文件的简单库
- 吊打Golang的PHP界天花板webman压测对比
- 简洁而强大的 YAML 解析库
- 推荐一个革命性的PHP测试框架:Kahlan
- ServBay下一代Web开发环境
- 基于Websocket和Canvas实现多人协作实时共享白板
- Apipost预执行脚本如何调用外部PHP语言
- 认证和授权的安全令牌 Bearer Token
- Laradock PHP 的 Docker 完整本地开发环境
- 高效接口防抖策略,确保数据安全,避免重复提交的终极解决方案!
- TIOBE 6月榜单:PHP稳步前行,编程语言生态的微妙变化
- Aho-Corasick字符串匹配算法的实现
- Redis键空间通知 Keyspace Notification 事件订阅
- ServBay如何启用并运行Webman项目
- 使用mpdf实现导出pdf文件功能
- Medoo 轻量级PHP数据库框架
- 在PHP中编写和运行单元测试
- 9 PHP运行时基准性能测试
- QR码生成器在PHP中的源代码
- 使用Gogs极易搭建的自助Git服务
- Gitea
- webman如何记录SQL到日志?
- Sentry PHP: 实时监测并处理PHP应用程序中的错误
- Swoole v6 Alpha 版本已发布
- Proxypin
- Rust实现的Redis内存数据库发布
- PHP 8.4.0 Alpha 1 测试版本发布
- 121
- Golang + Vue 开发的开源轻量 Linux 服务器运维管理面板
- 内网穿透 FRP VS Tailscale
- 新一代开源代码托管平台Gitea
- 微服务系列
- Nacos云原生配置中心介绍与使用
- 轻量级的开源高性能事件库libevent
- 国密算法
- 国密算法(商用密码)
- GmSSL 支持国密SM2/SM3/SM4/SM9/SSL 密码工具箱
- GmSSL PHP 使用
- 数据库
- SQLite数据库的Web管理工具
- 阿里巴巴MySQL数据库强制规范
- PHP
- PHP安全测试秘密武器 PHPGGC
- 使用declare(strict_types=1)来获得更健壮的PHP代码
- PHP中的魔术常量
- OSS 直传阿里腾讯示例
- PHP源码编译安装APCu扩展实现数据缓存
- BI性能DuckDB数据管理系统
- 为什么别人可以是架构师!而我却不是?
- 密码还在用 MD5 加盐?不如试试 password_hash
- Elasticsearch 在电商领域的应用与实践
- Cron 定时任务入门
- 如何动态设置定时任务!而不是写死在Linux Crontab
- Elasticsearch的四种查询方式,你知道多少?
- Meilisearch vs Elasticsearch
- OpenSearch vs Elasticsearch
- Emlog 轻量级开源博客及建站系统
- 现代化PHP原生协程引擎 PRipple
- 使用Zephir编写C扩展将PHP源代码编译加密
- 如何将PHP源代码编译加密,同时保证代码能正常的运行
- 为什么选择Zephir给PHP编写动态扩展库?
- 使用 PHP + XlsWriter实现百万级数据导入导出
- Rust编写PHP扩展
- 阿里云盘开放平台对接进行文件同步
- 如何构建自己的PHP静态可执行文件
- IM后端架构
- RESTful设计方法和规范
- PHP编译器BPC 7.3 发布,成功编译ThinkPHP8
- 高性能的配置管理扩展 Yaconf
- PHP实现雪花算法库 Snowflake
- PHP官方现代化核心加密库Sodium
- pie
- 现代化、精简、非阻塞PHP标准库PSL
- PHP泛型和集合
- 手把手教你正确使用 Composer包管理
- JWT双令牌认证实现无感Token自动续期
- 最先进PHP大模型深度学习库TransformersPHP
- PHP如何启用 FFI 扩展
- PHP超集语言PXP
- 低延迟双向实时事件通信 Socket.IO
- PHP OOP中的继承和多态
- 强大的现代PHP高级调试工具Kint
- PHP基金会
- 基于webman+vue3高质量中后台框架SaiAdmin
- 开源免费的定时任务管理系统:Gocron
- 简单强大OCR工具EasyOCR在PHP中使用
- PHP代码抽象语法树工具PHP AST Viewer
- MySQL数据库管理工具PHPMyAdmin
- Rust编写的一款高性能多人代码编辑器Zed
- 超高性能PHP框架Workerman v5.0.0-beta.8 发布
- 高并发系列
- 入门介绍及安装
- Lua脚本开发 Hello World
- 执行流程与阶段详解
- Nginx Lua API 接口开发
- Lua模块开发
- OpenResty 高性能的正式原因
- 记一次查找 lua-resty-mysql 库 insert_id 的 bug
- 包管理工具OPM和LuaRocks使用
- 异步非阻塞HTTP客户端库 lua-resty-http
- Nginx 内置绑定变量
- Redis协程网络库 lua-resty-redis
- 动态HTML渲染库 lua-testy-template
- 单独的
- StackBlitz在线开发环境
- AI
- 基础概念
- 12312
- 基础镜像的坑
- 利用phpy实现 PHP 编写 Vision Transformer (ViT) 模型
- 语义化版本 2.0.0