>原文地址:https://developer.piwik.org/guides/how-piwik-works
翻译工具:Chrome自带,有些不通常的地方,人工修改了一下,英语太菜,见谅
#### 介绍
Piwik是一个应用程序,主要有两件事情:
- 收集和存储分析数据
- 提供存储数据的报告
为了实现这一结果,派维克的几个部分发挥作用:
- Piwik的JavaScript的跟踪器,包含在网页中
- 跟踪器收集包含在其中的网页上的数据,并通过调用HTTP跟踪API将其发送给Piwik
- 该归档任务运行和前处理数据(无论是在飞行中或通过定期任务)
- 数据在报告中公开,可通过Web界面或HTTP报告API访问
#### 插件架构
Piwik的代码库包括:
- Piwik Core,它提供了应用程序的基础以及扩展点
- 插件,使用扩展点添加行为和内容到应用程序
插件不仅仅针对要定制Piwik的第三方开发人员:Piwik的大部分都是通过插件实现的。派维克核心意图尽可能的小。
因此,有两种插件:
- 默认插件提供Piwik的基本功能:它们包含在存储库和发行版中
- 可以手动安装可选插件(通过将其复制到plugins/文件夹中)或通过Web界面中的Piwik的MarketPlace进行安装
- 代码库
以下是构成Piwik代码库的主要文件和文件夹:
```shell
config/
core/ # Piwik Core类
lang/ # 翻译
plugins/ # 插件类及其资产
tests/
vendor/ # 由Composer安装的库
console # CLI界面的入口点
index.php # Web应用程序和HTTP报告API的入口点
piwik.php # HTTP跟踪API的入口点
piwik.js # JavaScript跟踪器,需要在网站中包含piwik.js
```
Piwik使用Composer将其依赖项(PHP库)安装到vendor/目录中。
#### 接口
##### Web应用程序
Web应用程序的入口点index.php位于根目录中。该文件初始化所有内容并调用FrontController该类。
前端控制器将根据URL参数将传入的HTTP请求路由到插件控制器:
```html
/index.php?module=CoreHome&action=index&…
```
在这个例子中,前端控制器将调用插件index控制器上的动作CoreHome。
插件控制器返回在HTTP响应中发送的视图(通常为HTML内容)。
##### 用户界面
Piwik的用户界面基于HTML和JavaScript。虽然一些页面是由PHP控制器(使用Twig模板引擎构建)提供的HTML文档,但Piwik UI的某些部分是由AngularJS构建的。
AngularJS是一个前端JavaScript框架,这意味着用户界面构建在客户端,数据从HTTP报告API中以JSON格式获取。这也意味着更好的用户体验,因为它让Piwik开发人员构建了一个更加动态和反应灵活的应用程序。
派维克的长期路线图的一部分是将派维克UI的越来越多的部分移到AngularJS。
在“使用Piwik的UI”指南中阅读更多信息。
##### HTTP报表API
HTTP报告API与Web应用程序类似。它的作用是以机器可读格式(XML,JSON,...)提供报告。
它具有相同的入口点,也由前端控制器调度。
```html
/index.php?module=API&method=SEO.getRank&…
```
这个HTTP请求将像对控制器的任何其他调用一样处理:插件名称是API和否action,这将返回到index。
该Piwik\Plugin\API\Controller班将被调用,它将派遣调用API针对性,充当API调用第二前端控制器。在我们的例子中,SEO.getRank意味着该Piwik\Plugin\SEO\API::getRank()方法将被调用。
##### HTTP Tracking API
此HTTP API允许JavaScript跟踪器将分析数据保存在Piwik中。
它的入口点与Piwik的Web应用程序和HTTP报告API不同:它是通过该piwik.php文件。
在“跟踪HTTP API”参考中了解更多信息。
命令行
Piwik通过./console脚本提供了一个命令行API 。此脚本使用Symfony控制台组件。
插件可以显示可以调用的CLI命令,如下所示:
```shell
./console visitorgenerator:generate-visits
```
命令类位于plugins/*/CommandsPiwik并自动检测。
阅读更多关于“Piwik在命令行”的指南。
#### 数据模型,处理和存储
Piwik可以让您收集分析数据,然后稍后检索为报告。让我们看看Piwik如何模拟,处理和存储数据。
日志数据:原始分析数据
HTTP跟踪API(即Piwik\Tracker组件)接收原始分析数据,我们称之为“ 日志数据 ”。
日志数据在PHP中表示为Piwik\Tracker\Visit对象,并存储到下表中:
```shell
log_visit 每次访问包含一个条目(返回访问者)
log_action 包含网站上所有可能采取的行动(例如,唯一网址,网页标题,下载网址...)
log_link_visit_action 每个行动的访客包含一个条目(页面浏览,...)
log_conversion 包含访问期间发生的转化(与目标相符的操作)
log_conversion_item 包含电子商务转换项目
```
这些表格是为快速插入而设计和优化的,因为跟踪API需要尽可能快地处理流量较大的网站。
这些表(及其相关的PHP实体)的内容将在“Piwik数据库模式”指南中有更详细的解释。
##### 存档过程
以上表格并非针对提取高级别报表而设计或优化的:当有大量数据时,将日志条目聚合到日,周或月可能变得太密集。
该归档过程将读取日志数据汇总,以生产“ 数据归档 ”。数据汇总并存储为每个:
- 天
- 周
- 月
- 年
- 自定义日期范围
归档数据可以是:
- 数字指标:简单的数值(如页面浏览量)
这些存储在archive_numeric_*表中。值存储为float。
- 表记录:二维数据(可以是数值以及任何其他数据),表示为Piwik\DataTable对象
这些存储在archive_blob_*表中。DataTable对象被序列化为字符串并被压缩以被存储BLOB在表中。
DataTable存储在数据库中的对象是命名记录,以区分它们与DataTablePiwik的API所操纵和返回的对象,我们将其命名为报告。
在每个聚合级别处理和存储每个数字度量或表记录:日,周和月。例如,这意味着“进入页面”报告将被处理并存储在每月的每一天以及每个星期,月份,年份和自定义日期范围内。这样的数据是多余的,但这对于保证快速性能至关重要。
因为存档数据必须快速查询,所以每个月都会分开单独的表。我们将会有:
- archive_numeric_2014_10:2014年10月的指标
- archive_blob_2014_10:2014年10月的报告
- archive_numeric_2014_11:2014年11月的指标
- archive_blob_2014_11:2014年11月的报告
- ...
“Piwik数据库模式”指南中详细介绍了归档表的内容。归档过程在“归档”指南中有详细的说明。
#### 从存档数据到报告
如上所示,数据作为数字度量或表格记录存储。
报表是DataTable对象,由插件定义的API类提供。API类访问持久化的度量标准或记录,并将其转换为可呈现的报告。
有时候,一个持续的记录可能是几个API报告的来源。
您可以在“报告”指南中阅读有关如何创建和投放报告的更多详细信息。
#### 派维克的可扩展性点
Piwik Core仅定义主要的流程和行为。插件可以通过几个可扩展点扩展和定制它们:
注册事件或触发事件
执行派维克公认的特殊课程
扩展某些抽象基类
- 献给乐于奉献的你
- 一、工作感悟
- 1.1 工作感悟
- 1.2 数据库工作总结
- 二、运维专题(非技术)
- 2.1 公有云运维
- 2.1.1 阿里云采坑记.md
- 三、运维专题(技术类)
- 3.1 Linux(操作系统)
- 3.1.1 常见工作总结
- 3.1.2 常见服务使用和部署
- 3.1.3 操作系统优化
- 3.1.4 常用命令(Centos8)
- 3.2 Docker & K8s(容器技术)
- 3.2.1 Docker
- 1. Docker
- 1-1 容器基础
- 1-2 部署和加速
- 1-3 常用命令
- 1-4 Dockerfile编写
- 1-5 容器网络
- 1-6 数据持久化
- 2. docker-compose
- 2-1 基础
- 3.2.2 kubernetes
- 1. 导读-请先看我
- 2. kubeadm部署集群
- 1-1 k8s-1.14-基于calico
- 1-2 k8s-1.17-基于flanne
- 3. 二进制部署集群
- 4. 日常工作及故障处理
- 4-1 常用命令
- 4-2 故障处理
- 3.2.3 依赖服务部署
- 1. Harbor(镜像仓库)
- 1-1 harbor-2.1.0(单节点)
- 3.3 CICD(持续集成/部署)
- 3.3.1 GitLab
- 1. 服务部署
- 1-1 Gitlab-CE-13.3.4(单节点)
- 2. Git基础
- 3.3.2 Ansible
- 1. 服务部署
- 1-2 ansible-2.5(pip部署)
- 3. ansible-playbook
- 3-1 基于Roles的Playbook
- 3-3 循环语法
- 3.3.3 Jnekins
- 1. Jenkins部署
- 1-1 Jenkins-2.65部署
- 1-2 Jenkins-2.249部署
- 2. Jenkins项目初始化
- 3. Jenkins集成
- 3-1 Jenkins-2.65集成Sonar
- 3.4 LB/HA(负载均衡,反向代理)
- 3.4.1 LVS+Keepalive
- 1. LVS为MySQL读提供负载均衡
- 3.4.2 Pacemaker(HA)
- 1. 常用命令(转)
- 3.5 Runtime(代码运行环境)
- 3.5.1 Tomcat(Web中间件)
- 1. Tomcat部署手册
- 1-1 Tomcat-7.0.76部署
- 2. Tomcat常用脚本
- 3.6 NoSQL(非关系型数据库)
- 3.6.1 redis(非关系数据库)
- 1. Redis 基础
- 2. Redis 4.0变化
- 3. Codis实现Redis的集群
- 4. Redis故障处理
- 5. redis安全第一步
- 6. Redis集群搭建
- 7. CacheCloud部署
- 3.6.1 Redis挑战
- 3.6.2 MongoDB(文档数据库)
- 1. Mongodb基础
- 1-1 Mongodb4.0新特性
- 1-2 支持多大数据量
- 2. Mongodb安装
- 2-1 Mac OS安装Mongodb
- 2-2 Yum安装Mongodb
- 2-3 二进制安装Mongodb
- 2-4 docker容器安装Mongodb
- 2-5 Mongodb 配置文件详解
- 2-6 Mongodb 生产安全清单
- 2-7 用户身份认证和授权
- 3. Mongodb副本集
- 3-1 副本集搭建
- 3-2 用户身份认证与授权
- 4. 日常维护工作
- 4-1 Mongodb磁盘回收
- 4-2 Mongodb备份恢复到任意时间点
- 4-3 Mongodb慢查询分析
- 4-4 Mongodb版本升级
- 4-5 Mongodb副本集成员状态
- 4-6 Mongodb备份恢复工具使用
- 4-7 Mongodb服务启动和停止
- 4-8 修改副本集成员oplog大小
- 4-9 Mongodb 副本集Oplog
- 3.7 MQ(消息队列)
- 3.7.1 Zookeeper(分布式协调系统)
- 1. ZooKeeper基础
- 2. ZooKeeper集群搭建
- 2-1 ZK-3.4.10部署
- 3.2 RabbitMQ(消息队列)
- 1. 服务部署
- 1-1 RabbitMQ-3.8部署
- 2. 常用命令
- 3.8 Monitor(数据收集,监控)
- 3.8.1 Zabbix(运维监控)
- 1. 服务部署
- 1-1 服务端部署
- 1-2 客户端部署
- 2. 监控服务
- 2-1 监控Apache
- 2-2 监控IIS
- 2-3 监控Ningx
- 2-4 监控Tomcat(6/7/8)
- 2-5 监控WebSphere 7
- 2-6 监控MySQL
- 2-7 监控Oracle
- 2-8 监控SQL Servre
- 2-9 监控Weblogic
- 2-10 监控Windows
- 2-11 自定义监控项
- 3. 告警推送
- 3-1 邮件告警
- 3-2 短信告警
- 3-3 告警推到Syslog
- 4. 日常工作
- 4-1 数据库优化(TokuDB)
- 4-2 数据库优化(分区表)
- 4-3 前端定制(Grafana)
- 5. 与Grafana结合
- 3.8.2 ELKBstack(日志收集展示)
- 1. 服务部署
- 1-1 ELK 5.5部署及配置
- 1-1-1 ELKBstack介绍
- 1-1-2 Elasticsearch部署
- 1-1-3 Logstash部署
- 1-1-4 Kibana部署
- 1-1-5 X-pack部署
- 1-1-6 Filebeat部署
- 2. ELK高级配置
- 1. Elasticsearch实战
- 2. Logstash实战
- 3. Filebeat实战
- 5. 引入队列
- 3.9 Virtualization(虚拟化)
- 3.10 Basic(基础服务)
- 3.10.1 Piwik-Matomo(用户行为分析)
- 1. Piwik前期分析
- 2. Piwik介绍和部署
- 2-1 Piwik-3.x版本(早期)
- 3. Piwik 功能配置
- 4. Piwik 模拟数据和压测
- 5. Piwik运转原理
- 6. Piwik数据库模式(一)
- 6-1 第一部分
- 6-2 第二部分
- 3.10.2 Cobbler(系统自动部署)
- 1. Cobbler 可以干什么?
- 2. Cobbler 基础原理
- 3. Cobbler 安装
- 3-1 Cobbler-2.8部署
- 4. Cobbler 基础配置
- 5. Cobbler 配置文件
- 6. 一键优化脚本
- 3.10.3 Rsync(数据同步服务)
- 1. Rsync基础
- 2. 案例:页面部署(服务端拉取)
- 3.10.4 NFS(共享存储)
- 1. NFS部署手册
- 2. 客户端NFS备份脚本
- 3.10.5 Grafana(可视化)
- 1. 安装(8.2.x)
- 3.11 Tools(软件工具)
- 3.11.1 基准测试
- 1. 基准测试方法论
- 2. 压测工具 - Siege
- 3. 压测工具 - http_load
- 3.12 DB(关系型数据库)
- 3.12.1 MySQL(关系数据库)
- 1. MySQL部署
- 1-1 MySQL-5.7部署
- 1-2 Percona-5.7 + TokuDB 部署
- 2. MySQL复制
- 2-1 MySQL异步复制
- 3. MySQL备份恢复
- 3-1 xtrabackup 备份恢复
- 4. MySQL 高可用
- 4-1 MHA(HA)
- 4-1-1 MHA 架构介绍和原理
- 4-1-2 MHA日常管理
- 4-1-3 MHA 自动Failover
- 4-1-4 MHA常用参数
- 4-1-5 MHA 报错
- 4-1-6 MHA相关配置文件和脚本
- 4-2 MyCAT
- 4-2-1 MyCAT 介绍和部署
- 4-1-3 MyCAT读写分离案例解析
- 5. MySQL 常用脚本
- 5-1 MySQL常用统计语句
- 5-2 MySQL性能分析脚本
- 6. MySQL 日常及故障处理
- 6-1 MySQL死锁排查
- 6-2 复制故障
- 6-3 MySQL 升级注意事项
- 6-3 MySQL授权
- 3.12.2 Oracle(关系数据库)
- 1. Oracle部署
- 1-1 Oracle11g单实例部署
- 1-2 Oracle12c单实例部署
- 2. Oracle常用脚本
- 3. Oracle 知识点
- 六、Ansible开源项目
- 6.1 项目初始化手册
- 6.1.1 Ansible错误处理
- 6.1.2 一种预先判断是否操作的方法
- 6.2 System初始化
- 6.3 Nginx/Tnginx部署
- 6.4 Python部署
- 6.5 PHP部署
- 6.6 MySQL部署
- 6.7 Docker部署
- 6.8 Haproxy部署
- 6.9 Redis部署
- 1. 变量和tags信息
- 3. Redis主从部署
- 4. Redis集群部署
- 5. 清理数据
- 6.10 Software软件部署
- 6.11 Zabbix部署
- 6.12 Elastic部署
- 6.13 Tomcat
- 6.14 Kafka部署
- 6.15 Zookeeper部署
- 6.16 Etcd集群部署
- 6.17 M3DB部署
- 6.18 Pormetheus部署
- 七、学习资源推荐
- 八、从瞎搞到放弃
- 8.1 CodeQL(语义代码分析引擎)
- 8.1.1 背景及计划
- 8.1.2 CodeQL概述
- 8.1.3 简单部署和使用
- 8.1.4 后续
- 8.2 dbdeployer(轻松部署MySQL)
- 归档笔记
- 三、常用服务部署(迁移中)
- 3.4 Nginx & PHP(Web服务)
- 3.4.1 Nginx(Web)
- 1. Nginx基础和部署
- 2. Nginx 我的一些思考
- 3. Nginx(Web)配置
- 4. Nginx(Proxy)配置
- 5. Nginx日常管理
- 3.4.3 PHP
- 1. PHP 7.1 部署
- 2. PHP5.6 部署
- 4. PHP原理
- 5. PHP 常用模块
- 二、运维项目实战(迁移中)
- 2.1 标准化 & 工具化项目
- 2.1.1 系统部署和优化
- 2.1.5 全网日志收集展示平台项目
- 1. 项目需求
- 2. 整体方案规划
- 3. 日志收集配置
- 4. 消息缓冲队列
- 5. 日志处理转发
- 6. 日志数据展示(待补充)
- 7. ELK安全配置(上)
- 8. ELK安全配置(下)
- 9. 项目总结
- 2.2 高性能Web项目
- 2.2.1 网站需求(完善中)