简介 · 大数据

[TOC] # 点击流概念点击流这个概念更注重用户浏览网站的整个流程，网站日志中记录的用户点击就像是图上的“点”，而点击流更像是将这些“点”串起来形成的“线”。也可以把“点”认为是网站的Page，而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的，它可以比网站日志包含更多的信息，从而使基于点击流数据统计得到的结果更加丰富和高效。 ![](https://box.kancloud.cn/49d80d2fe8158c3bfc21735cd9c8f586_339x160.png) # 点击流模型生成点击流数据在具体操作上是由散点状的点击日志数据梳理所得，从而，点击数据在数据建模时应该存在两张模型表（Pageviews和visits）： 1. 用于生成点击流的原始访问日志表 ![](https://box.kancloud.cn/adbc02cab522cf8e892aec5162403546_708x348.png) 2. 页面点击流模型Pageviews表 ![](https://box.kancloud.cn/e19d24db062ed14b3718a36fe3ab4a24_711x192.png) 3. 点击流模型Visits表(按session聚集的页面访问信息) ![](https://box.kancloud.cn/4fd8fbe3277bff158a0ca0ec26713e16_710x245.png) 这就是点击流模型。当WEB日志转化成点击流数据的时候，很多网站分析度量的计算变得简单了，这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量 # 如何进行数据分析网站数据分析整体来说是一个内涵非常丰富的体系，其整体过程是一个金字塔结构： ![](https://box.kancloud.cn/9a4a31d5790a4aa63f398568fabd0c30_408x266.png) 改善网站(电商、社交、电影、小说)的运营，获取更高投资回报率（ROI） ## 网站流量质量分析流量对于每个网站来说都是很重要，但流量并不是越多越好，应该更加看重流量的质量，换句话来说就是流量可以为我们带来多少收入 ![](https://box.kancloud.cn/0a6b3957e5f0defef77d38c8333fac7d_476x366.png) ## 网站流量多维度细分细分是指通过不同维度对指标进行分割，查看同一个指标在不同维度下的表现，进而找出有问题的那部分指标，对这部分指标进行优化。 ![](https://box.kancloud.cn/d91a8132887844198ec688d598b74608_409x234.png) ## 网站内容及导航分析对于所有网站来说，页面都可以被划分为三个类别： * 导航页 * 功能页 * 内容页首页和列表页都是典型的导航页；站内搜索页面、注册表单页面和购物车页面都是典型的功能页，而产品详情页、新闻和文章页都是典型的内容页。比如从内容导航分析中，以下两类行为就是网站运营者不希望看到的行为： ![](https://box.kancloud.cn/41f6d1231ed629b09f878b24611f1378_422x216.png) 第一个问题：访问者从导航页进入，在还没有看到内容页面之前就从导航页离开网站，需要分析导航页造成访问者中途离开的原因。第二个问题：访问者从导航页进入内容页后，又返回到导航页，说明需要分析内容页的最初设计，并考虑在内容类页面提交交叉信息推荐。 ## 网站转化及漏斗分析所谓转化，即网站业务流程中的一个封闭渠道，引导用户按照流程最终实现业务目标（比如商品成交）；而漏斗模型则是指进入渠道的用户在各环节递进过程中逐渐流失的形象描述；对于转化渠道，主要进行两部分的分析：访问者的流失和迷失 1. 助力和流失 ![](https://box.kancloud.cn/170923b603be201f3260f1462a0aabd2_258x216.png) 造成流失的原因很多，如：不恰当的商品或活动推荐对支付环节中专业名词的解释、帮助信息等内容不当 2. 迷失 ![](https://box.kancloud.cn/b544b674c3eb561f6dd5ffdf37040a0e_384x223.png) 造成迷失的主要原因是转化流量设计不合理，访问者在特定阶段得不到需要的信息，并且不能根据现有的信息作出决策 # 流量分析常见指标课程中涉及的分析指标主要位于以下几大方面： 1. 基础分析（PV,IP,UV） PV(访问量)：即Page View, 即页面浏览量或点击量，用户每次刷新即被计算一次。 IP(独立IP)：指独立IP数。00:00-24:00内相同IP地址之被计算一次。 UV(独立访客)：即UniQue Visitor,访问您网站的一台电脑客户端为一个访客。 00:00-24:00内相同的客户端只被计算一次。 * 趋势分析：根据选定的时段，提供网站流量数据，通过流量趋势变化形态，为您分析网站访客的访问规律、网站发展状况提供参考。 * 对比分析：根据选定的两个对比时段，提供网站流量在时间上的纵向对比报表，帮您发现网站发展状况、发展规律、流量变化率等。 * 当前在线：提供当前时刻站点上的访客量，以及最近15分钟流量、来源、受访、访客变化情况等，方便用户及时了解当前网站流量状况。 * 访问明细：提供最近7日的访客访问记录，可按每个PV或每次访问行为（访客的每次会话）显示，并可按照来源、搜索词等条件进行筛选。通过访问明细，用户可以详细了解网站流量的累计过程，从而为用户快速找出流量变动原因提供最原始、最准确的依据。 ![](https://box.kancloud.cn/4165df31f065506b2d5180a2bd2c194a_1149x654.png) ![](https://box.kancloud.cn/c68a2082a408e0663f29879c3b44f1e1_1126x627.png) 2. 来源分析 * 来源分类：提供不同来源形式（直接输入、搜索引擎、其他外部链接、站内来源）、不同来源项引入流量的比例情况。通过精确的量化数据，帮助用户分析什么类型的来路产生的流量多、效果好，进而合理优化推广方案。 * 搜索引擎：提供各搜索引擎以及搜索引擎子产品引入流量的比例情况。从搜索引擎引入流量的的角度，帮助用户了解网站的SEO、SEM效果，从而为制定下一步SEO、SEM计划提供依据。 * 搜索词：提供访客通过搜索引擎进入网站所使用的搜索词，以及各搜索词引入流量的特征和分布。帮助用户了解各搜索词引入流量的质量，进而了解访客的兴趣关注点、网站与访客兴趣点的匹配度，为优化SEO方案及SEM提词方案提供详细依据。 * 最近7日的访客搜索记录，可按每个PV或每次访问行为（访客的每次会话）显示，并可按照访客类型、地区等条件进行筛选。为您搜索引擎优化提供最详细的原始数据。 * 来路域名：提供具体来路域名引入流量的分布情况，并可按“社会化媒体”、“搜索引擎”、“邮箱”等网站类型对来源域名进行分类。帮助用户了解哪类推广渠道产生的流量多、效果好，进而合理优化网站推广方案。 * 来路页面：提供具体来路页面引入流量的分布情况。尤其对于通过流量置换、包广告位等方式从其他网站引入流量的用户，该功能可以方便、清晰地展现广告引入的流量及效果，为优化推广方案提供依据。 * 来源升降榜：提供开通统计后任意两日的TOP10000搜索词、来路域名引入流量的对比情况，并按照变化的剧烈程度提供排行榜。用户可通过此功能快速找到哪些来路对网站流量的影响比较大，从而及时排查相应来路问题。