数据分析：如何追踪访客初始来源_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

数据分析：如何追踪访客初始来源

了解网站的运营情况、了解用户构成是保证网站健康持续发展的重要基础，所以看数据做分析是网站优化人员每日必做的工作。上周平台发布了《网站分析白皮书（站长版）》，本周小编又发现了一篇非常好的实战型文章《在Google Analytics中如何跟踪访客的初始来源》，作者马骏是已获得GOOGLE Analytics IQ认证的网站访客行为分析师，得知平台要转载此文章后很贴心地将原文中的英文内容都做成了中文的，同时结合国内实际情况添加了一些相当贴心的内容——如何顺利使用Gogle Analytics工具。下面便是正文，希望给广大站长以帮助。

关于Google Analytic

Google Analytics是世界上使用最广的网站分析工具。世界上最受欢迎的一万个网站中的三分之二都在使用它（来源：wikipedia）。在中国Google Analytic的数据获取虽然不用翻墙，但是访问Google Analytic网站却需要。你可以使用自带此技能的百度浏览器访问Google Analytic。

了解访客来源

我们在网站分析的工作中时常问到的一个问题是“这个访客第一次访问我们网站是通过什么方式？”或许是每个站长内心都有些“处女情结”吧，但是这也不无道理。第一次访问，是用户开始接触你的品牌和服务的那一个时刻。在这一时刻他眼里留下的第一印象将很大程度决定你是否能让他进行第二次、第三次、第n次访问。访问来源有多种，但大致有这些：

? 直接访问（direct）：用户直接输入网址、收藏夹、邮件客户端、手机app、用户从本地点击链接（excel、QQ聊天）等。

? 推介访问（referral）：用户从其他网站点击链接访问。

? 自然搜索（organic search）：用户从搜索引擎的搜索结果访问。

? 广告链接（paid search）：用户从SEM的推广访问。

? 邮件访问（email）：用户从线上邮箱访问。

? 社交访问（social）：用户从新浪微博、脸书、推特等社交网络访问。

? 显示广告（display）：用户从显示广告访问。

下图是Google Analytics中进行访问渠道分组的界面，你可以自主进行设置。设置完后就可以在报告>流量获取>所有流量>渠道中查看。

↑进行访问渠道分组，更改默认设置

那么我们想得到最初始的访问来源应该怎么做呢？当然是当访客第一次访问的时候保存他的访问来源了。很多时候一个HTTP访问中HTTP头部都会有一个referrer（引荐），我们要做的就是将它保存。如何用GA实现呢？我们分两步来做：

1，首先建立一个自定义维度

先解释下什么是自定义维度。自定义维度就是我们对某次行为（Hit），某次访问（Session），或者某个用户（User）新增一个数据列。对于某次点击，我们可以把坐标位置新增为维度；对于某次访问，我们可以把是否登录新增为维度；对于某个用户，我们可以把他是否已婚新增为一个维度。自定义维度是对网站分析工具的补充，它可以让你关联更多的数据到你的报表。

在今天这个例子中，我们建立一个自定义维度叫做UserOrigin，这个自定义维度需要用户级别（User-Level），这样这个维度就会一直保存在用户浏览器的cookie中。你可以通过管理>媒体资源>自定义定义>自定义维度来新建。

2，其次是建立一个高级过滤器

高级过滤器可以让你免去写JavaScript的麻烦，我们通过这个例子来介绍。同样在管理>查看>过滤器中建立一个叫做Collect User Origin的高级过滤器。具体设置如下：

↑高级过滤捕获初始访问源

当访问开始时，将访问的引荐的内容保存到UserOrigin。切记覆盖输出字段（Override Output Field）一定要勾掉。这样一旦赋值之后就不再更改。只要用户初始访问不是直接访问（引荐为空），我们都可以对用户的来源进行记录。并且一旦记录，不再更改。

这虽然不完美，但是解决了我们很大的问题，即我们终于知道用户到底从哪里来了。不完美的原因就在于我们前面提到的分类中的直接访问和一些技术原因，如302跳转，浏览器限制，https跳转。当发生这些情况时，我们拿不到引荐的数据。

3，如何查看保存的数据呢？

对于每一个行为、访问、用户你都可以通过查看UserOrigin这个自定义字段找到他们第一次（引荐）访问时的来源。选择次级维度，或者自定义一个报表即可查看。

举一反三

最后，我们用这个例子还可以延伸出其他用法：

1. 我们可以保存搜索字词（Search Term）看用户最初是搜索哪个关键字进行访问的，这里注意是站内搜索。

2. 我们可以保存广告系列来源（Campaign Source）看用户最初是通过哪个推广计划访问的，你可以用网址构建工具来跟踪。下图便是网址构建工具的截图：

3. 我们可以保存页面标题（Page Title）或者广告系列目标网址（Campaign Target URL）看用户最初看到的页面是哪个页面。

写在最后

几乎所有的网站分析工具都是基于cookie进行的，使用cookie就有一定局限性，比如跨设备，多浏览器，QR码等等。我们保存的初始访问也局限于此。GA的cookie会在浏览器上保留两年，从时间上来讲是够用了。如果你要更精确地统计和保存用户初始来源，你可以考虑在数据库中为你的注册会员新增一个字段，再通过GA的User-ID功能进行集成。

相关内容讨论请移步【学堂同学汇】《数据分析：如何追踪访客初始来源》讨论帖

来源：百度搜索资源平台百度搜索学堂

Public @ 2020-09-06 16:21:48

搜索引擎的工作原理

搜索引擎的工作原理可以简单地概括为以下几个步骤： 1. 搜索引擎的爬虫程序从网络上收集网页并建立一个索引，这个索引包括每个网页的关键词、标题、链接等信息。 2. 用户输入搜索关键词，搜索引擎会根据这个关键词来查找索引，找到与该关键词相关的网页。 3. 搜索引擎会对这些相关网页进行排序，通常是按照重要性和相关性等因素来排序，然后呈现给用户。 4. 用户点击搜索结果中的链接，进入相应网页。

Public @ 2023-04-17 07:00:08

搜索引擎工作的基础流程与原理

搜索引擎工作的基本流程如下： 1. 网络爬虫：首先搜索引擎需要通过网络爬虫抓取网页，并对网页进行解析，将其中的文本、图片、链接等信息提取出来。 2. 存储索引：接着搜索引擎需要将这些信息存储在索引库中，为后续搜索做准备。 3. 搜索关键词：当用户输入关键词进行搜索时，搜索引擎需要对这些关键词进行分词，并对分词结果进行查询，找到相关的网页并按照相关度排序。 4. 显示结果：最后，搜索引擎会按

Public @ 2023-04-02 03:00:29

搜索引擎工作的基础流程与原理

搜索引擎最重要的是什么？有人会说是查询结果的准确性，有人会说是查询结果的丰富性，但其实这些都不是搜索引擎最最致命的地方。对于搜索引擎来说，最最致命的是查询时间。试想一下，如果你在百度界面上查询一个关键词，结果需要5分钟才能将你的查询结果反馈给你，那结果必然是你很快的舍弃掉百度。搜索引擎为了满足对速度苛刻的要求（现在商业的搜索引擎的查询时间单位都是微秒数量级的），所以采用缓存支持查询需求的方式，也就

Public @ 2017-02-18 16:21:54

搜索引擎工作原理

搜索引擎的工作原理大致如下： 1. 网络爬虫（Spider）：搜索引擎会派遣网络爬虫，搜索引擎爬虫通过扫描互联网上的网页，并收集这些网页的信息，包括标题、关键词、描述、网址、内容、超链接等。 2. 索引（Index）：搜索引擎将收集到的网页内容进行分析，提取出其中的关键词，并将这些关键词存入一个大型的索引库中，以便后续快速查询。 3. 检索（Retrieval）：当用户输入查询词时，搜索引擎

Public @ 2023-04-14 20:00:35

Categories

Tags