数据分析：如何追踪访客初始来源_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

数据分析：如何追踪访客初始来源

了解网站的运营情况、了解用户构成是保证网站健康持续发展的重要基础，所以看数据做分析是网站优化人员每日必做的工作。上周平台发布了《网站分析白皮书（站长版）》，本周小编又发现了一篇非常好的实战型文章《在Google Analytics中如何跟踪访客的初始来源》，作者马骏是已获得GOOGLE Analytics IQ认证的网站访客行为分析师，得知平台要转载此文章后很贴心地将原文中的英文内容都做成了中文的，同时结合国内实际情况添加了一些相当贴心的内容——如何顺利使用Gogle Analytics工具。下面便是正文，希望给广大站长以帮助。

关于Google Analytic

Google Analytics是世界上使用最广的网站分析工具。世界上最受欢迎的一万个网站中的三分之二都在使用它（来源：wikipedia）。在中国Google Analytic的数据获取虽然不用翻墙，但是访问Google Analytic网站却需要。你可以使用自带此技能的百度浏览器访问Google Analytic。

了解访客来源

我们在网站分析的工作中时常问到的一个问题是“这个访客第一次访问我们网站是通过什么方式？”或许是每个站长内心都有些“处女情结”吧，但是这也不无道理。第一次访问，是用户开始接触你的品牌和服务的那一个时刻。在这一时刻他眼里留下的第一印象将很大程度决定你是否能让他进行第二次、第三次、第n次访问。访问来源有多种，但大致有这些：

? 直接访问（direct）：用户直接输入网址、收藏夹、邮件客户端、手机app、用户从本地点击链接（excel、QQ聊天）等。

? 推介访问（referral）：用户从其他网站点击链接访问。

? 自然搜索（organic search）：用户从搜索引擎的搜索结果访问。

? 广告链接（paid search）：用户从SEM的推广访问。

? 邮件访问（email）：用户从线上邮箱访问。

? 社交访问（social）：用户从新浪微博、脸书、推特等社交网络访问。

? 显示广告（display）：用户从显示广告访问。

下图是Google Analytics中进行访问渠道分组的界面，你可以自主进行设置。设置完后就可以在报告>流量获取>所有流量>渠道中查看。

↑进行访问渠道分组，更改默认设置

那么我们想得到最初始的访问来源应该怎么做呢？当然是当访客第一次访问的时候保存他的访问来源了。很多时候一个HTTP访问中HTTP头部都会有一个referrer（引荐），我们要做的就是将它保存。如何用GA实现呢？我们分两步来做：

1，首先建立一个自定义维度

先解释下什么是自定义维度。自定义维度就是我们对某次行为（Hit），某次访问（Session），或者某个用户（User）新增一个数据列。对于某次点击，我们可以把坐标位置新增为维度；对于某次访问，我们可以把是否登录新增为维度；对于某个用户，我们可以把他是否已婚新增为一个维度。自定义维度是对网站分析工具的补充，它可以让你关联更多的数据到你的报表。

在今天这个例子中，我们建立一个自定义维度叫做UserOrigin，这个自定义维度需要用户级别（User-Level），这样这个维度就会一直保存在用户浏览器的cookie中。你可以通过管理>媒体资源>自定义定义>自定义维度来新建。

2，其次是建立一个高级过滤器

高级过滤器可以让你免去写JavaScript的麻烦，我们通过这个例子来介绍。同样在管理>查看>过滤器中建立一个叫做Collect User Origin的高级过滤器。具体设置如下：

↑高级过滤捕获初始访问源

当访问开始时，将访问的引荐的内容保存到UserOrigin。切记覆盖输出字段（Override Output Field）一定要勾掉。这样一旦赋值之后就不再更改。只要用户初始访问不是直接访问（引荐为空），我们都可以对用户的来源进行记录。并且一旦记录，不再更改。

这虽然不完美，但是解决了我们很大的问题，即我们终于知道用户到底从哪里来了。不完美的原因就在于我们前面提到的分类中的直接访问和一些技术原因，如302跳转，浏览器限制，https跳转。当发生这些情况时，我们拿不到引荐的数据。

3，如何查看保存的数据呢？

对于每一个行为、访问、用户你都可以通过查看UserOrigin这个自定义字段找到他们第一次（引荐）访问时的来源。选择次级维度，或者自定义一个报表即可查看。

举一反三

最后，我们用这个例子还可以延伸出其他用法：

1. 我们可以保存搜索字词（Search Term）看用户最初是搜索哪个关键字进行访问的，这里注意是站内搜索。

2. 我们可以保存广告系列来源（Campaign Source）看用户最初是通过哪个推广计划访问的，你可以用网址构建工具来跟踪。下图便是网址构建工具的截图：

3. 我们可以保存页面标题（Page Title）或者广告系列目标网址（Campaign Target URL）看用户最初看到的页面是哪个页面。

写在最后

几乎所有的网站分析工具都是基于cookie进行的，使用cookie就有一定局限性，比如跨设备，多浏览器，QR码等等。我们保存的初始访问也局限于此。GA的cookie会在浏览器上保留两年，从时间上来讲是够用了。如果你要更精确地统计和保存用户初始来源，你可以考虑在数据库中为你的注册会员新增一个字段，再通过GA的User-ID功能进行集成。

相关内容讨论请移步【学堂同学汇】《数据分析：如何追踪访客初始来源》讨论帖

来源：百度搜索资源平台百度搜索学堂

Public @ 2020-09-06 16:21:48

爬行和抓取

爬行和抓取在计算机领域中都指数据采集的过程。爬行是指使用网络爬虫程序，通过抓取网页上的数据来建立一个数据集。例如，搜索引擎就使用网络爬虫程序来收集网页上的内容，以便用户进行搜索。抓取则是指通过编写程序从特定的网站或数据源上抓取数据，以便进行分析或者处理。例如，电商平台可以使用抓取程序从竞争对手的网站上抓取商品价格信息，以便制定自己的价格策略。总的来说，爬行和抓取都是数据采集的方式，只是

Public @ 2023-04-07 23:50:49

搜索引擎如何抓取你的网页

搜索引擎优化（SEO）是搜索引擎有好的收录网页的过程，适当的SEO有利于蜘蛛爬行你的网站，使你的内容符合搜索引擎算法，以便确认它与关键词高度相关。优化的目的就是使网页的内容便于蜘蛛理解，下面我就以百度新收录的一篇内容来进行说明，我以一个完整标题进行搜索，其目的是能反映出更多关键词在百度自然搜索的结果页面，能更好的说明搜索引擎是如何抓取你的网页的。搜索引擎如何抓取你的网页网站优化 SEO优化 SE

Public @ 2019-08-19 16:22:21

数据分析：如何追踪访客初始来源

Public @ 2020-09-06 16:21:48

搜索引擎工作的基础流程与原理

搜索引擎的基本工作原理是：用户向搜索引擎输入一系列关键词，搜索引擎会从自身拥有的网页数据库中根据相关算法去检索出匹配度最高的搜索结果进行显示和返回给用户。搜索引擎的基本流程包括： 1. 网页爬虫：搜索引擎会通过程序自动爬取网页上的数据。 2. 网页索引：搜索引擎会把所有爬取的数据进行索引，并在索引中建立统一的编号，以便后续的检索。 3. 网页分类：搜索引擎会把所有索引的内容进行分类，

Public @ 2023-03-01 20:00:35

Categories

Tags