Categories


Tags


怎样把网站从http转换成https

近两年的情况表明,网站启用https已是大势所趋。但由于懒,一直没有动作。在David Yin的激励下,终于在人际稀少的春节前夕把SEO每天一贴转换成https了。

网站上有我博客链接的朋友,麻烦把链接从:

http://www.seozac.com

改到

https://www.seozac.com

谢谢。

使用https加密目前看有利有弊。利,首先是安全,减少被劫持、篡改的机会。弊,主要是速度上的,由于证书验证、多次握手、CPU消耗等原因,https页面速度会被拖慢一点点。但对大部分网站来说,与复杂的脚本、大尺寸图片等相比,拖慢这一点点基本可以忽略。

改为https对SEO按说应该有好处,不过实际情况如何还有待验证。Google方面早就表明https是排名因素之一,虽然只是个很小因素。百度很久以前对https支持不好,甚至曾经提到过,百度不会主动抓取https页面,但2015年百度站长平台发布消息,百度支持https无问题,而且对https页面优先收录、优先排名:

从相关性的角度,百度搜索引擎认为权值相同的站点,采用https协议的页面更加安全,排名上会优先对待。

此次技术升级之后,百度搜索将同一个域名的http版和https版作为一个站点来处理,优先收录https页面;

从http改到https后的一段时间,搜索引擎需要重新抓取、判断、计算,收录,排名和流量都可能有起伏。说是起伏,恐怕主要是下降。虽然从http版本全站做了301转向到https版本,我们都知道,百度对301转向处理很慢、很保守,需要持续观察什么时候能完成正确判断并传递权重,并且只传递部分权重。Google也表明过,301转向不能完全传递权重,是有损耗的。

就SEO每天一贴来说,另一个可能造成麻烦的是,这个网站以前做过多次URL路径变化和301转向,还换过域名,现在再多加一次301转向,多层转向有可能造成搜索引擎不愿意跟踪,不能完全传递权重。本博客外链增加最多的时候还是刚刚开博的头两年,那时候的链接都是指向最早的URL的,到现在的https新URL,经过了3-4次转向,这恐怕是搜索引擎会跟踪的转向数的上限了。所以,可能会丢失一部分无法挽回的外链效果。

接下来,本博客的主要关键词排名可能会下降甚至消失一段时间,能不能恢复也是未知之数。但长痛不如短痛,既然是趋势,无论如何,也得跟进。

简单说一下把网站从http转换到https的过程,也许对读者有借鉴意义。下面只是我做转换的过程,并不是最优方法,按说应该先在单独的服务器上测试https版本,我并没有。公司网站最好更谨慎点。

购买SSL证书

这个是必须的,现在价格并不贵。到David Yin帖子看一下,便宜的3年只是几十块钱。安装SSL证书的技术问题,无法在这讨论了,不明白的问技术人员吧。

顺便广告一下,如果用我们的服务器,免费提供SSL证书。

备份、备份

这个也是必须的。对SSL安装、服务器配置不熟悉的站长来说,转换过程不一定是那么顺利的。

新版本代码改动

SSL证书安装后,https版本就可以访问了。原来网站上的所有URL都需要改到https版本,包括链接、图片、JS等,所以可能需要修改文章数据库、模板、插件等。

本博客使用WordPress,要在后台把博客地址改为https版本:

WordPress后台设置

这样,绝大部分导航中的链接就由WP系统自动改为https版本了。但很可能还有一些导航性质的链接是硬编码在模板中的,比如这个博客帖子下面的版权声明,那是人工写在模板里的,别忘了改。

帖子正文中人工加的内部链接也需要自己改。如果使用了phpMyadmin,用下面指令跑一下数据库就行了:

update wp_posts set post_content = replace(

post_content, ‘http://www.seozac.com/’,

‘https://www.seozac.com/’);

帖子里的图片路径也就同时改了。

如果没有使用数据库管理工具,写个简单php程序运行一下也可以。

因为只是用指令在数据库执行了一下,没有,也没办法人工检查所有页面,可能有漏掉的链接、图片之类的,读者要是发现了,麻烦告诉我一下。

这里我还遇到了些没解决的问题。新浪微博组件和百度分享按钮组件貌似都不支持https,原理上应该可以把JS下载下来放到自己服务器上,但暂时没时间弄这个,先拿掉了。

检查新版本页面源代码

访问一下https版本页面,包括首页、栏目页、内页、sitemap,查一下源代码,看看还有没有http地址的存在,不仅页面可见部分,还得看看head部分,JS等,比如head里的canonical标签是否改到https版本了?程序生成的sitemap里的URL是否改为https版本了?

全站301转向

全站做http到https的301转向。LAMP服务器为例,在.htaccess文件中加:

RewriteEngine On

RewriteCond %{SERVER_PORT} 80

RewriteRule ^(.*)$ https://www.seozac.com/$1 [R=301,L]

RewriteCond %{HTTP_HOST} ^seozac.com [NC]

RewriteRule ^(.*)$ https://www.seozac.com/$1 [L,R=301]

这个代码只是举例,也是我的博客用的实际代码,还有其他写法也可以,只要实现了301就行。

访问原http版本页面,检查301是否生效。

百度站长平台和Google Search Console

搜索引擎抓取301转向后,应该可以自行判断网站已经从http转到https了。另一个通知搜索引擎的方法是通过站长平台。

在Google Search Console中,把https网站加入并验证,不需要使用Change of Address功能。可以在http及https版本的账号下,用Fetch as Googlebot功能看看两种版本的URL是否返回正确头信息和页面源代码。

百度站长平台好像不支持两个版本都加入站长平台。不过在原来http账号下,管理站点属性部分有这样一个选项:

百度站长平台https设置

点这句话右面的设置按钮,出来一个对话框,问是否确认支持https协议,点“是”后变成这样:

百度站长平台https协议

希望这样百度就知道应该把http和https两个版本动作一个网站处理。

持续观察抓取、收录、排名、流量

这是接下来两三个月要做的事了,以后有进展再来报告。

目前可以报告的是,原始日志显示,百度及Google蜘蛛都抓取正常,已经抓取了301及转向后的页面。我是26号凌晨4-6点安装SSL证书、加301转向的,26号中午Google已经索引了几十个https页面(然而,没有首页,可能对待首页比较谨慎):

Google索引的https页面

并且一些https页面(并不是所有已经索引了的https页面)已经进入排名,和原来的http版本位置基本是一样的。

百度到写本帖日期为止,还没有索引https页面。

尽量改正外部链接

可能的话,把外部链接改到新的https地址。所以,再次呼吁,网站上有我博客链接的朋友,麻烦把链接从:

http://www.seozac.com

改到

https://www.seozac.com

谢谢。并祝所有读者春节快乐。

来源:SEO每天一贴 Zac 昝辉


Public @ 2013-04-13 15:55:59

求职季,你需要一点 SEO 思维

SEOer 是一群和百度上演着相爱相杀戏码的人,这些人擅长搞排名、引流量。乍一看,SEO 与找工作之间似乎并没有什么关联。但其实借鉴用户在网上搜索产品的思维方式,很容易让 HR 找到我们。那么我们应该如何运用 SEO 思维让工作找到自己呢?在这之前,我们先来了解一下 SEO 究竟是什么。一、SEO 与求职有何联系?SEO 一词是近年来,随着商务电子化的兴起,网络营销热度逐渐攀升而广为人知。该词最初

Public @ 2016-10-19 15:26:29

如何预防并处理快照劫持

那么什么是快照劫持呢?快照劫持就是百度抓取的页面是正常页面,通过搜索关键词,访问的时候跳转的确是另外一个网站和搜索引擎抓取的完全不同的网站。网站打开后为非法灰色网站,有些词搜索打开显示正常,有些词打开完全无影响。其实这些就是所谓的网站快照劫持了。如何预防并处理快照劫持 SEO优化 站长 好文分享 第1张前几天一个朋友给我反馈了一个问题,说他网站排名突然在几天之内所有关键词排名都没有了。让我帮忙分析

Public @ 2009-06-08 15:37:37

HTTP和HTTPS有什么区别? 什么是SSL证书?使用ssl证书优势?

什么是SSL?SSL是指安全套接层协议(以及传输层协议TLS),位于TCP/IP协议与各种应用层协议之间,为数据通讯提供安全支持,是目前使用最广泛的安全协议。它为互联网或内部网络连接,进行操作的两台机器之间提供安全信息通道,即HTTPS。1.1 数据传输期间,对信息进行加密1.2通过唯一的SSL凭据识别证书所有者身份。1.3先验证证书所有者身份,再颁发SSL证书图片.pngHTTP和HTTPS有什

Public @ 2015-03-07 15:35:55

什么是RPC协议?RPC协议与HTTP协议的区别

什么是RPC协议?RPC是一种远程过程调用的协议,使用这种协议向另一台计算机上的程序请求服务,不需要了解底层网络技术的协议。在 RPC 中,发出请求的程序是客户程序,而提供服务的程序是服务器。HTTP是一种超文本传输协议。是WWW浏览器和WWW服务器之间的应用层通讯协议。RPC协议与HTTP协议的区别1、RPC是一种API,HTTP是一种无状态的网络协议。RPC可以基于HTTP协议实现,也可以直接

Public @ 2022-10-23 15:56:09

更多您感兴趣的搜索

0.112555s