如何让搜索引擎收录自己的文章能被他人看到?

佚名 次浏览

摘要:如何判断自己的博客有没被百度收录很简单,搜索site:域名,比如site:谷歌开发平台的官方文档经过测试,百度,bing都可以,但是google不行,一直报错:想了想没必要用cl,谷歌转用站点地图,因为谷歌收录速度比百度快多了,问题不大。提交谷歌收录,选择站点地图

博客推广

博客网站建立,内容逐渐丰富。 接下来就是网站的推广。 我希望我的文章能够被别人看到,也希望能为迷茫的路人提供一个思路。

一般推广方法:在别人的博客评论或者一些回答区留下你的爪子(博客地址),但是太麻烦了,只能一一复制。

目前,搜索引擎推广是在互联网上寻找资源的重要手段。 如何让您的文章包含在常见搜索引擎中。

Mavericks的博客网站采用hexo+github页面搭建,而github拒绝百度爬虫,因此其上托管的博客无法被搜索引擎收录,需要我们手动提交。 同时,个人博客不依赖于知名博客平台,如CSDN、知乎、简书、博客园等,因此搜索权重不高(对于新站来说基本不会),因此为了更多人看到我们的文章,我们需要SEO优化。

判断是否包含

如何判断你的博客是否被百度收录,很简单。 搜索站点:域名,如site:

如果搜索到结果,则说明已被百度收录。 显然,搜索小牛队的网站没有任何结果。

搜索引擎优化

SEO(Search Engine Optimization):搜索引擎优化

为了提高浏览器收录概率,一般可以从以下两个方面入手:

网站优化和主动推送到搜索引擎

我们以百度主动推送的讨论为例(无论多么hack,它都有国内最大的市场),其他搜索引擎也类似。 百度提供两种方式:自动提交和手动提交。 自动提交分为主动推送、自动推送和sitemap三种方式:

手动提交:一次性提交链接给百度,可以使用此种方式。(,提交量太低,而且太麻烦)
自动提交(顾名思义):
(1) 主动推送(实时):最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
(2) 自动推送:最为便捷的提交方式,请将自动推送的JS代码部署在站点的每一个页面源代码中,部署代码的页面在每次被浏览时,链接会被自动推送给百度。可以与主动推送配合使用。
(3) sitemap:您可以定期将网站链接放到sitemap中,然后将sitemap提交给百度。百度会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于主动推送。

个人推荐:两种方式:主动推送和sitemap。 (不过GitHub屏蔽了百度爬虫,而百度对GitHub托管的sitemap并不友好,经常爬取失败,影响网站权重,所以后来决定删除。)

使用站长工具抓取自己的网页,然后请求搜索引擎收录。 但是如果我要收录几个搜索引擎,就需要一一提交,太麻烦了。

笔者发现网上有人写了一个hexo的自动提交插件,hexo-submit-urls-to-search-engine。

作者表示文章可以达到效果。 有时发布后5分钟就可以在Bing上搜索到(我查了源码,发现作者采用了主动推送的方式)

决定试一试,下面是踩坑的过程,让小牛一一来做。

百度收录键

注册并登录百度搜索资源平台

点击用户中心、站点管理、添加网站

使用html标签验证来验证网站

直接将标签复制到source\_data\head.swig即可(作者使用的是NEXT主题,其他主题可以自行探索),格式如下:

{% if theme.baidu_site_verification %}
  
{% endif %}

同时在主题的_config.yml中搜索SEO.setting,修改如下


# Baidu Webmaster tools verification.
# See: https://ziyuan.baidu.com/site
baidu_site_verification: true
# Enable baidu push so that the blog will push the url to baidu automatically which is very helpful for SEO.
baidu_push: true    

(当然,你也可以直接在主题的_config.yml的baidu_site_verification中填写token,不需要先赋值true,然后在模板中填写,下次就不想改了= =)

最后,编译并发布博客。 在博客主页上按 F12。 如果看到head标签中有验证标签,则说明成功,如下:

验证通过后,进入网站:

这里额外增加一个自动推送方式(#发现next已经集成了,百度收录的自动推送方式就是上面的配置baidu_push: true)

然后修改themes\next\layout\_scripts\baidu_push.swig(如果不存在则创建此文件)并添加以下代码:

{% if theme.baidu_push %}

{% endif %}

这样的话,每次访问博客中的页面时,都会自动提交给百度。 (和我们接下来要讲的主动推送没有冲突)。

当然,我们需要的是百度提交的秘钥:

在搜索服务、通用采集、API提交中,记下下面的接口调用地址【在百度站长平台注册的域名,key】

复制秘钥,稍后会用到

Bing包含密钥注册,登录Bing新站长平台

添加网站

像百度一样,选择HTML Meta标签

只需将标签复制到source\_data\head.swig即可(作者使用的是NEXT主题google收录百度不收录,其他主题可以自行探索),格式如下:

{% if theme.bing_site_verification %}
  
{% endif %}

同时在主题的_config.yml中搜索seo.setting,修改如下

# Bing Webmaster tools verification.
# See: https://www.bing.com/webmaster
bing_site_verification: true

验证通过后,进入网站

单击 URL Submit,然后单击设置图标、API Access、API Key,并记下 API Key

复制密钥,稍后会用到。

Google 集合密钥(此部分已弃用并跳过)

这部分是相当麻烦的。 我花了很长时间才完成所有配置。 不幸的是,即使我在中国有代理,我也无法提交。 插件作者使用了cl来解决这个问题,但我个人觉得没有必要。 这部分功能已被弃用,已使用 Google sitemap 代替。 等待作者更新更好的解决方案!

参考Google Developers Google开发平台官方文档

在 Google API 控制台中创建一个项目,启用 Indexing API 并创建凭据。

按照提示创建项目并创建服务帐号。您只需按照提示在网站上进行配置操作,无需完成获取access token等后续操作。

创建服务帐户

创建密钥并选择json格式

授予 G Suite 域范围的委派权限(不执行此步骤,跳过它)

在 Search Console 中验证网站所有权

最好选择域资源验证方式。 只需一个域名即可匹配多种格式的URL。 然后您将获得一个 TXT 记录值。 将其复制到您的域名DNS,添加TXT记录,然后单击验证。

(Maverick域名是在阿里云上购买的,所以去阿里云的DNS上添加一条TXT记录即可)

然后返回Google站长网站进行验证。

选择用户和权限。点击添加所有者

邮箱地址为:创建项目时下载的JSON私钥中的client_email

场地

电子邮件地址格式如下所示:

my-service-account@project-name.google.com.iam.gserviceaccount.com

获取access token以及后续不必要的操作。

如果您只是按照Google官方文档在Google新版搜索控制台中添加权限电子邮件,仍然会提示您没有权限。请前往旧版站长工具,点击您的网站,将您的电子邮件地址添加到它

将获取到的json密钥文件放在hexo根目录下(与hexo_config.yml文件同一位置)配置hexo下载插件(我已经改成淘宝源了)

cnpm install --save hexo-submit-urls-to-search-engine

修改站点的配置文件(编辑hexo的_config.yml)

hexo_submit_urls_to_search_engine:
  submit_condition: count #链接被提交的条件,可选值:count | period 现仅支持count
  count: 10 # 提交最新的10个链接
  period: 900 # 提交修改时间在 900 秒内的链接
  google: 0 # 是否向Google提交,可选值:1 | 0(0:否;1:是)
  bing: 1 # 是否向bing提交,可选值:1 | 0(0:否;1:是)
  baidu: 1 # 是否向baidu提交,可选值:1 | 0(0:否;1:是)
  txt_path: submit_urls.txt ## 文本文档名, 需要推送的链接会保存在此文本文档里
  baidu_host: https://cjh0613.github.io ## 在百度站长平台中注册的域名
  baidu_token: 请按照文档说明获取 ## 请注意这是您的秘钥, 所以请不要把它直接发布在公众仓库里!
  bing_host: https://cjh0613.github.io ## 在bing站长平台中注册的域名
  bing_token: 请按照文档说明获取 ## 请注意这是您的秘钥, 所以请不要把它直接发布在公众仓库里!
  google_host: https://cjh0613.github.io ## 在google站长平台中注册的域名
  google_key_file: Project.json #存放google key的json文件,放于网站根目录(与hexo _config.yml文件位置相同),请不要把json文件内容直接发布在公众仓库里!
  replace: 0  # 是否替换链接中的部分字符串,可选值:1 | 0(0:否;1:是)
  find_what: http://cjh0613.github.io/blog
  replace_with: https://cjh0613.com

完成上述配置后,在Hexo根目录下运行hexo g命令时,会生成一个.txt文件,用于存放要推送的链接。

发现一个错误:

看了3秒,我发现罪魁祸首就是复制成中文的冒号。 把它改成英文就可以了。

运行成功

我发现找不到submit_urls.txt。 最后搜索了一下,在public目录下找到了。

您可以打开该文件检查链接是否正确。 如果没有,请访问hexo的_config.yml进行配置。 您还可以在推送链接之前手动修改此 .txt 文件。

一切正常

配置部署

修改站点文件的_config.yml,找到deploy

deploy:
- type: git ##注意这个前面也要加 -
  repo: git@xxx
  branch: master 
  #添加本插件的配置项:
- type: cjh_google_url_submitter
- type: cjh_bing_url_submitter
- type: cjh_baidu_url_submitter

这样执行hexo d就会运行这个插件并推送博客。

我们再次执行golden 3命令:

hexo clean
hexo g
hexo d

解:每种类型:上面前面都有-

如果部分链接推送失败,请手动处理:根据反馈修改保存提交链接的txt(一般是删除推送成功的链接),然后直接运行hexo deploy重新推送即可,无需重新生成网站。

返回的消息

推送成功的返回信息格式如下:

必须

Bing response:  { d: null }

百度

Baidu response:  {"remain":2999,"success":1}

谷歌

Google response:  { urlNotificationMetadata:
   { url:
      'https://cjh0613.github.io',
     latestUpdate:
      { url:
         'https://cjh0613.github.io',
        type: 'URL_UPDATED',
        notifyTime: '2020-06-12T05:37:25.701779228Z' } } }

经测试,百度、Bing可以,谷歌不行,而且一直报错:

插件作者原话:

认为没有必要使用cl后,Google转而使用sitemap,因为Google的收录速度比百度快很多,所以问题不大。

配置 Google Sitemap 下载插件

cnpm install hexo-generator-sitemap --save 

配置Hexo的_config.yml

sitemap:
    path: sitemap.xml

另请注意,在根目录下的_config.yml文件中,大约第17行处google收录百度不收录,url更改为在百度站长平台上添加的域名,即您网站的首页地址:

# URL
url: https://www.xiaoniuhululu.com

执行hexo g重新生成会在public目录下生成sitemap.xml文件。 发布后,您可以在 Google 控制台中提交此站点地图。

然后执行hexo d部署网站,然后访问您的homepage/sitemap.xml即可看到站点地图。

例如我的是:

https://xiaoniuhululu.com/sitemap.xml

谷歌站长平台(这部分需要科学上网)

进入 Google 网站管理员平台并登录您的 Google 帐户后,系统会要求您验证网站所有权:

最好选择域资源验证方式。 只需一个域名即可匹配多种格式的URL。 之后,您将获得一个 TXT 记录值。 将其复制到您的域名DNS,添加TXT记录,然后单击验证。

(Maverick域名是在阿里云上购买的,所以去阿里云的DNS上添加一条TXT记录即可)

然后返回Google站长网站进行验证。

提交给Google以供收录并选择站点地图

再次站点:

建议顺便提交百度和Bing站点地图。 无论如何都不会有冲突。

概括

百度站长平台:

谷歌网站管理员平台:

Bing站长平台:

里面有各种功能,你可以看到网站提交或收录的相关数据,并耐心等待搜索引擎收录。

网站推广固然重要,但当然如果你想留住上网的兄弟姐妹,你的文章内容一定要过硬。

参考文档:#%E7%99%BE%E5%BA%A6

本文到此结束。 如果喜欢的话请多多支持和关注!

随机内容