谜致力打造黑帽SEO培训行业第一品牌
SEO优化服务:正规SEO培训教程、黑帽SEO培训技术
SEO行业资讯

当前位置:主页 > SEO行业资讯 > 5个额外的数据混合示例,用于更智能的SEO洞察

5个额外的数据混合示例,用于更智能的SEO洞察

来源:黑帽SEO培训 dozu.com.cn发布时间:2019/03/27

将列预处理为一致格式后,其他数据混合选项包括使用搜索点击确定页面优先级,挖掘内部网站搜索内容空白,分析404页面等的流量问题。
当您开始将您的搜索引擎优化工作转移到更多数据驱动时,您自然会查看您手中的所有数据源,并且可能会发现提出新的数据混合想法具有挑战性。这是一个我经常使用的简单快捷方式:我不是从我拥有的数据源开始(自下而上),而是我需要回答的问题,然后编译我需要的数据。
黑帽SEO培训推荐的本文中,我们将探讨我们可以通过数据混合解决的5个额外的SEO问题,但在我们深入研究之前,我想解决在将这种技术付诸实践时将面临的一些挑战。
当您连接单独的数据集时,需要以相同的方式格式化公共列以使此技术起作用。然而,情况并非如此。您经常需要在连接操作之前预先处理列。
在Tableau,Power BI和类似的商业智能工具中执行高级数据连接相对容易,但是当您需要对列进行预处理时,学习一点Python会得到回报。
网址
绝对的或相对的。您经常会找到绝对和相对URL。例如,谷歌 Analytics网址是相对的,而来自SEO蜘蛛网抓取的网址是绝对的。您可以将两者都转换为相对或绝对。
以下是如何将相对URL转换为绝对URL:
区分大小写。大多数URL都区分大小写,但如果站点托管在Windows Server上,您通常会发现具有不同大小写的URL返回相同的内容。您可以将两者都转换为小写或大写。
以下是如何将它们转换为大写:
编码。有时,URL来自另一个源URL的URL参数,如果它们具有查询字符串,则它们将被URL编码。提取参数值时,您使用的库可能会也可能不会为您执行此操作。
以下是如何解码URL编码的URL
参数处理。如果网址包含多个网址参数,则可能会遇到以下问题:
您可能没有值的参数。
您可能有冗余/不必要的参数。
您可能有不同的顺序参数
以下是我们如何解决这些问题。
日期
日期可以有多种不同的格式。主要策略是将它们的源格式解析为Python 日期时间对象。您可以选择操作日期时间对象。例如,要正确排序日期或本地化到特定时区。但是,最重要的是,您可以使用一致的约定轻松格式化日期时间日期。
这里有些例子:
关键词
在不同数据集之间正确匹配关键字也是一项挑战。您需要查看列以查看关键字是否显示为用户输入关键字,或者是否存在任何规范化。
例如,用户通过复制和粘贴文本进行搜索的情况并不少见。这种类型的关键字搜索将包括在键入时通常不会出现的连字符,引号,商标符号等。但是,在键入时,间隔和大写可能在用户之间不一致。
为了规范化关键字,您需要至少删除任何不必要的字符和符号,删除额外的间距并以小写(或大写)标准化。
以下是在Python中如何做到这一点:
现在我们知道了如何预处理列,让我们来看看文章的有趣部分。让我们回顾一些额外的SEO数据混合示例:
搜索点击的错误页面
您从Web服务器日志中获取了大量404错误,因为谷歌 Search Console无法轻松获取完整列表。现在,您需要重定向其中大部分以恢复丢失的流量。您可以使用的一种方法是使用搜索点击确定页面的优先级,从最受欢迎的页面开始!
以下是您需要的数据:
谷歌 Search Console:页面,点击次数
Web服务器日志:HTTP请求,状态代码= 404
公共列(用于合并功能):left_on:page,right_on:HTTP请求。
页面缺少谷歌 Analytics跟踪代码
有些网站选择手动插入跟踪代码,而不是将其放在网页模板上。由于页面缺少跟踪代码,这可能导致流量少报问题。您可以抓取该网站以查找此类网页,但如果网站未在网站内链接,该怎么办?您可以使用的一种方法是在同一时间段内比较谷歌 Analytics和谷歌 Search Console中的网页。GSC数据集中但GA集中缺少的任何页面都可能缺少GA跟踪脚本。
以下是您需要的数据:
谷歌 Search Console:日期,页面
谷歌 Analytics:ga:date,ga:landingPagePath,已过滤到谷歌自然搜索。
常用列(用于合并功能):left_on:page,right_on:ga:landingPagePath。
从谷歌 Analytics报告中排除404页面
在模板中插入跟踪代码的一个缺点是谷歌 Analytics网页浏览量可能会在用户最终进入404页面时触发。这通常不是问题,但是当您尝试分析流量问题时,它会使您的生活变得复杂,并且无法分辨哪些流量是好的并且以实际页面内容结束,哪些是坏的并且以错误结束。您可以使用的一种方法是将谷歌 Analytics中的网页与从网站抓取的返回200状态代码的网页进行比较。
以下是您需要的数据:
网站抓取:网址,状态代码= 200
谷歌Analytics:ga:landingPagePath
常用列(用于合并功能):left_on:URL,right_on:ga:landingPagePath
挖掘内部站点搜索内容差距
假设您在谷歌 Analytics中查看内部网站搜索报告,并查找来自自然搜索的用户,然后执行一项或多项内部搜索,直到找到他们的内容为止。可能会出现缺少内容片段的情况,这些内容片段可以直接从有机搜索中驱动这些访问者。您可以使用的一种方法是将内部搜索关键字与谷歌 Search Console中的关键字进行比较。这两个数据集应使用相同的日期范围。
以下是您需要的数据:
谷歌Analytics:ga:date,ga:searchKeyword,已过滤到谷歌自然搜索。
谷歌Search Console:日期,关键字
常用列(用于合并功能):left_on:ga:searchKeyword,right_on:keyword
检查谷歌购物自然搜索性能
谷歌 上个月宣布,谷歌购物Feed中列出的产品现在可以显示在自然搜索结果中。我认为检查您获得的流量与常规有机列表相比会很有用。如果您向Feed中的网址添加其他跟踪参数,则可以使用谷歌Search Console数据来比较常规列表与有机购物列表中显示的相同产品。
网站首页| 关于谜 | SEO行业资讯 |

© 2009-2019 【谜】黑帽SEO技术培训服务官网版权所有 地图

宗旨:教会初学者控制白帽与黑帽间的【度】