国外

在伦敦最近举行的一次国际搜索营销会议上,观众提出的最常见的问题是“我如何通过全球和本地搜索引擎找到我的内容并将其编入索引

”在休息期间,我与一些表示很少或没有表达的人交谈过

主要引擎对其本地市场内容进行索引对这些网站的仔细检查显示,他们都在使用某种形式的语言检测

在两种情况下,他们正在进行语言检测,因为他们看到谷歌这样做,并认为这是最好的方法但是,如果你像我一样并经常旅行到其他国家,你知道这个假设可能导致一个大问题:仅仅因为我身处一个特定的国家并不一定意味着它的母语是我希望的内容看看有其他因素发挥作用,例如我的浏览器默认语言,我用于查询的语言等等让我们深入了解动态语言和loca检测和探索您应该做的一些事情,以使过程更好地工作您的默认动态语言响应是什么

浏览器级语言检测是确定语言首选项的最常用方法您的Web服务器只是通过“accept-language header”查看提交给服务器的访问者语言首选项,然后查找并提供包含该语言代码的任何内容

例如,下载法语版Firefox的人通常会将其默认语言首选项设置为“French”或“French_France”

当他们访问您的站点时,服务器将读取首选项并自动将访问者重定向到站点的法语版本虽然使用接受语言标题可以是确定用户语言的良好起点,但它常常被误用于“假设”他们的位置虽然确定搜索者的语言偏好以便为他们提供本地内容可以有很多优点,但是当地货币,甚至可能更适合访客的格式化电话号码,也有可能如果您默认使用浏览器语言首选项而不考虑其他因素,则会对您的搜索营销计划造成灾难性影响搜索营销人员的问题是,大多数搜索引擎抓取工具都不使用“接受语言标题”,因此不会发送语言首选项在请求页面时不发送首选项,它们是服务器的“默认”语言您是否知道服务器的默认语言

默认情况下,许多Web服务器(尤其是NET和IIS服务器)将默认使用英语,这意味着搜索引擎抓取工具只会看到您网站的英语版本,无论您是否有其他语言的大量内容您的IP检测是否默认位置使抓取工具无法找到您的本地内容

我在会议中遇到的所有这些问题站点都使用IP位置检测脚本本质上,这些脚本接收站点访问者的IP位置,并根据访问者连接到Internet的县和/或城市为他们提供预定内容

例如,我在德国柏林写这篇文章当我去Googlecom时,服务器检测到我在德国并将我引导到Googlede并以德语显示主页对我来说,母语为英语的人,我必须采取措施反击这一点并选择谷歌英语来获取我需要的内容这是搜索引擎抓取工具的一个主要问题问题是,大多数搜索引擎抓取工具从特定国家/地区抓取但我看到谷歌抓取工具偶尔来自苏黎世他们是从加利福尼亚州山景城的主数据中心进行主要爬网由于爬虫位置,无论他们到达您的站点,检测脚本都只会将它们路由到E英语或以美国为中心的内容 - 再次使其他语言和国家/地区的内容对抓取工具不可见测试默认设置并制作例外要真正了解您的服务器正在执行的操作,您需要对其进行测试,以便您确信他们正在为其提供正确的内容所有情况,特别是对爬虫来说只是询问你的IT团队发生了什么事情,从来都不足以证明正确的设置 最可靠的测试是让同事或客户从不同位置访问站点,打开和关闭不同的语言设置,以查看每种情况发生的情况您不仅应检查服务器的默认设置,还应检查任何订阅服务您的公司可以部署诸如Akamai的全球流量管理IP智能或cyScape的CountryHawk IP检测解决方案对于这些工具以及Web上的任何其他脚本,您需要确保已加载重定向规则的例外以忽略主要搜索爬虫的用户代理名称,以允许他们访问他们请求的页面最后,您应该为站点的每个本地版本开发本地语言/国家XML站点地图并注册它们,以便爬虫可以直接访问页面和索引您的内容本文中表达的观点是客座作者的观点,而不一定是搜索引擎土地工作人员的作者列在这里