您现在的位置是: 首页 > 网站优化 网站优化
搜索引擎优化答案_搜索引擎优化答案是什么
zmhk 2024-05-02 人已围观
简介搜索引擎优化答案_搜索引擎优化答案是什么 好久不见了,今天我想和大家探讨一下关于“搜索引擎优化答案”的话题。如果你对这个领域还不太了解,那么这篇文章就是
好久不见了,今天我想和大家探讨一下关于“搜索引擎优化答案”的话题。如果你对这个领域还不太了解,那么这篇文章就是为你准备的,让我们一看看吧。
1.SEO优化的基本策略有哪些?
2.SEO是怎么回事
3.搜索引擎优化有哪几个步骤
4.seo优化如何做?
5.百度seo优化问答推广营销怎么做?
6.搜索引擎关键字如何优化
SEO优化的基本策略有哪些?
1、关键词策略:
确定网站的核心关键词。网页中一切可让搜寻引擎抓取的文本中都尽量带有关键词。这些地方包括:域名、title和meta标签、正文、联结文本、文件名 、alt、header标签(即正文标题<H1>, <H2>, <H3>等)。让你的关键词无所不在,但又避免在同一处堆砌过多。
关键词选择技巧:相关性(即定位)、热门度的掌握(太热不好容易排前,太冷没人搜索)
2、域名策略:
域名中最好含有你的关键字,并且采用连字符「-」将该关键字单独突显出来以方便搜寻引擎识别。有专家认为域名中含有关键字对于排名的作用微弱,但不可否认确有作用,因此能够兼顾的情况下尽量考虑采用关键字域名。
二、三级域名显然没有什么竞争优势。
3、虚拟主机策略:
检验共享IP地址网站:目前大都是多个中小网站共享一台虚拟主机,拥有同一IP地址。如果跟你共享IP的某一个网站被搜寻引擎惩罚,将连累你也无法登录到搜寻引擎。除此之外,由于一个IP往往拥有上百个网站,因此会影响你的网页下载速度。特别是如果其中某些网站流量特别大的时候。如果搜寻引擎在抓取某个页面时该页半天下载不了,搜索机器人将弃之而去。因此,除了了解多少网站与你共享IP,是否有受到惩罚,最好再了解它们的流量大致情况。如果情况不妙,赶紧换主机。
此外,搜寻引擎都不愿收录免费主页空间上的网站,即使收录,也难有好的排名。
工具推荐: 通过域名获知你的IP地址: /gb/broadmeter/tracemap/domaintoip.htm
通过IP地址获知共享网站的数量和地址:.tw/seo.gif" width="300』 height="100" border=0 alt="《Email营销》(冯英健着) ">
包括图像在内的一页网页字节数最好不要超过50K
9、网站地图策略:
基于文本的网站地图内含网站所有栏目、子栏目。网站地图的三大因素:文本、连结、关键词,都极其有利于搜寻引擎抓取主要页面内容。因此,动态生成目录网站尤其需要创建网站地图。网页栏目若有所更新需要及时在网站地图上体现出来。
举例:微软网站的Site Map
10、title和meta标签策略:
搜寻引擎优化基本功:title标题内容将以连结标题的形式显示于搜索结果页面。标题一般是网站名称+简短描述,含核心关键词,如:<title>时代营销,网路行销专业门户</title>,就好过单纯的<title>时代营销</title>。
meta中的关键词(keywords)和描述(description):确定几个核心关键词及组合,关键词以3-5个为宜,最好不要超过15个,以避免堆砌之嫌。描述是网站的简短说明,含有关键词。
如果每个主要页面的内容相差很大,则应根据网页内容不同而改变title和meta标签,不要全部网页都采用首页的标题和标签。
网页文本内容需出现该页关键词,关键词密度在3%-7%之间。太多有堆砌之嫌。
搜索结果页面在连结标题之后显示的描述文字一般是搜寻引擎在本页正文中最先抓取到的含有关键词的那段文本。据说通常在网页左上角方向出现这段文字最有利。
11、连结策略:
尽可能多地让其他跟你主题相关的网站连结你,目前已成为在搜寻引擎排名成功的关键性因素。有了这些网站连结你,即使不向搜寻引擎提交网站,搜寻引擎也自然找到你并给予好的排名。
另一方面,如果网站提供与主题相关的导出连结,被搜寻引擎认为有丰富的与主题相关的内容,也有利于排名(这一点值得转摘高手们反思)。
12、避免惩罚:
搜寻引擎对于蒙蔽它的手段识别越来越精,以下常用方法很容易收到惩罚,拒绝收录:
隐藏文本,或无意间将文本文字设为背景色;
关键词堆砌;
主动连结到link farm网站
SEO是怎么回事
SEO(SearchEngineOptimization):汉译为搜索引擎优化。是一种方式:利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。目的:为网站提供生态式的自我营销解决方案,让其在行业内占据领先地位,获得品牌收益;SEO包含站外SEO和站内SEO两方面;为了从搜索引擎中获得更多的免费流量,从网站结构、内容建设方案、用户互动传播、页面等角度进行合理规划,还会使搜索引擎中显示的网站相关信息对用户来说更具有吸引力。
扩展资料
优化策略
1、主题要明确,内容要丰富
在设计制作网站之前,要清晰设定网络的主题、用途和内容。根据不同的用途来定位网站特性,可以是销售平台也可以是宣传网站,网站主题须明确突出,内容丰富饱满,以符合用户体验为原则。
对于一个网站来说,优化网站的主题与实际内容才是最为重要的。一个网站需要有鲜明的主题,丰富的与主题相关的内容,专注于某些领域的变化的,及时更新。
2、引出链接要人气化
搜索引擎判断网站的好坏的一个标准是外部链接的多少以及所链接的网站质量。创建有人气化的、有意义的引出链接,提高链接广泛度,既能提高在搜索引擎的排名,同时也可以起到互相宣传的作用。研究表明:当一个网站的链接PR值达到4-6,那么这个网页的访问量比较好;
当链接PR值达到7以上,那么网站的质量与知名度都很优秀了。如果一个网页被其他网页链接得越多,那么该网页越有可能有最新和最有价值的高质量网页。
尽可能增加与行业网站、地区商务平台和合作伙伴网站之间的链接,被PR高的网站引用能更快地提高本站的PR,同时开发人员可以在访问量较大、PR值较高网站上发表与网站主题以及业务相关的信息,用户在别的网站看到这些信息,进而访问该网站,即通过外部链接来提高该网站的访问量。
3、关键词设定要突出
网站的关键词非常重要,它决定网站是否能被用户搜索到,因此在关键词的选择上要特意注意。关键词的选择必须突出,遵循一定的原则,如:关键词要与网站主题相关,不要一味的追求热门词汇;避免使用含义很广的一般性词汇;根据产品的种类及特性,尽可能选取具体的词;
选取人们在使用搜索引擎时常用到与网站所需推广的产品及服务相关的词。
5至10个关键词数量是比较适中的,密度可为2%—8%。要重视在标题(PageTitle)、段落标题(Heading)这两个网页中最重要最显眼的位置体现关键词,还须在网页内容、的alt属性、META标签等网页描述上均可不同的程度设置突出关键词。
4、网站架构层次要清晰
网站结构上尽量避免采用框架结构,导航条尽量不使用FLASH按钮。首先要重视网站首页的设计,因为网站的首页被搜索引擎检测到的概率要比其他网页大得多。
通常要将网站的首页文件放在网站的根目录下,因为根目录下的检索速度最快。其次要注意网站的层次(即子目录)不宜太多,一级目录不超过两个层次,详细目录也不要超过四个层次。最后,网站的导航尽量使用纯文字进行导航,因为文本要比表达的信息更多。
5、页面容量要合理化
网页分为静态网页与动态网页两种,动态网页即具有交互功能的网页,也就是通过数据库搜索返回数据,这样搜索引擎在搜索时所费的时间较长,而且一旦数据库中的内容更新,搜索引擎抓取的数据也不再准确,所以搜索引擎很少收录动态网页,排名结果也不好。
而静态网页不具备交互功能,即单纯的信息介绍,搜索引擎搜索时所费时间短,而且准确,所以愿意收录,排名结果比较好。所以网站要尽量使用静态网页,减少使用动态网页。
网页容量越小显示速度越快,对搜索引擎蜘蛛程序的友好度越高,因而在制作网页的时候要尽量精简HTML代码,通常网页容量不超过15kB。网页中的Java.script和CSS尽可能和网页分离。应该鼓励遵循W3C的规范使用,更规范的XHTML和XML作为显示格式。
6、网站导航要清晰化
搜素引擎是通过专有的蜘蛛程序来查找出每一个网页上的HTML代码,当网页上有链接时就逐个搜索,直到没有指向任何页面的链接。蜘蛛程序需要访问完所有的页面需要花费很长的时间,所以网站的导航需要便于蜘蛛程序进行索引收录。
可根据自己的网站结构,制作网站地图,在网页地图中列出网站所有子栏目的链接,并将网站中所有的文件放在网站的根目录下。网站地图可增加搜索引擎友好度,可让蜘蛛程序快速访问整个站点上的所有网页和栏目。
7、网站发布要更新
为了更好的实现与搜索引擎对话,将经过优化的企业网站主动提交到各搜索引擎,让其免费收录,争取较好的自然排名。一个网站如果能够进行有规律的更新,那么搜索引擎更容易收录。因而合理的更新网站也是搜索引擎优化的一个重要方法。
百度百科-搜索引擎优化
搜索引擎优化有哪几个步骤
SEO(Search Engine Optimization)意为“搜索引擎优化”。这个优化只的是对网站的优化,意思就是对网站整体修改,在符合搜索引擎的搜索原则,尽量让网站对搜索引擎友好,使网站在搜索引擎中排名靠前。
做SEO不需要会编程,不需要去了解搜索引擎的技术细节,但是必须去了解搜索引擎的基本工作原理。虽然搜索引擎的种类很多,国内的百度,雅虎,搜狗,搜搜;国外的谷歌,必应。他们各自都拥有各自的搜索技术,彼此的技术又有一些的不同,但是搜索的基本原则类似。
SEO既是一种技术,又是一种网络营销的手段。它属于被动式的营销,通过迎合用户的搜索习惯,来达到营销的目的。关于搜索引擎营销将在下一篇详细介绍。SEO是使用一些技巧,来到达搜索引擎优化的效果。那么怎么怎么才能使搜索引擎“听话”呢?
这些被统称为SEO的技巧,就是根据搜索引擎对各个网站的审核原则和判断标准,来对网站的结构,内容,上的优化,使其对搜索引擎更加的有好,有更多的内容被收录,从而提高网站的访问量,提高搜索引擎中的排名,最终提升网站的宣传能力或者销售能力的技术。
seo优化如何做?
1、 站内锚文字链接
1) 结合SEO关键词给资讯页增加锚文字超链接
2) 每个页面锚文字控制在1-3个内
3) 链接的页面要与关键词相关性高
4) 不要用一直用同一个关键词链接一个URL,尽量多用不同的锚文字。让链接看起来更自然。
5) 重点页面链接要特殊对待(首页、专题页等)
2、 页面关键词布局及密度
1) 检查各个页面title\keyword\description是否完整,关键词有没有布局。(按首页--频道页--专题页--列表页--详细页)
2) 页面关键词只涉及到当前页面的内容,而不去涉及整个网站、所在频道等内容。
3) 产品类的标题也可以作为一个比较具体的关键词。
4) 站在受众的角度考虑,结合用户的一些搜索习惯,来填写适当的关键词。(可参照百度的相关搜索)。
5) 不同的关键词一定要用英文下的逗号, (,)隔开。
6) 关键词以3-5个为宜。
7) 检查各个页面的关键词在页面中所在的密度大小(建议在5%)可以通过产品评论来控制
3、 检查资讯写作规范
1)文章的首段一定要出现页面关键词,并且可以把首段出现的部分页面关键词加粗。
2) 文章的末段也要出现页面关键词,尽可能的将页面关键词安排在文章的结尾部分。
3) 页面关键词在文章的正文中要有一定的比例分布(一般情况下是2-8%),在不影响阅读的前提下,一些代词都可以用页面关键词来代替。
4) 页面关键词在一篇文章中表达要统一。
4、 检查规范
1)所有产品、资讯引用在上传的时候都应该加上ALT属性,并且ALT属性必须符合本身的内容,同时也要尽可能的包含页面关键词。 <img src="…" alt="关键词" width="90" height="72" /></img>
2)每副下都应该配有适当的文字说明,并且文字说明中要包含页面关键词。
3)对于资讯类的文章来说,尽量不要放过多(1-3张内),如果能放网站的产品最好。
4)如果产品需要做超链接的,加上title标题说明。
Alt属性的写法
比较好的写法(描述了内容,又不忘嵌套进关键词):
<img src="logo.jpg" alt="网站logo"/>
警告写法(关键词堆砌,尽量避免,否则后患无穷):
<img src="logo.jpg" alt="关键词"/>
5、协助整理化妆品方面的长尾关键词及实时的热门关键词
6、搜集竞争对手的关键词及外链
百度seo优化问答推广营销怎么做?
作为一个新手,刚接触搜索引擎优化(SEO)的时候我们需要知道SEO优化是什么?做SEO优化的目的是什么?如何去做SEO优化?百度百科的“搜索引擎优化”词条给了我们前两问的答案。搜索引擎优化(SEO)是一种利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名的方式,网站从搜索引擎中获取流量,继而实现产品或者服务咨询及成交,SEO优化就是要迎合搜索引擎的规则、满足用户的需求。
如何做seo优化
1、关键词分析
删除那些效用较低的关键词,显示对网站产品最相关的那部分词,对每个关键字进行搜索计算列在搜索结果中的内容,直到找出属于网站的关键词列表。
2、用户搜索需求分析
用户搜索需求分析是非常重要的一步,通过百度搜索的“下拉框”、“相关搜索”、“百度指数”等工具,可以查询到用户最为关心的问题,用户关心的问题是我们在确定关键词时的重点参考。
3、文章内容和关键词的融合
什么叫做关键词融合呢?就是在一篇文章中要出现你要做上去的关键词。在融合关键词的同时也要注意文章的连贯性,不要强行把关键词加进去。
4、内链
内链是站内优化很重要的一部分,有效的内链能够增加搜索引擎蜘蛛在你网站的爬取深度,爬取的深度越深,文章的收录量就会增加。
5、网站地图
网站地图能让搜索引擎对你的网站一目了然,更加利于爬行和抓取。
6、外链建设
有一句话叫“内容为皇,外链为王”这句话是没有说错的。如果一个网站你什么外链也不做,那么蜘蛛的爬行频率就会低很多。爬行频率低了,网站收录就会很慢,收录慢了就意味着网站排名也会很慢。
那么新手如何做好seo优化呢?
1、最初的知识积累:了解SEO优化的专业术语,了解搜索引擎的工作原理。
2、学习资料要找准:一般基础的网上都有相关教程介绍,基础教程大多都差不多,但是思维上的教程却不一样,每一种方法都有不同的操作手法,学习的教程也有质量等级分成。
3、熟悉常用的工具:关键词优化工具、数据统计工具,包括百度统计、爱站网、站长之家等等。
4、善于与人沟通:前辈的经验阅历都是值得学习的,自己闭门造车是行不通的。
5、学会写原创文章:一篇有价值的原创文章带来的流量是其他文章不能比拟的。
6、实践中出真知:在实践中积累经验,不要一味求成,很少有做一个网站就能成功的,这是一个过程。
搜索引擎关键字如何优化
一般来说,网络seo优化推广营销可以分为六个小步骤: 1、关键词分析(也叫关键词定位) 这是百度seo营销推广中最重要的部分,关键词分析包括:关键词聚焦分析、竞争对手分析、关键词和网站关联分析、关键词布局、关键词排名预测。 2、网站架构分析 网站结构符合搜索引擎的爬虫选择,有利于网络优化营销推广。网站架构分析包括:消除网站架构的不良设计,实现树形结构,网站导航和链接优化。 3、网站目录和页面优化 百度seo优化推广不仅要使网站的主页在搜索引擎中有一个好的排名,还要使网站的每一页都带来流量。 4、内容发布和链接布置 搜索引擎喜欢定期更新网站内容,因此合理安排网站内容发布时间是网络seo优化推广营销优化的重要技术之一。链接布局将整个网站有机地连接在一起,让搜索引擎了解每个网页的重要性和关键词。 5、建立网站地图SiteMap 根据自己的网站结构,制作网站地图,让搜索引擎能过SiteMap就可以访问整个站点上的所有网页和栏目。 6、高质量的友情链接 建立高质量的友情链接,对于百度推广营销来说,可以提高网站的PR值和网站更新率,是非常关键的问题。
针对很多网友在询问关于SEO优化的各种问题,今天我做一个统一的回复,为大家清晰的解答。什么是SEO优化:“SEO”又叫“SEO优化”也叫“搜索引擎优化”,主要是利用类似于百度搜索引擎的规则进行相关信息的排名靠前。比如优化网站靠前、优化新闻信息靠前、优化问答靠前等。现在我们讲的SEO优化基本上说的就是在百度搜索引擎中进行优化。SEO优化需要掌握哪些知识:我们需要掌握的知识比较多,首先要掌握搜索引擎(比如百度)的相关规则,如资讯端规则、网页端规则、知道端规则等。并且还要了解一些基础知识:网站权重、内链、高质量外链等。如果我们是要优化官网的话,还要基础了解网站代码的原创度、网站的关键词、描述信息以及网站的ALT等。当然,在实际优化中会遇到很多问题,我们需要灵活运用。SEO优化找哪家公司合作:现在很多网络营销公司都有优化的服务,当然优化的能力都是不一样的,所以价格也是不一样的。但是我们要知道在“优化”的行业,有“白帽”和“黑帽”手法的说法。“白帽”就是正规的优化,收到搜索引擎的喜好;而“黑帽”优化是受搜索引擎打击的,严重的情况会直接被搜索引擎K。所以我们最好是自己要掌握一些seo的技术和技巧,这样就不会在合作中被骗。SEO学习的方式有哪些:想要学习SEO可以根据专业的SEO教学的网站学习,也可以报名参加相关的培训班或课程,采用线上和线下的学习。当然你也可以直接参考“像揭秘魔术一样解密网络营销”的由“互联网技术客”撰写的《网络营销推广技术、技巧深度解密》文档里的内容进行学习,总之学习的途径和方式还是比较多的。总的来说,一个新人想要学好SEO其实并不是一件很难的事。最后真心的希望大家在网络营销的道路上越走越远,越走越好!!!
SEO推广是由网站优化网络运营媒体宣传结合的一种技术,而现在恰好就是媒体最为流行,真因为如此很多的站长之知道利用自媒体推广网站,结果推广了几年网站权重只有2到3而已,导致和谐问题的关键就是没有结合其他主要的技术,原本做网络推广这块被称为SEM,不过很多新收SEO推广不知道SEM还有很多新站长错误了理解SEO,导致网站推广效率大大下降。千骏传媒总结了以下几种SEO推广方式:视频教程宣传当一个新网站上线后,第一是没有权重二没有收录三没有流量,也就是说什么都没有,那么我们就必须让我们的网站快速获得流量提高权重。最为可靠的就是先录制一套视频教程发布到视频网站上去,一般发布了就会很多的人去看,这样就会很快带动网站流量,权重马上马上就提高了。建立友谊链接网站有了权重很多新站长就是去关注网站收录的问题,其实不然,寻找权重收录比较快的网站做友谊链接,做好友谊链接网站收录自然而然变快。网站文章被收录了,在去建立高质量外链先去高权重的站长网投稿。新闻推广有了一定资源后必须快速完善互联网的体系,打开知名度和网络一批作者和粉丝,先用知识在门户网站吸引关注。搜索引擎产品建立有了资源就是建立网络体系,在搜索引擎网站推广的知名度,莫过于他们旗下的产品。如在门户网站发布的新闻报道做百科参考资料建百科。问答推广当有了一点点知名度就去问答平台推广网站的关键词,为的就是去建立信任度。经过一段时间的推广网站的关键词会上周围人都在搜索,或是身边人都在搜索。这样给网站带来的知名度非常高,只要有人看搜索栏右边的是个排名就会看到网站。吸引作者有了知名度,网站要发展不是一个人去完成的,而是到处去发现作者。还有一个就是文章搜索引擎排名推广也可以帮助别人推广。邀请作者一个站长需要发展扩大就需要引进有名气的作家来网站,去邀请那些有知名度的作家来网站开通专栏。利益下载软件提高访问量整理一些软件,打包后上传到网站,把这些整理好的软件,发布到别人的网站上,把网址留下在软件里面就可以了,软件组号是相同的软件用文件夹整理好以便于大家下载满载而归。广撒大网网站不是一个独立的链接,它是一个完整的圈子,站长走到这一步是要打造国内知名品牌,相信大家都会去把网站提交给一些知名的导航网,很多站长提交了都是不通过的,那是因为知名度和权重不够。
一、站外优化1、外链建设外链作为是网站优化的三大核心之一,也一直是搜索引擎核心算法的基础,但是外链是求质不求量,优质外链才能发挥好效果。简单操作就是在站外发布大量文章加上站内指向链接,可以加首页链接,也可以加内页链接。下面说下搭建外链的一些常见问题:1)怎样才算高质量外链?发布手段:避免机器群发、建议手动操作发布平台:站点相关、大型门户、正规行业内容价值:可读性强、对用户有价值、符合百度搜索规范和要求更新频率:避免断更、避免超量2)优质外链哪里找?外链交换平台:爱链、换链神器等购买外链:参考PR值同时关注网站整体、注意站点相关性、外链时效性,另外不要单次大量购买,可以分批进行。请点击输入描述2、外部推广引流做SEO不能单靠自然排名,因为SEO优化是一个长期的策略,需要花费一定的时间才能做出效果,这也算是它的一个劣势所在,如果你想立即看到效果预算也充足,却又没有太大精力和技术,可以辅助竞价排名等方式直接从外部引流,所以SEM推广和SEO推广是可以很好结合在一起的,而且在某些方面两者可以优劣互补。前面是180,中间是4627,最后是9049请点击输入描述3、关注百度算法更新百度算法的变化直接关联我们网站流量和排名,所以要随时关注百度算法的更新和动态咨询,适时做出相应的调整和优化,才能让自己网站继续更好生存在互联网大环境中。跟着官方脚步走,虽然不一定就能保障出到多好效果,但起码不会轻易出什么幺蛾子!二、站内优化1、网站结构优化网站设计要清晰,布局要合理导航层次分明,尽量扁平化。所以必须对搜索引擎友好度要高,必须有利搜索引擎蜘蛛的爬行和抓取。其次URL、404等方面也要做好,一切要从搜索引擎和用户体验角度来出发,如果是新网站的话,要做好SEO基础优化。请点击输入描述2、关键词优化关键词选择:主关键词、品牌关键词、长尾关键词关键词分布:金字塔结构、垂直拓展关键词密度:一般2%~8%左右适宜关键词精准挖掘:5118、爱站、百度下拉框等关键词优化的重点在于要先选择合适关键词,在去尽力提升排名,而且关键词布局的量一定要铺大,三五个词能带来的流量肯定是有限的。3、内容质量现在简直是"内容为王"的时代了,对内容的质量在提高,因为在海量信息的当今时代,人们其实也会快速过滤掉那些垃圾内容,优质的内容才是百度推荐和用户的不二之选。如果你的内容质量高,能真正给用户提供高价值,还是很容易爆流量的。关于如何写出高质量内容,可以参考下面文章:请点击输入描述关于SEO的内容今天分享就到这里,希望能对大家有所帮助。
首先要制定一个网站给网站选定关键词合理的网站布局合理的关键词布局
QA问句解析的七种方法及优化思路
1. 搜索引擎营销 (SEM)
搜索引擎营销(SEM)英文全称为Search Engine Marketing,意指通过搜索引擎进行服务和产品的营销。搜索引擎营销又主要分为两种:搜索引擎优化(SEO)和付费点击(PPC,Pay-Per- Click)。搜索引擎优化(SEO)指通过优化网站和页面并让它们在搜索结果的页面中展示,而付费点击(PPC)指通过购买搜索引擎的点击将用户带到自 己的网站。(通常)这些点击来自搜索结果页面中的“赞助商链接”(译注:显然不适用于百度)。
2. 反向链接(Backlink)
反向链接(Backlink)又称为“回指链接”“入链”和“简易链接”,指从其他网站指向你的网站的一个超级链接。反向链接之所以对SEO异常重要,是因为它们直接影响一个网页的页面等级(PageRank),以及这个页面在搜索结果中的排名。
3. 页面等级(PageRank)
页面等级( PageRank) 是Goolgle用来评估一个页面相对于其他页面的重要性的一个算法规则。这个算法规则最基本的意思就是说,如果A页面有一个链接指向B页面,那就可以看 作是A页面对B页面的一种信任或推荐。所以,如果一个页面的反向链接越多,再根据这些链接的价值加权越高,那搜索引擎就会判断这样的页面更为重要,页面等 级(PageRank)也就越高。
4. 链接诱饵(饵链)(Linkbait)
链接诱饵(Linkbait),顾名思义这是一个网站或一个博客上为了尽可能多地吸引反向链接(目的是提高网站的PR值)而存在的一段内容。通常,这些做 为诱饵的内容为文字内容,但也可以是一段视频、一张、一个测验或其他的热门的内容。最经典的诱饵内容的例子是“十大(Top 10)”,因为这样的内容在一些社交网站很容易流行起来成为热门话题(译注:这个话题貌似已经臭街了)。
5. 互链车间或互链作坊(Link farm)
互链工厂或互链作坊(Link farm)是指很多网站(通常数量很大)为了提高组成一个类似车间或作坊式的团体,通过彼此的互相链接来提高团体每一个的网站的页面评级的手段。早期,这种方法很有用,但现在已经成为一种不耻的作弊手段(并可能会收到惩罚)。
6. 锚文本(Anchor text)
锚文本(Anchor text)在反向链接中是指一个页面中可点击的文本,而其中的关键词对搜索引擎优化(SEO)有很大的帮助,因为Google会将这些关键词和你的内容关联起来。
7. 链接属性-NoFollow
Nofollow是网站管理员使用的一个链接属性,其目的是告诉搜索引擎他们并不是为该链接所指向的网站投票。这种链接也可能是网站用户自己创造的内容 (比如博客评论中的链接),或者是一个付费交易的链接(比如广告或赞助商的链接)。当Google识别到这些反向链接的NoFollow属性后,基本就不 会在页面评级和搜索结果排名的算法中将这些链接的贡献计算在内了。
8. 链接修饰(Link Sculpting)
链接修饰(Link Sculpting)是指网站管理员对网站上其他网站的反向链接进行属性设置。比如,管理员给链接添加Nofollow属性,这可以让管理员决定利用自己 的网站为具体某个网站提高页面评级,或者不帮助具体某个网站提高网页评级。不过,现在这种做法的作用已经微乎其微,因为Google已经决定要用自己的算 法来决定怎么处理链接的Nofollow属性。
9. 页面标题(Title Tag)
页面标题(Title Tag),顾名思义是指一个页面的标题中,这也是Google搜索算法中最重要的一个参考。理论上,你的页面标题要独一无二并尽可能多地包括页面内容中的关键词。你在浏览网页时可以从浏览器最上方看到一个网页的标题。
10. 元标签(Meta Tags)
元标签(Meta Tags)和页面标题一般,主要用于为搜索引擎提供更多关于你页面内容的信息。元标签位于HTML代码的头部,还有就是对长眼睛的访客是不可见的。
11. 搜索算法(Search Algorithm)
Google的搜索算法是为了给每一次搜索请求找到最为相关的网站和页面而设定。这个算法考量的因素超过200种(谷歌自称),其中包括页面等级、标题、元标签、网站内容,以及域名的年龄等。
12. 搜索结果页面(SERP)
搜索结果页面(SERP)的英文全称为Search Engine Results Page.基本上,这就是你平时在Google键入关键词回车后的页面了。你的网站从这个页面得到的流量取决于你的网站在搜索结果中的排名等级。
13. 沙盒(Sandbox)
Google除了所有网站的索引之外,还有一个单独的索引沙盒,那里面是新近发现和收录的网站。当你的网站存在这个沙盒之中时,它就不会在一般的搜索结果中出现,而只有当Google确认了你的网站是合法的,这才会将其从沙盒中移出进入所有网站的索引。
14. 关键词密度(Keyword Density)
如何判断一个特定页面的关键词密度?你只要将一个关键词使用的次数除以页面的总词数就可以了。关键词密度过去是搜索引擎优化中非常重要的一个因素,因为早期的搜索算法对此十分看重,但现在已经时过境迁了。
15.关键词堆积(Keyword Stuffing)
因为早期搜索算法对关键词密度非常看重,站长们便通过使用人工堆积关键词的手法来作弊和蒙骗搜索引擎。这种手法就叫做关键词堆积,当然现在已经没用了,而且你还可能会因此受到惩罚。
16. 障眼法(Cloaking)
障眼法(Cloaking)是指利用代码在同一个页面上让机器人和真人看到不一样的内容。其目的是为了让页面通过关键词而提升页面评级,而真正的目的是推销和出售各种不相关的产品或服务。当然,这也是一种作弊的手段,有很大可能会受到搜索引擎惩罚,甚至剔除。
17. 网络爬虫或网络蜘蛛(Web Crawler)
网络爬虫或网络蜘蛛(Web Crawler)也简称为爬虫或蜘蛛,代表搜索引擎在网路上进行浏览,目的是发现新的链接和页面,这是进行索引的第一个环节。
18. 复制内容(Duplicate Content)
复制内容(Duplicate Content)也叫“重复内容”,通常是指一个页面在引用了站内或站外的大段实质内容,或者是存在完全相同和极其相似的情况,而这也是一个网站应该尽量避免发生的情况,否则很容易让你的网站受到惩罚。
19. 标准链接(Canonical URL)
标准链接(Canonical URL)是指一个网页的链接要符合规范和标准。
20. 机器人协议(Robots.txt)
机器人协议(Robots.txt)不过是一个TXT文本文件,存在于你域名根目录之下,作用是将网站的目录结构信息告诉爬虫和蜘蛛,并限制其对特定文件夹和内容的访问,或者是完全将它们关在门外。
在 《浅谈智能搜索和对话式OS》 中,提到过,人机对话系统的常见场景有三种,分别为:闲聊型(Chatbot) 、问答型(QA) 、任务型(VPA) 。本篇文章所关注的解析方式主要适用于QA系统中的封闭域问答,也即:将用户问句解析为库中存在的标准问句 。这里讲的七种方法均为我个人阅读文献后归纳整理而来,并不都是成熟稳定可以商业化的做法,目的只是提出思路以作参考。
基于规则的方法通常在缺乏训练数据的情况下采用,由于与后面的基于统计的方法区别较大,所以记为第零种方法。
基于规则的解析系统通常由两部分构成:一个是『规则库』,解析规则通常为 CFG 上下文无关文法;另一个是『同义词库』,记录了一些标准词的常见同义词。
整个解析就是一个上下文无关文法归约的过程。首先进行自动分词,接着将用户问句中的词依照『同义词库』归约为标准词,然后再将词归约后的问句与『规则库』中的解析规则比对,一旦比对成功,即该条用户问句被成功归约到该条解析规则所对应的标准问句上。
举个例子,同义词库中有这样两条记录:『失败:不上去、不进去、不成功、错误』『登录:登陆、登录』,规则库中有这样一条规则:『账号登录失败:[账号][登录][失败]』。
有一条用户问句是这样的『我账号怎么登陆不上去了』。首先假定分词正确,分词结果为『我|账号|怎么|登陆|不上去|了』;之后进行词归约,归约结果为『我账号怎么登录失败了』;接着与规则『账号登录失败:[账号][登录][失败]』比对,发现比对成功。该条用户问句被成功归约为标准问句『账号登录失败』,我们将系统中『账号登录失败』所对应的标准答案提供给用户,完成交互流程。
这样做在一定程度上能够解决问题,但缺点也特别严重。首先『规则库』与『同义词库』需要人工构建,这需要巨大且长期的人力资源投入。因为语言的表达方式理论上是无限的,而能想到的规则和同义词总是有限的;且随着语言的发展,或是业务的变动,整个规则库和同义词库的维护也需要持续的人力资源投入。
其次,编写规则库需要丰富的经验,对于人员素质的要求极高。因为解析规则的抽象程度相当高,在这样高的抽象程度上,即便编写者具有较丰富的经验(如果没经验会更糟),不同解析规则之间的冲突也是不可避免的,也即同一条用户问句会与多条标准问句的解析规则比对成功,这种情况下的标准问句选择/评分问题,又需要另一套系统来解决。
换个角度,我们可以将依照用户问句找到标准问句的过程看做是输入 Query 得到 Document 的搜索过程。
我们可以尝试采用传统搜索引擎中使用的检索模型来进行用户问句解析。 《浅谈搜索引擎基础(上)》 中提到,BM25 是目前效果最好的检索模型,我们就以 BM25 模型为例来分析。
BM25 模型的计算公式如下:
BM25 模型计算公式融合了 4 个考虑因素:IDF 因子 、文档词频 、文档长度因子 和查询词频 ,并利用 3 个自由调节因子(k1、k2 和 b)对各种因子的权值进行调整组合。
其中,N 代表文档总数,n 代表出现对应单词的文档个数,f 指文档中出现对应单词的词频,qf 是查询语句中对应单词的词频,dl 是文档长度。
利用 BM25 模型可以有三种思路,分别把标准问句、标准问句及标准答案、历史中曾经正确匹配过该标准问句的用户问句集作为 Document,利用公式计算其与用户问句的相似度,然后利用相似度进行排序,取出评分最高的标准问句作为解析结果。
对于这个思路我没有做过实验,不过我推测,这种方法虽然节省了大量的人力,但在这种封闭域的 QA 系统中,其表现应当是不如上一种基于规则的方法,基于检索模型的方法在开放域中的表现会更好。
此外,基于传统检索模型的方法会存在一个固有缺陷,就是检索模型只能处理 Query 与 Document 有重合词的情况,传统检索模型无法处理词语的语义相关性。在上一种方法中,通过人工搭建的同义词库,一定程度上解决了语义相关性的问题。
上文提到,完全基于检索模型的方法无法处理词语的语义相关性。
为了在一定程度上解决这个问题,我们可以利用 LDA/SMT 等方法通过语料挖掘词之间的同义关系,为每个词自动构建一个同义度高于阈值且大小合适的同义词表。在代入检索模型公式进行计算的过程中,若文档中发现所查找关键词的同义词,可以依据同义程度乘以一定权重后纳入到关键词的词频计算之中。
《浅谈智能搜索和对话式OS》 中有对 LDA/SMT 的介绍。
简单的说,LDA 可以合理的将单词归类到不同的隐含主题之中;并且通过计算两篇文章主题向量 θ 的 KL 散度(相对熵),可以得到两篇文章的相似性。SMT 模型出自微软之手,目的即是将翻译模型引入传统检索模型,提高检索模型对语义相关词对的处理能力,该模型也曾被百度采用过以提高搜索引擎返回结果的质量。
word embedding 将词表示为 Distributed Representation,也即低维向量空间中的一个词向量,Distributed Representation 下的词可以利用余弦距离来计算词之间语义的相关关系。与 one-hot Representation 相对应,one-hot Representation 下的词向量的维数与单词表的维数相同,不同词的词向量之间均正交。传统的词集模型(SOW)和词袋模型(BOW)采用的即是 one-hot Representation。
我们可以采用深度学习的方法来得到词 Distributed Representation 的词向量。比如训练一个普通的神经概率语言模型,就可以得到词的词向量,或者参考 word2vec 中的方式,训练 CBOW 或者 Skip-gram 模型。神经概率语言模型、CBOW 以及 Skip-gram 的介绍在 《浅谈智能搜索和对话式OS》 均有提及。
借助百度这张图来讲,利用 DNN 建模的思路如下:
我们需要使用一批用户问句-标准问句对 的正例和反例作为训练语料,借助上面的方式,同时将正例和反例进行 word embedding 后送入 DNN 中,并采用 Pairwise ranking loss 的方式来建模正例和反例之间的语义差别。
上一种基于 DNN 的方法,在一定程度上已经可以解决词的语义相关性的问题,但对句子中的短距离依赖关系并没有做恰当的处理,比如无法区分『甲到乙』和『乙到甲』。
根据百度的评测结果,CNN 在处理短距离依赖关系上拥有更好的表现。
该图出自李航博士 Convolutional Neural Network Architectures for Matching Natural Language Sentences 中的 ARC-1:
其做法的基本思路是:将问句中的每个词,都做 word embedding,得到每个词所对应的固定长度的词向量,我们将问句表示成一个二维矩阵,每一行代表问句中相应词所对应的词向量。将这个二维矩阵进行多次卷积池化(卷积核的宽度与词向量维数相同,高度多为 2-5),最后得到一个一维特征向量,我们用 CNN 同时处理用户问句和标准问句,得到用户问句和库中标准问句所对应的特征向量。之后将这两个向量拼接起来送入多层感知机,由它来计算两个问句之间的匹配程度。
另外,有人指出,直接将两个特征向量拼接起来送入 MLP 会丢失边界信息,所以我们同时将特征向量 a、特征向量 b 和 aTb 同时送入 MLP 来计算相似度。
ARC-2 结构同样出自李航博士的上述论文:
ARC-2 相较于 ARC-1 的改进在于,ARC-2 尝试让两个句子在得到像 ARC-1 结果那样的高层抽象表示之前就进行相互作用,不再先分别通过 CNN 结构得到各自高层抽象表示。
在 ARC-1 模型中,一张 feature map 仅仅是一个列向量,或者说是一个一维矩阵,若干个列向量并在一起形成了 ARC-1 示意图中的模样(二维),而在 ARC-2 中,一张 feature map 成为了一个二维矩阵,若干个二维矩阵叠在一起形成了 ARC-2 示意图中的模样(三维)。
再之后的卷积、池化过程就与 CV 中 CNN 的卷积、池化过程类似了。与上一种方法类似的,在进行 1D convolution 时,涉及到两个词向量的连接,同样可以采用之前提到的做法来避免边界信息的丢失。
同样有人提出,在 ARC-2 结构中,直接采用传统的 word embedding 方法得到的词向量组成句子作为输入并不是最佳方案,最佳方案是采用已经过了 LSTM 的 hidden state。
我们可以采用 LSTM 结构训练一个 RNN 语言模型,如下图(以普通 RNN 为例):
从图中可以发现,当输出为『e』时,hidden layer 向量中第三分量最大,而输出为『l』时,第一分量最大,输出『o』时,第二分量最大。我们可以将 RNN 的 hidden state 当做 Distributed Representation 的词向量来使用,将其作为 CNN(ARC-2)的输入,经测试可以得到更好的结果。
一个可信度高的分词结果是进行后续解析步骤的基本前提。
在 《浅谈自然语言处理基础(中)》 中,我介绍了一些经典的分词方法,不过都是些较早的研究成果。CRF方法是目前公认的效果最好的分词算法。
CRF 方法的思想非常直接,就是将分词问题看作一个序列标注问题,为句子中的每个字标注词位:
CRF 分词的过程就是对词位标注后,将 B 和 E 之间的字,以及 S 单字构成分词。网上有很多公开的基于 CRF 的分词工具。
至少存在四个角度可以在已有模型的基础上进一步提高解析质量,包括:问句归一化、用户状态、强化学习、多轮对话。
问句归一化的目的是对用户的输入具有较好的容错性。
简单的一些比如:简繁体归一化、全角半角归一化、标点符号处理和大小写归一化。复杂一些的比如汉语错别字的纠正。错别字自动纠正技术的应用非常广泛,而且在提高系统用户体验上能够发挥很大的作用,可以说性价比极高。
错别字纠正通常的做法是训练噪声信道模型。
我们可以对用户状态提取特征,在训练和解析时将其作为附加信息一并作为神经网络的输入。
可以被考虑的用户状态至少包含:
其次可以采用强化学习的方法,通过设计合理的奖赏机制,让解析系统在与环境互动的过程中自主进行策略更新。
强化学习与普通的监督学习方法相比存在两个明显的优点:一个是强化学习策略更新所需要的数据主要来源于与环境的交互/采样,而不是昂贵的人工标记数据;另一个是强化学习所产生的策略是根据奖赏机制自主迭代更新的,会有一些创新的做法,而不仅仅是模仿人类提供的『标准』做法。
QA 问句解析中虽然不像游戏一样拥有『策略\创新玩法』这样的概念,但仍然可以在解析优化中帮助大量节省数据的人工标记开销。
应用强化学习方法的核心问题之一就是奖赏机制的设计,在 QA 的场景下设计奖赏机制,至少可以考虑以下几个角度:
多轮对话技术可以进一步提高与用户对话的连贯性。
我倾向于将多轮对话划分为『封闭域』和『开放域』两个场景,不同场景的实现思路也应该不同。
封闭域场景多轮对话的特点是:系统能解决的问题是一个有限集,多轮对话的目的是将用户引导到我们可以解决的问题上。
而开放域场景多轮对话的特点是:系统需要解决的问题是一个无限集,多轮对话的目的是依照上下文更准确的理解用户的需求。
在这样的指导思想下,封闭域多轮对话的核心思路应该是『填槽』,而开放域多轮对话的核心思路是『上下文替换』和『主体补全』。
《浅谈智能搜索和对话式OS》 中介绍了百度利用 slot filling 技术来做 NLU,并利用『上下文替换』和『主体补全』来提高其 DuerOS 的对话能力的。
而更进一步的,填槽、上下文替换和主体补全的技术基础都是『序列标注』,这里给出百度的两张 PPT:
根据百度的 PPT,采用双向 LSTM + CRF 做序列标注,是一个商业上可行的方法。
选择合适的人工接入时机同样是提高 QA 系统整体表现的方法之一,其核心问题在于平衡用户体验与投入成本。人工接入的越早,用户体验越好,但成本也越高。
这里简单提供蚂蚁金服小蚂答的做法:若系统连续提供给用户三次相同的回答,显示人工接入按钮;若用户连续询问两次客服类问题(比如『我要人工』、『你们客服电话多少』),显示人工接入按钮。
QA 系统的另一个重要组成部分是答案库。
答案录入的优化至少可以从三个角度来思考:
答案形式的多样性非常容易理解,比如小蚂答就支持包括文本、链接、、视频在内的多种答案形式。
个性化问题在上文解析优化中已有涉及(考虑用户状态的解析优化),上文的分析思路同样可以应用于答案录入,我们可以对不同注册时长、付费金额不同、进入路径不同等等的用户提供不同的个性化答案。
答案对用户的帮助看起来比较抽象,但也很容易理解。通俗的,我个人以『地图级』、『导航级』、『专车级』来为 QA 系统的答案进行分级:
依照文章最初的人机对话系统场景分类,提供『专车级』答案的 QA 系统,可以被称为 VPA 了。
对于答案库的优化,在答案完备录入(答案形式足够丰富、针对不同用户提供个性化的回答)的前提下,至少存在两个优化点:
上文解析优化中强化学习方法奖赏机制的设计思路也可以被用来发现答案库中存在的问题,因为大多数时候我们还很难明确的区分用户的负面反馈是针对解析系统还是答案本身。
除了从用户负面反馈中发现问题,针对上面的两个优化点,我们还应该有一些预防机制来提前避免这些问题的发生。
比如第一点『答案库中标准答案存在错误』,如果不是录入人员的素质问题,最大的可能性就来源于答案的时效性,也即我们提供给了用户过期的答案。针对这个问题,我们可以在录入答案时特别添加『临时』标签,以标明该答案具有较强的时效性,需要及时更新。
而针对第二点『答案库中缺失某些问题的答案』,最大的可能性来源于突发事件以及业务的变动。比如系统服务宕机、系统上了新版本或者组织了一些运营活动,我们都应该针对这些可能引发用户疑惑的变动,提前准备一些 FAQ 并录入到答案库之中。
此外,当我们录入新问题及其标准答案的时候,需要注意新录入问题与原解析系统的适配性,以避免出现新录入的问题较难被解析系统解析到的情况。可采用的方法比如在录入新问题的同时,主动录入一些不同的问法作为初始训练语料(网易七鱼云客服的做法)。
好了,关于“搜索引擎优化答案”的话题就到这里了。希望大家通过我的介绍对“搜索引擎优化答案”有更全面、深入的认识,并且能够在今后的实践中更好地运用所学知识。