战略seo团队认为,中国互联网已经跨过了建站时代。正在大步迈向网站推广、网络营销时代,而基于搜索引擎的优化、营销、推广[SEO/SEM]将成为最重要的应用技能。网站优化、推广、网络营销将成为互联网时代的新动力。战略SEO将与您一同学习、探讨、研究相关问题。
1.建设中的网站不要推广
2.不要把时间浪费在搜索引擎上,把你的站点提交给主要的搜索引擎和目录,如百度,Google和雅虎就可以了,没必要把时间浪费在无关紧要的搜索引擎上,它们带来的访问量几乎是零。
3.在开始推广前请确保你的网站各部分功能都是完整的,并且各分类内容也都是充实的,尤其是首页内容一定要充实完整,经常看到很多站长在推广自己的网站,首页像掉了牙一样,很不整齐,这样会给访问者带来很不好的印象。另外还有很多网站一打开就显示“网站建设中”访问者一般看到这种字样就不会再回到这个URL了。
4.不要群发垃圾邮件,无论何时何地、对任何人,大量不请自来的垃圾电子邮件都是让人不能容忍的。现在有很多人在各大网站发布出售邮件群发软件的信息,有没有那么神奇的宣传效果就不说了,但总之是不要相信他们。群发垃圾邮件只会给你招来敌人而不是朋友,使越来越多的人对你的网站产生反感。
5.不要使用旁门左道,在各种Web推广新闻组和邮件列表里有很多关于诡计的讨论,这些技巧据称可以提高你的搜索引擎排名。不要上当。搜索引擎和目录正在发起一场针对那些“攻击系统”的家伙的战役,如果他们怀疑你“愚弄”他们,他们会禁止你的站点。在标题和内容文本中的确要使用META标签,但是一定要遵循提交规定。
6.不要在Web站点目录中放置任何不希望公众看到的内容,大部分人都有一些“测试”页面放在Web服务器上,这些内容是不希望被公众看到的。但是,像Altavista这样的直接搜索引擎会自动“扩展”并且索引你站点上的每一页,除非你告诉他们不要这样做。创建一个叫作“robots.txt”的文本文件,把它放在你的Web站点的根目录下,告诉所有访问者扩展搜索应避开这些目录。
当用户在搜索关键词的时候,总会看到很多内容相近或重复的内容,我们应该如何看待这中问题,当网页没有泛滥成灾的时候这是一种补充,更好的完善互联网的内容,现在而言,重复泛滥的网页着实让人头疼。
搜索引擎绝对不喜欢重复内容,因为会浪费大量资源,如果相近的内容是一种补充,多余重复的内容就是第N层膏药,根本没有任何作用。所以现在很多站长搞一些伪原创,或多或少的能有一点效果,但是这绝对不是用户也不是引擎想要的。当初为伪原创绞尽脑汁的时候,一个朋友告诉我,用谷歌翻译将文章翻译成英文,然后再英文翻译成中文,呵呵,对待搜索引擎我们真是无所不用其极。其实这些现在对引擎来说已经没有用处了。
引擎是如何比对内容重复呢?(郭长老自己的理解,如有错误请指出),引擎抓取内容的时候会对内容模块进行比对,将文字分成高频词、中频词、低频词,两个类似网页之间对比,如果中频词相似度极高就判定重复,权重低的自然不会被抓取,或者抓取排名也不会很好。因此搞伪原创的朋友不要费力了,当引擎再进步的时候我们已经养成了懒惰的习惯,现在就此收手吧。
今天读到国平“怎样学习seo(三)”还是很有感触,以前只知道排列关键词、增加关键词密度以及加外链,会了这些就以为是seo的真谛了,如果不知道引擎真正的方向,我们知道的那些皮毛又怎能去适应引擎的发展呢,现在郭长老的学习思路慢慢在改变,其实seo是一切可以掌控的,只要你能行。
上篇郭长老读《搜索引擎》里面的知识很好理解,今天郭长老继续用朴实无华的文字描述一下搜索引擎的抓取策略。
爬虫从蝴蝶结左部的网页(目录型网页最为抓取出发点),很多门户都是这样的。每次爬虫抓取其中的链接后,如何继续抓取其他网页,爬虫有两种方式:
1.深度优先。这种类似子承父业的抓取方式,比如抓完一个目录,然后继续向下抓取,一直到深到不能在深入的地方,然后再抓其他网页的抓取方式。
2.宽度优先。举个例子,战略seo就是爬虫宽度抓取的。首先,重要网页往往离种子站点距离最近,这符合思维方式,随着深度越来越深,重要性越来越差,偶尔会有死链找不到相关页面的情况。宽度优先有利于多爬虫合作抓取,这样抓取的封闭性较强。以前有人告诉我,心有多大,分类就写多大。看来不完全正确,过多的目录势必会影响爬虫的深度抓取,建议目录要精不要多,至少郭长老是这么认为的。而且目录不要天马行空的写,哪个离种子站点越近哪个权重越高。
深度抓取不符合重要网页先抓取的原则,破坏了抓取的封闭性。宽度抓取优于深度抓取。
当爬虫在遇到死链接会有两个不利结果,不该抓的重复抓,该抓的没有抓,解决这个问题要用到不重复抓取原则和深度策略。
慢慢来,大家一起学习,不重复抓取明天继续,吼吼~~~
受国平老师的影响,去图书馆借了一本关于搜索引擎的书,昨天看到午夜12点,收获很多。上学的时候郭长老的专业是机电工程,计算机的课程没少开,但是因为翘课上班荒废了,原本以为会在某个机械行业厂子做了技工就哦了,阴差阳错的进入战略seo团队,一年以来边工作边学习,张长老的培养让我把计算机文盲的帽子摘掉了,以后郭长老会把读书心得每天都写出来,和我一样的菜鸟希望写的东西不会误导你,高手请绕行喽。
搜索引擎分为四个系统:
1.下载系统:搜索引擎负责从万网下载各种各样的网页,并且要保持对万网变化的同步。
2.分析系统:将下载得到的网页进行分析。
3.索引系统:将分析的网页索引入库,等待访客调用。
4.查询系统:当我们访客进行搜索的时候,负责对用户提交的信息进行分析,然后给出相关网页的排序。
打个比喻,我们的网站就是被爬虫照了相存储在下载系统,然后会有“博士”分析,进行整理后入库,就等待您的访问了。
其实看似这几个简单的组成部分,确实人类计算机最复杂的技术,因为真正做seo的人是研究搜索引擎的人,郭长老不想再无休止的盯着外链内链,知道引擎的需求才能真正摆脱seo。
百度总结出了70后80后90后的区别,看图:

我不是70后,但是有着70后同样的情怀,花酒金曲50首我也会常常听,70后已经是多行业的精英。

我是80后,我对80后创业最感兴趣,还有80后的回忆。

90后非议比较多,上面提示的内容着实崩溃,不过只能顺其自然,他们有属于自己的世界。
其实说这么多,最想说的就是随着搜索引擎的行为的进一步强大,可以预见,我们的搜索体验会越来越个性化。搜索引擎何以做到这一点?非常简单,你搜索过什么,点击过什么,浏览过什么,下载过什么;一句话,搜索引擎在观察你,试图了解你,然后给你你更感兴趣的…。引擎的强大预示着人的隐私越来越少,当然不是搜索引擎针对某个人,只是我们已经被载入一个巨大的信息库中,想逃吗?已经晚了······
百度着实紊乱了一段时间,郭长老特意拿一些网站将百度和谷歌对比,两个搜索引擎对网站的分析完全不一样,其实不可以这样解释,但是在郭长老看来百度将网站结构分析的毫无章法,不知道是不是百度又要有什么动作。快照更新的很慢,其实也难怪,有些时候我们确实被谷歌惯坏了,谷歌会在很短的时间就让你想展现的索引出来,可能你的内容都被删除了,百度才出的快照。其实这样对及时的信息是很不利的。不过确实能给短期追求效果的很大的压力。期待百度重拳出击,让我们一直提着的心落下来吧、
百度快照更新,战略seo团队的烧烤网站排名更近一步,每日200多的IP。烧烤自然排名第三位,可笑的是烧烤每天1000左右的IP,到我这每天不超过15个,诶!百度竞价太恨人了。中餐美食网也收录了,中餐关键词已经也有了排名,进入百度首页不是问题,不过已现在的想法我觉得这个词的意义不大,当时的关键词定位有点偏激,网站时间不长,郭长老打算来个矫正。小吃网今天改版完毕,关键词的密度以及布局做了简单的调整,感谢桔梗美眉的帮忙,收录但是没排名,以后的时间会定期维护动态资讯区,会给整站关键词排名送权重,词的热度还可以,目标三个月将小吃做到百度首页(排除竞价)。
郭长老希望我们不仅仅的做,要做出效果,将经验分享。
早上到公司,国外的网络媒体先后报道了,google开始处理google trend(趋势)中频繁出现恶意程序网站的问题。紧接着Mcafee的研究员就指出了,这一现象的核心是流程。即:恶意软件利用代理或软件本身恶意向搜索引擎提交搜索记录。而用户搜索记录正是 google趋势及百度热榜、指数的数据源。通过大量的恶意刷新某个关键词。甚至模拟点击某些页面,从而拉动相关被挂码的网站获取良好的排名。从而获得更多的肉鸡成为其新的载体,这样就增加了该恶意软件的终端数量。变相利用谷歌趋势为自己的挂码网站引入流量。
其实引擎分析用户搜索行为,并公开统计后的数据。这是一个好事情,通过Google趋势和百度指数、热榜等我们可以发现并思考出很多内容。但是如何让自己的算法和数据结果更合理,更能反映实际情况。就对引擎提出了比较高的技术要求,当然我相信这对于搜索引擎研发团队来说,更本不是难题。比如那些是代理IP,哪些词具有相关性等等。当然包括百度在这方面更不会次于google。那么事情产生了,百度和Google的反应是什么呢?Google已经开始动作了。而百度呢?这是笔者以前发的一篇文章相关搜索-并不是百度算法的痛,而是百度的聪明 。
截至笔者发稿时,Google的动作应该已经初见成效。而百度的seo相关搜索情况呢?见截图。

baidu seo 相关搜索截图
搜索引擎派出他们的搜索机器人去访问、索引网站内容,网站管理员也默认、欢迎它们来访。但是由于搜索引擎派机器人来访会在一定程度上影响网站性能,因此并非所有的机器人都是无害的,有一些非法机器人伪装成主流搜索引擎漫游器对网站大量遍历,并且不遵循robots.txt规范,会严重拖垮网站性能而又无其它益处。因此,网站管理员需要验证每个机器人身份是否合法。
在你的服务器日志文件中,可见每次访问的路径和相应的IP地址,如果是机器人来访,则user-agent会显示Googlebot或MSNBot等搜索引擎漫游器名称,每个搜索引擎都有自己的user-agent,但仅有这个还不足以证明这个机器人的合法性,因为很多垃圾制造者可能将他们的机器人也命名为Googlebot,以伪装蒙混进入网站,大肆采掘内容。
目前,主流搜索引擎都建议网站管理员通过这种方式来辨别真实的机器人身份:通过DNS反向查询找出搜索引擎机器人IP地址对应的主机名称;用主机名查找IP地址以确认该主机名与IP地址匹配。
首先,使用DNS反向查询(Reverse DNS Lookup),找出机器人IP地址对应的主机名称。主流搜索引擎的主机名称通常情况下应是这样的:
作为依靠搜索引擎营销【sem】的团队lead,一方面要尽可能的了解引擎的技术,同时也要分析引擎的盈利模式。今天早上起床后,检查360热点导航的工作情况。通过下面的名人博客看见了李彦宏的博客。顺便看了一下宏哥和英国首相之间的一段谈话。时间是在08年的1月,后面有宏哥的简评。我不是什么宏秘,但是对于他本人还是比较敬佩的。
这篇博客的核心是搜索引擎的盈利模式。宏哥很谦虚谨慎,但是无意间还是说出了引擎的未来。百度有2亿的用户,不仅仅是拥有这些客户。而且了解这些客户搜索什么、关注什么、查看什么、部分习惯等等,所以说引擎可做的事情有很多。而引擎就是依靠这2亿用户赚钱,一方面是向用户推销广告。这个已经很成熟了,百度、google都在这么做。另外一方面就是如何向这2亿的客户【或是部分高端客户、定制客户】收费。相信这些大家都想到了,说些可能大家没有想到的。当你有了2亿的用户行为分析报告,同时又有足够多的钱。你还会干什么?看看google。他很清楚05年开始是大家对网络视频关注的一年,或是youtube通过google的流量疯长。为什么不买下他,让他为我赚钱。投资–你说对了。再也没有谁的行业分析和投资评测会比引擎了解的多了。这也就成为google和微软战争的原因。
盈利模式决定了引擎的业务方向,一方面引擎要增大用户量和用户行为分析,包括品牌营销、引擎技术提升、用户行为分析、专业化内容索引等等。另外一方面就是拿着用户行为分析报告琢磨做【收购】什么样的产品、项目、投资什么赚钱。
就说到这里吧,附上《我对英国首相说“我不知道你是谁”》原文:
昨天在上海跟英国首相布朗(Gordon Brown)有一个挺有意思的争论,关于搜索引擎的。
他说“你知道我每天搜索了什么信息,你知道我的喜好,你知道我想买什么东西,你甚至知道我的年龄、我的收入,你可以据此来发布最有针对性的广告,你是不是侵犯了我的隐私?过去的媒体都是不知道这些的。”
我说“我是知道很多关于你的信息,但我不知道你是谁,我也不会用我掌握的信息对你造成伤害。”
他说“你用我的信息赚钱,你应该付给我钱”
我说“不对,你用我的服务,是免费的,我们挣了钱才能把服务做的更好”
他问“未来的搜索引擎会是什么样子?会不会越来越智能?”
我告诉他说人工智能只是一个方面,更多的还要靠百度知道这类产品来匹配自然语言的检索请求。
其实我挺惊讶的,我在国内这么多年,发现除了互联网业界的人,不管是专家学者还是商界精英,对搜索引擎的商业模式几乎是一无所知的,一个大国的首相,对搜索的商业模式如此的精通真不容易。
昨天总结了英国人的优势,得出的结论是开放、创新,追求知识。这跟一般中国人眼中的英国人是很不一样的。而中国人的优势则是有创业精神,敢于冒险,勤劳,做事有弹性,善于交易。
今天看了一下吕本富的博客,还是有所发现的。其中就有《关于搜索引擎的十个问题》,时间是2006年7月。作为第二代互联网人,大言不惭的也来解答一下关于搜索引擎的十个问题,让大家见笑了。
关于搜索引擎的十个问题
1、搜索的核心技术在哪里?
吕:搜索引擎的核心技术有三个方面:一是页面抓取技术,也就是所谓的蜘蛛技术;二是页面排序技术,其支撑技术是数据库技术;三是用户的搜索需求识别技术,其中用户的需求最难识别。
zlseo:3大核心我很赞同,除此之外可能现在又多了一个网站内容的分析能力。哎这都是seo惹得祸。现在来看第三点成为真正的引擎技术核心,而且是百度在中国战胜google的主要手法。
2、怎么看待目前国内的搜索引擎的竞争态势和发展趋势?
吕:国内的搜索引擎基本上还是百度、Google、雅虎三强并立,百度稍微突出一些。我认为发展趋势为:这三家继续做通用搜索,其余的搜索引擎可能转向垂直搜索。
zlseo:三强大的格局没有变化,不过新人soso还是很猛的。相信在中国挤掉yahoo只是时间的问题。至于垂直搜索,两年后来看。经过很多的尝试后还是失败了。
3、除了广告之外,是否还有其他的赢利模式?
吕:搜索引擎现在最主要的赢利模式就是广告,虽然也进行了很多探索,其他的赢利模式并不成功。当然广告也有很多种:竞价排名、关键词购买、广告联盟、流量计费等。
zlseo:以长老的短浅目光来开,未来搜索引擎将像QQ一样从用户身上拿到利润。这就是百度在国内和QQ死扛的根本性原因。国外google在和微软对抗,而且从各个方面看google已经占有上风。
4、现在搜索进入的门槛低吗?
吕:现在搜索引擎进入的技术门槛比较低,从网络上就可以获得搜索引擎的开放源代码。但是搜索引擎的品牌门槛已经很高,搜索引擎本身也要推广自己。所以,除非有革命化的技术突破,比如,出现了新的图像搜索算法,否则,新的加入者没有多少机会。
zlseo: 当然像腾讯一样有大量的用户做支撑,进入搜索引擎市场还是有机会的。soso我看好你呦!
5、有人说“在通用搜索引擎市场,最多只能留下两家公司,第三家会很难过”,怎么看待这个问题?
吕:在通用搜索市场上,应该会存在三家公司,理由如下:从用户心理、竞争态势、实力比拼,三家容易形成比较稳定的市场格局,在IT市场中有很多这样的先例。当然也可能形成“胜者通吃”的局面,只有一家垄断市场。从国内现在的形势看,后一种状况似乎不存在。
zlseo:从现状来看好像百度在国内十分强势,虽然google动用了所有资源。前所未有的关注谷歌中国的发展,但是市场份额上还是节节败退。哎老外在互联网上就是搞不懂中国人。
6、在技术上,通用搜索之间、垂直搜索之间以及通用搜索和垂直搜索之间有可比性吗?
吕:在页面抓取方面,技术是通邮【用】,所以通用搜索和垂直搜索有一定的可比性。在页面排序方面,通用搜索和垂直搜索可以有差异、也可以没有差异,但是一个比较优秀的垂直搜索应该有自己独特的排序算法。
zlseo:技术上说通用搜索引擎每个人都有自己的超级特长。百度的中文分词,google的网站分析和网络部署及数据库技术。当然这些专业精深的技术垂直引擎是不可比拟的。所以我个人认为在某些很小的点上有可比性,但整体上根本不在一个档次中。
7、目前,垂直搜索还受到实力、品牌、推广等方面的不利因素,同时,一些垂直资源性网站还对他们展开信息屏蔽,怎么看待这些不利因素?该怎么应对?
吕:垂直搜索肯定是未来的一个主要发展方向,各种专门的搜索网站一定会进入人们的生活,但是它的实力不可能达到通用搜索引擎的实力。垂直搜索和垂直资源网站应该构成一个完整的供应链,它们之间应该不是一个互相取代的关系,之所以有“信息屏蔽”现象的存在,主要是它们之间的利益分割规则还没有定型。
zlseo:现在看来垂直引擎已经没有未来了。就连大门户、垂直门、专业牛站都开始seo了。而且通用引擎的行业搜索也开始见起色了,如百度不仅仅是mp3搜索。有了视频、百科、新闻等50多个频道,除去空间、贴吧等绝大部分是垂直搜索。
8、搜索的最终目的是电子商务吗?
吕:搜索的最终目的不是电子商务。之所以电子商务企业重视搜索,是因为搜索引擎会成为电子商务网站的流量的主要来源,因此也是它们收入的主要来源。任何一家电子商务企业当然不希望自己的脖子被别人卡住。
zlseo:非常同意吕先生的观点,电子商务引擎们根本就没有看上眼。现在个人观望,是用户。大量的终端用户才是引擎真正的目标。这也就是百度和QQ大战的根源。
9、未来在搜索领域胜出需要哪些核心能力?
吕:搜索领域的核心能力是多种多样的,可以是综合能力,也可以是“一招鲜”。所谓综合能力就是基于客户体验的对搜索引擎的满意度,满意度越高,核心能力就越强。“一招鲜”是指在一个细分市场比较突出或者有一种专门技术,这样的公司往往是通用公司的收购对象。
zlseo:用户体验、高品质的信息量、高质量的用户需求分析能力、开放的心态、更好的客服。
10、从目前来看,GOOGLE在中国的发展并不理想,你认为它会收购一些公司来互补吗?据说他们习惯收购小公司。
吕:从著名互联网公司在中国发展的历程看,失败或者不成功是普遍现象,GOOGLE的发展状况和遭遇的问题基本上是在预料之中。GOOGLE应该会收购一些技术上比较互补的小公司,但是对GOOGLE在中国的运行不会有太大的帮助。
zlseo:那是肯定的,google和微软的战争就是投资者为了争夺互联网的重要资源【yahoo】,哎曾几何时。yahoo竟然沦落到“人为刀俎 我为鱼肉”的境地了。吕本富在06年肯定想都不敢想。
PR>=4 百度谷歌均有收录,内容丰富,做好本站连接,请联系QQ:331785108。本站定期整理,投机者删除。