博客首页|TW首页| 同事录|业界社区
2009-07-03

搜索引擎的历史比较简短,但不可否认搜索引擎为互联网所作出的巨大贡献,搜索引擎改变了世界,改变了用户使用习惯,更加让我们对互联网的未来充满信心。搜索引擎起步的时候做的并不好,第一个搜索引擎甚至没有分析网页的副本,而且没有排名的标准,为了深度挖掘商业潜力,这才推动搜索引擎渐渐发展,研发更先进的系统。

第一个比较大的商业搜索引擎是在美国的斯坦福大学,它在2001年花65亿美元购买了@主页。在开始推广的时候,最大的竞争对手是网址站,主要是因为那时候搜索结果中很多都是垃圾邮件,而且人们还不习惯用搜索引擎。

元标记是帮助搜索引擎排序的一个工具,通常叫做关键词堆砌。一旦搜索关键词,那关键字和元标记就会告诉搜索引擎内容是在哪一页,在很短的时间做好中继标记工作,提供相关搜索结果,但随着一些企业的市场营销经验增加,他们很容易提高关键词的排名,那时候比较流行“贷款、贷款、贷款”之类的关键词堆砌,所以当时搜索引擎的垃圾信息泛滥成灾,造成许多用户的不信任感。

雅虎的搜索引擎从1994年开始做,然后外包出去,一直到2004年;谷歌是在1996年发起;,起初他们都没有一个成功的商业模式,一直到2003年,微软到2004年才开始自己做搜索引擎。

那时候一些重要的搜索引擎包括:EINet银河、WebCrawler、莱科斯、Infoseek、Inktomi、Ask、AllTheWeb等

每一个搜索引擎都有三个主要部分组成:

1、蜘蛛

蜘蛛的工作职责是发现新的网页并收集这些网页的快照,然后分析该网页。

蜘蛛以抓取页面为主,比如扫描网页,所有的搜索引擎都能够实现深层检索和快速检索。在深层检索中,蜘蛛可以查找和扫描网页内的所有内容;在快速检索中,蜘蛛不遵循深层检索的规则,只搜索重要的关键词部分,而不检查和扫描网页里的所有内容。

大家都知道网站最重要的是快照时间,也就是说蜘蛛爬行和收录的网页速度越快,就说明这个网站在搜索引擎心中越重要,比如新华网和人民网,蜘蛛每小时爬4次以上,有的网站一个月也不见得能被蜘蛛爬一次。快照的抓取程度取决于网站内容的流行度、更新速度与网站域名的新旧。

在蜘蛛的爬行规则中,如果有许多外部链接指向这个网站,那就说明这个网站比较重要,所以抓取这个网站的频率很高。当然,搜索引擎这样做也是为了省钱,如果都以同样的频率爬行所有网站,这样需要更多的时间和成本,才能得到更全面的搜索结果。

2、指数

蜘蛛在爬行的过程中,可能会重复检查网页的内容,然后查看网站内容是否是复制其他网站的,以保证网站原创内容的指数,该指数的结果一般都是基本保持复制内容的排序搜索结果。当你进行搜索时,搜索引擎不会从网络上搜索,它会从指数中选择搜索结果,所以搜索得到的网页数量并不能代表整个网站,但蜘蛛会在后台扫描和保存网站的网页数量。

在搜索结果数量中,谷歌1-10个搜索结果约为16.05万,还有每个区域的搜索结果排名,这些都可以用搜索引擎的算法指数来控制,或者说是控制一部分。

每个搜索引擎在全国或全世界各地都建立数据中心,当你输入需要搜索的关键词的时候,会由于数据更新的时间不同而致搜索结果同步,所以在不同的地区就会出现不同的搜索结果。

3、Web界面

当你使用搜索引擎所看到的界面(比如google.com、baidu.com),搜索结果取决于复杂的算法,算法都是从指数内调用结果,通过查询并分析才能在前台显示,所以算法的制作时间比较长,谷歌在这个技术领域上领先。

还有一些搜索引擎的“一站式”特性,这类特性在英文搜索上比较常见,一般来说,搜索引擎忽略“一站式”的话,这样的搜索结果将更加正确,比如搜索“猫,狗”的时候,搜索引擎会排除“猫和狗”,只搜索“猫”“狗”。

关键词密度是衡量一个关键词出现在网页上的频率,一般搜索引擎看到某网页上的关键词超过密度范围,那它就会分析该网页是否作弊,现在搜索引擎可以做到任何地域的字词相关度处理。所以在一般情况下,关键词应该在整个网页中分散,但一定要有某个标题或段落长期不变。

搜索引擎还有个核心分析技术就是链接的相关性分析,除了网页排名和一般的链接,谷歌还看重锚文本链接,锚文本链接主要在于链接的年龄和位置,还有该链接的网页是否属于权威网站等。

链接是最大的网站质量指标,搜索引擎都很关注着,因为现在友情链接比较难找,而你又很需要友情链接,所以链接中很少有垃圾信息。比如大学的网站在谷歌的权重很高,那是由于大学有很多高质量的外部链接。随着大家都了解到外部链接的重要性后,很多网站开始买卖链接,这也是现在搜索引擎比较头疼的问题,不过ask现在判定网站排名更多在于网站的质量。

所有的搜索引擎都希望得到用户反馈的信息,他们期待在查询之前、搜索查询、时间间隔、和语义关系等方面,能更加了解到用户的意图,他们还会跟踪用户的点击,如果用户点击一个物品,然后又马上回到搜索页面,那搜索引擎就会认为这个购买不成功,会删除跟踪清单,其实这种做法已经在向电子商务靠近了。

从这可以看出,搜索引擎越来越看重用户体验,他们不断学习和改进,是为了做的更好,让用户肯定自己的劳动成果,并成为搜索引擎行业的一个标准,也许这样下去,未来的发展在个性化搜索。

____________________________________________________________________

艾瑞网络媒体QQ①群 65812896,艾瑞网络媒体QQ②群 26505937,江苏南京互联网圈 10541590

作者:于斌,南通人在南京,小鱼互动创始人,现在8684负责五月雪网址大全,QQ 117821818,MSN  xylz626 at hotmail.com。

2009-07-02

微软、雅虎和RealNetworks公司即将坐上了被告席,原因是音乐著作权问题,原告是一家单片机音乐商,几乎管理者45000首音乐版权,在控告微软、雅虎和RealNetworks公司的时候说:“为了传输、执行、复制并提供任何声音记录的任何音乐作品,无论是传送还是下载,被告必须不仅先要取得录音本身的权利,还需要有基本的作曲体现权利(也就是音乐轨道)。”

这家单片机音乐商要求赔偿“实际损失和所得利润”或“15万美元一首歌曲”(单片机音乐商会列出90页的歌曲目录)。

此次诉讼得到了多方的关注,很多媒体称这“将会引起一场混乱”,单片机音乐商有可能会胜诉,因为微软、雅虎和RealNetworks公司没有太多精力把时间耗费在这些音乐的版权上。不过目前为止,雅虎、微软和RealNetworks公司的发言人没有对此发表评论。

这次微软雅虎成为被告,不重视音乐版权是根本因素,还有其他互联网公司也同样遭遇这种情况。2005年开始,百度、巨鲸音乐网、雅虎搜索等公司相继遭到唱片公司的起诉,尤其是2007年,连绵不绝的版权官司令互联网公司焦头烂额。

不过后来为了解决版权问题,百度搭建了“百度数字音乐联盟”,推出了“版权试听+收入分成”的商业模式,联合了英皇、华谊、海蝶、滚石、百代等唱片公司,结合相关唱片公司的版权作品为广告主进行广告投放,广告得到的收入与唱片公司直接分成。后来谷歌、巨鲸音乐网与唱片公司联合推出的正版音乐服务与此分成模式类似。

音乐版权问题也是一直困扰着互联网企业,数字音乐市场中版权的不清晰,使得很多唱片公司的音乐在网络上被无偿使用,直接导致唱片销量下降,一些互联网企业因为难以得到合法授权或因高昂的版权费用进退两难。我认为单片机音乐商应当充分挖掘良好合作关系及潜力,从而达到多赢的效果,这样才能真正实现音乐市场的良性循环。

____________________________________________________________________

艾瑞网络媒体QQ①群 65812896,艾瑞网络媒体QQ②群 26505937,江苏南京互联网圈 10541590

作者:于斌,南通人在南京,小鱼互动创始人,现在8684负责五月雪网址大全,QQ 117821818,MSN  xylz626 at hotmail.com。

2009-07-01

昨日,百度联盟发表公告称,从 7月1日起,网址导航类站点在与百度进行搜索合作推广时,将实施新的分成政策。即默认百度搜索的网址导航站初始分成比例为30%,并将根据网站与百度联盟的合作形式、流量、质量、合作时长以及大联盟认证等众多因素提高分成比例,分成上限为45%,非默认百度搜索的导航站不在分成之列(也就是说只有放百度独家搜索才有钱拿,放了其他竞争对手的搜索就一律不享受分成政策)。
之前的百度联盟初始佣金比例是50%,如果内容质量、流量、合作时长以及大联盟认证等级等众多因素高的话,佣金比例最高能达84%。

上周开始就有百度联盟即将调整网址导航类网站佣金分成的消息,没想到来的这么快,因为我本身也是在负责五月雪网址大全,现在每天也有十七八万IP,跟一些同行交流了一下,同行们都普遍认为,百度联盟如果不给合作网站点甜头的话,也许合作网站就会投入到竞争对手的怀抱,到那时,百度也许会是事与愿违。

曾经有这样一个故事:某栋楼里,有个小孩每天晚上10点都准时在屋里弹钢琴,吵得邻居们都睡不着,邻居中有一个老先生非常聪明,一天他敲开小孩的门,夸小孩钢琴弹的很好,继续每天10点钟弹的话,每天就给他10块钱。以后小孩每天就拼命弹,老先生也如实每天给他10块钱,过了一个月,老先生说:没钱了,以后只能给你5块钱。此后小孩就弹的不再那么拼命了,每天弹一会儿就去睡觉。这样又过了一个月,老先生说:没钱了,能不能每天晚上还继续弹给他听。小孩一句话没说,把门关上了,从那以后,那栋楼里再也没有响起钢琴声。这个故事说明的道理也适用百度联盟,百度联盟此前付费给站长,如今一下子要把网址导航站上的竞争对手打死,要知道网址导航的用户不会全部都只用百度,还会使用其他的搜索引擎,一旦用户发现网址导航上少了自己需要用的搜索引擎,那他将会多出一种对网址导航的不信任感。而对于网址导航站来说,这是拿网站的流量和品牌来换比以前少了一半的银子。

也许,是谷歌前阵子被央视曝光,让大家知道了还有个谷歌能搜索到色情网站,那段时间谷歌流量暴涨,于是百度着急了,要赶紧想办法控制谷歌的流量。很多网民的上网第一站就是网址导航,不管怎么样,先控制住网址导航是不会错的。然而百度也忽略了一个可能存在的问题,就是万一遭遇网址导航站长们的抵制,谷歌再提高佣金价格,在这双管齐下的时候,也许就是谷歌翻身的契机。不知道百度是否做了应对这个大问题的策略,后面,肯定还会遇到很多问题。(文/于斌)

一年一度的高考已过,这几天各高校都在陆续发放录取通知书,当大家都在为这些孩子能够顺利考取大学而高兴的时候,可曾想到,也许,他们之中,家庭没有供养他们上大学的经济条件;也许,还有许多成绩优异的孩子由于家庭经济没有能进考场;也许,升学带给那些为高昂的学费发愁的贫困的家庭来说,就不仅仅是快乐和希望,同时还有无尽的烦恼和忧愁。最近报纸上,电视上都在放一些类似的事件,大家也都知道这样的家庭并不少见,而作为互联网人的我们,是否也应该做点什么?

有一个家庭,父亲常年在外打工,母亲卖煎饼,女儿平时很刻苦懂事,这次以全校第一的成绩考取了南京大学。在这炎炎夏日,考生们考完试往往都去旅游散心或者闷在家里,而这孩子却每天都起早帮母亲卖煎饼。整个巷子里只要一提到这孩子,没有不竖起大拇指的。有位老奶奶,每次看到这孩子在卖煎饼,不管是有没有吃过早餐,都会买点,老奶奶说:这不是买的煎饼,而是买的孩子的孝心。

有一个家庭,父母都是残疾,家里条件非常差,电风扇一看就是用了二十多年的,风扇头用一根绳子拴着,一眼望去,似乎风扇头随时都有可能掉下来,房间里到处出没着蚊子的“集团军”,就是在这种艰苦的环境下,孩子的高考分数也遥遥领先一本省控线。

除此之外,还有的孩子父母双双下岗,贫困的家里甚至没有一张书桌;有的孩子家人身患重病,负债累累……尽管身处逆境,他们仍自强不息,以优异的成绩在高考中胜出。但是,收获的喜悦还未来得及细细品味,他们又要为高额的学费而发愁,如果交不起学费,这一点刚刚燃亮的希望之火就将熄灭。

论坛是个媒体,博客是个媒体,我们每个人都是个媒体。我们每个人似乎也都有责任,为了解决这些孩子的问题,我倡议从我们互联网人做起,从现在做起,做点实实在在、力所能及的事情。

____________________________________________________________________

艾瑞网络媒体QQ①群 65812896,艾瑞网络媒体QQ②群 26505937,江苏南京互联网圈 10541590

作者:于斌,南通人在南京,小鱼互动创始人,现在8684负责五月雪网址大全,QQ 117821818,MSN  xylz626 at hotmail.com。