Archive for 五月, 2006

  本文作者马特-卡兹(Matt  Cutts)是Google公司品质管理部门的软件工程师。他的工作主要是给好的网站评定等级,并负责开发阻止虚假或垃圾网站出现在Google搜索结果上的技术。

  图书馆管理员们提出最多的问题之一是:“对于什么样的结果应该位于搜索列表的最上方,Google是如何选择的?”现在品质工程师马特-卡兹介绍了快速入门的知识,解释了Google是如何在网上爬行和索引,以及如何评定搜索结果等级的。马特也向学校图书馆管理员提出建议,告诉他们如何辅导学生。  

  爬行和索引

  在你浏览包含了Google搜索结果的网页之前,要发生很多事情。首先是在万维网数以十亿计的网页上爬行和索引,这个工作是由Googlebot完成的,它负责与全球的网络服务器连接以收集文件。爬行不是真的在网上漫游,而是访问网络服务器返回到一个特定的网页上,接着扫描该网页建立超链接并为每一个网页编上号码。爬行可收集大量的文件,但这些文件还不能直接用于搜索。

  如果没有索引,在你想查询如“civil  war”(南北战争)等内容时,Google的服务器将不得不在你每次搜索时阅读每一份文件的内容。因此第二个步骤是要建立一个索引,这样就需要“转换”爬行所获得的数据。为了不必在每一份文件上扫描每一个单词,就需要在数据上做些文章,以便显示包含了特定单词的所有文件。例如,假设单词“civil”在编号为3、8、22、56、68和92的文件上出现过,而单词“war”出现编号为2、8、15、22、68和77的文件上。

  一旦建立了索引,就开始对文件进行等级评定并确定它们的相关性。假如某个人上Google搜索并输入“civil  war”,为呈现和评价搜索结果需要做两件事:一是查找包含了用户提问的网页;二是按照相关性排定匹配网页的位置。Google已经开发出一个有趣的技术可加速第一步骤的过程:不是将所有索引存储在一台电脑上,而是使用数百台电脑做这种工作。由于任务被分配到很多电脑上,使得查询答案更为迅速。

  为更加形象地描述这个过程,可以设想下一本30页厚书的索引。如果一个人在索引中查找数页的信息,那么每一次搜索都至少需要花几秒钟的时间;但如果你将索引的每一页分给不同的人去查找呢?三十个人分别查找索引的不同部分,要比一个人独自查找快的多。同样,Google也是将数据分配到各台电脑上以便可以更快地查找文件。

  如何查找包含了用户提问的网页?让我们返回到上面举的“civil  war”例子。单词“civil”在编号为3、8、22、56、68和92的文件上,单词“war”在编号为2、8、15、22、68和77的文件上,我们可以在网页上显示文件并寻找包含两个单词的文件(从下表中可以看出是8、22和68号文件)。

  单词civil  3 8 22 56 68 92

  单词war 2 8 15 22 68 77

  两个单词都出现 8 22 68  

  包含了一个单词的文件列表被称为“文件标识列表”,查找包含两个单词的文件被称为“文件标识列表的交集”。

  评定搜索结果

  有了包含用户提问的网页后,就该按照相关性评定网页了。Google使用了很多技术,其中PageRank算法是最有名的。PageRank评定的是两种事情:从网站到某一网页有多少个链接,提供链接的网站的排名。使用PageRank,来自CNN和纽约时报网站的链接的价值,是很多不太有名网站的两倍。

  除了PageRank外Google还使用了很多其他技术,例如一份文件所包含的“civil”和“war”两个单词靠的很近,就比只使用了“war”单词的包含“Revolutionary  War”(独立战争)的文件相关性要大的多。另外在题目中出现了“civil war”的网页,它的相关性就比题目为“19th Century American  Clothing”(19世纪的美国服装)要重要的多。同样如果“civil  war”在网页上出现了数次,比出现一次的网页要相关的多。

  Google的目的是要找到知名度和相关性都大的网页。如果两个网页出现匹配提问的信息数量几乎一样,我们常常会选择更有名网站的链接。但如果其他方面表明一个网页更为相关,也会选择更少链接或更低排名的网页。例如,一个网页全篇都是讲“南北战争”的内容,会比只是略微提到“南北战争”的网页更为有用,即使这个网页是出现不太有名的网站上。一旦我们有了文件的列表和分值,就会选择最高分值、最匹配的文件。

  Google从包含了提问单词的每一份文件中提取几句话作为摘要显示,接着将排好的URLs和摘要显示在搜索结果上。正如你所知道的运行一个搜索器需要大量的计算资源。每一次搜索需要500台以上的电脑一起工作,搜索的时间还不到半秒钟。

作者:SunSky

    今天是我第一次和雅虎的朋友们面对面交流。我希望把我成功的经验和大家分享,尽管我认为你们其中的绝大多数勤劳聪明的人都无法从中获益,但我坚信,一定有个别懒的去判断我讲的是否正确就效仿的人,可以获益匪浅。  

   让我们开启今天的话题吧!

    世界上很多非常聪明并且受过高等教育的人,无法成功。就是因为他们从小就受到了错误的教育,他们养成了勤劳的恶习。很多人都记得爱迪生说的那句话吧:天才就是99%的汗水加上1%的灵感。并且被这句话误导了一生。勤勤恳恳的奋斗,最终却碌碌无为。其实爱迪生是因为懒的想他成功的真正原因,所以就编了这句话来误导我们。  

   很多人可能认为我是在胡说八道,好,让我用100个例子来证实你们的错误吧!事实胜于雄辩。  

  世界上最富有的人,比尔盖茨,他是个程序员,懒的读书,他就退学了。他又懒的记那些复杂的dos命令,于是,他就编了个图形的界面程序,叫什么来着?我忘了,懒的记这些东西。于是,全世界的电脑都长着相同的脸,而他也成了世界首富。  

  世界上最值钱的品牌,可口可乐。他的老板更懒,尽管中国的茶文化历史悠久,巴西的咖啡香味浓郁,但他实在太懒了。弄点糖精加上凉水,装瓶就卖。于是全世界有人的地方,大家都在喝那种像血一样的液体。  

  世界上最好的足球运动员,罗纳耳朵,他在场上连动都懒的动,就在对方的门前站着。等球砸到他的时候,踢一脚。这就是全世界身价最高的运动员了。有的人说,他带球的速度惊人,那是废话,别人一场跑90分钟,他就跑15秒,当然要快些了。  

  世界上最厉害的餐饮企业,麦当劳。他的老板也是懒的出奇,懒的学习法国大餐的精美,懒的掌握中餐的复杂技巧。弄两片破面包夹块牛肉就卖,结果全世界都能看到那个M的标志。必胜客的老板,懒的把馅饼的馅装进去,直接撒在发面饼上边就卖,结果大家管那叫PIZZA,比10张馅饼还贵。  

  还有更聪明的懒人:

  懒的爬楼,于是他们发明了电梯;
  懒的走路,于是他们制造出汽车,火车,和飞机;  
  懒的一个一个的杀人,于是他们发明了原子弹;
  懒的每次去计算,于是他们发明了数学公式;  
  懒的出去听音乐会,于是他们发明了唱片,磁带和CD;
  这样的例子太多了,我都懒的再说了。  
  还有那句废话也要提一下,生命在于运动,你见过哪个运动员长寿了?世界上最长寿的人还不是那些连肉都懒的吃的和尚?  
  如果没有这些懒人,我们现在生活在什么样的环境里,我都懒的想!
    
  人是这样,动物也如此。世界上最长寿的动物叫乌龟,他们一辈子几乎不怎么动,就趴在那里,结果能活一千年。他们懒的走,但和勤劳好动的兔子赛跑,谁赢了?牛最勤劳,结果人们给它吃草,却还要挤它的奶。熊猫傻了吧唧的,什么也不干,抱着根竹子能啃一天,人们亲昵的称它为“国宝“。  

  回到我们的工作中,看看你公司里每天最早来最晚走,一天像发条一样忙个不停的人,他是不是工资最低的?那个每天游手好闲,没事就发呆的家伙,是不是工资最高,据说还有不少公司的股票呢!  

  我以上所举的例子,只是想说明一个问题,这个世界实际上是靠懒人来支撑的。世界如此的精彩都是拜懒人所赐。现在你应该知道你不成功的主要原因了吧!  

  懒不是傻懒,如果你想少干,就要想出懒的方法。要懒出风格,懒出境界。像我从小就懒,连长肉都懒的长,这就是境界。  

  再次感谢大家!

作者:海中帆 eda2@sina.com

1、web2.0提了也白提
web2.0这是一个概念,打着web2.0的概念,只是说技术如何如何2.0,战略如何2.0,其实意义真的不大。投资人需要的是一个网民能够接受,并且很有特点的网站,能够满足网民的某个需求,或者能够引导网民的某个需求。你的网站提供的服务只要是有市场潜力的,有发展空间的,真的不用冠上某个新鲜的概念。

2、不要和投资人谈什么大战略
你一上来就是网站建设大而全,这些那些统统都有,栏目100个,功能1000个,网民来了就一站搞定,根本不用去其他地方了。投资人一般认为这是不可能的。一个栏目都建设不好,谈什么所有的栏目都建设的好呢?而且,耗资巨大,建设时间动不动就是一年一年半,等到建设好了,黄花菜都凉了。见过一个人提了个虚拟城市的计划,几乎连政府部门都搬进来了,投资人会说:你说的是对的,但是谁敢给你投资做这个看着很美妙却是一个海市蜃楼的东西?

3、先有第一批用户是至关重要的
不要指望着网站大了,功能全了,用户就来了,一个网站做起来,第一批用户的作用是至关重要的。如果告诉我第一批用户就是网站宣传出来的,我肯定会只给打20分。你必须有一个非常有粘性的吸引网民能够来注册的特点。我们谈的是一个战役,战役开始攻占第一个山头是决定成败的,而不是和我描述整个战役是否能够成功,那是纸上谈兵,诸葛亮都有过这个点上的投资错误,结果是斩了马谡。所以投资人的在这个方面的教训远比你想的更深刻。

4、不要抓大而放小
别小看一个网站中很小的一个功能或者服务,你的这个小服务,很可能就是桥头堡,很可能形成一个网站内的环境,一上来就是视频战略如何如何,内容战略如何,某项宏大的市场活动如何。其实投资人要听的只是你第一步的特点,网民没有时间来听你谈战略,他们进来可不是来关心你还没有实现的这些战略的,他们要的是吸引他们的东西,哪怕只是一个会员视频认证或提供更漂亮的模板,或者让他们看到你网站上面全都是穿三点的会员。

5、无线应用绝对不是盈利模式的全部
没有盈利模式,就拿无线来凑,可是一个新网站,能不能得到特服号不说,如何和其他SP竞争也是一个问题。别人凭什么要来订阅你的服务,或者给你拨打声讯电话?首先你的盈利模式不需要无线就能存在,再拉上无线,这样才有说服力。

6、不是有激情就可以
你没有什么管理经验或者运营经验,你提的点子再好,但我怎么相信你就能把一个团队管理好?搞企业可不是几个好朋友过家家,宣传推广也是烧钱就一定有效果。你都没有失败过,怎么知道你这样做就一定成功?

7、别指望网民给你提供内容
你作为机构,自己都不能生产出合适的内容,而指望网民来提供内容,那几乎太高估我们的网民的综合实力了,美国80%网民的人还都不知道BLOG是何物。就算是你的原则就是不生产,只要也要有整合某些内容的能力或者引导内容生产的能力。

8、不要吹嘘合作伙伴是什么顶尖团队
一说就是技术人员是负责以前某个项目的,结果一问是做旅店的视频监控的,却非要说他能够负责整个网站的技术实现。这个技术跨度让人感觉很可怕。你还不如实话实说,他做视频监控也一定有技术特点或者优势的,没必要包装成大而全的技术专家。

9、毕业三年最好自己做,不要想着能找到投资
才毕业三年,自己以前都没有自己的网站,就要召集几个和你一样的年轻人找别人要投资。太浮躁了吧。的确有一毕业就创业成功的,但是你也要知道别人在上学的时候干的事情你根本没有勇气去尝试。老是拿者别人的成功来掩饰自己的缺点,或者来证明自己也有成功的可能性,是很幼稚的。

10、不要以为你的想法没有人想过
真的不要在没有了解清楚之前,就为自己的某几个想法激动的睡不着觉,好像是投资人眼界还没有你高,没有理解你的伟大的思路,不能理解你的独创性。还给人冠上不是伯乐的帽子。实际上你自己去好好的搜索一下,你这个想法在好几年前就有了,而且有人已经做出来了。所以在谈话和计划书上不要吹嘘什么自己是独创性的,前无古人后无来者,会让人发笑。

11、不要以为投资人是傻冒
投资人是要靠投资来赚钱的,当然会比较慎重,如果碰到特别好的项目,投资人一定会仔细的考虑,并且会给你一些更多的帮助。因为投资人也知道帮你成功了,他们也就发财了。所以不要以为投资人是傻冒,摆着的钱都不赚。实际上投资人比你要聪明的多。

12、你的网站至少是已经开发完成80%以上了,才有和投资人争论的资本
网站只开发了不到50%,模样都还看不出来,就想获得投资,这几乎是不可能的。可能你的点子真的很好,但是既然是好的点子,那就应该全部完成了以后,再找投资人谈谈,让他看看现成的成果。50%的网站就非要给人看,你自己不怕别人把你的东西都学去吗?现在就和投资人争论只是没有完全开发出来,所以你还看不出来,实际上是如何如何的,这都是没有什么意义的。

13、要知道自己的网站以后的拓展方向在哪里
如果你能让投资人相信你能走好第一步,那么你就应该详细的说明下一步你们网站还能扩大些什么具体业务,可以包容什么样的人群,不要一上来就是说我的业务对象和人群就是15-30岁的年轻人。这些人群如何聚集起来,是要一步步的来的,也和你自己的平台本身的拓展性有很大的关系。这是一个分步骤的计划,也是对自己网站的延展性的描述。一定要重视。投资人的投资,是希望你的网站能够不断扩大业务种类和用户范围,而不是做出来什么样,就是什么样。

14、成本要算的清楚
我看过一个计划,15个人月薪总支出就是20多万,而一年的人工成本是多少,硬件设备,带宽成本都没有算,这钱花着也太容易了吧。又不是你饿了就随手能够采到果子吃,基本生存的成本都算的不清楚,以后的钱要支出的方面更多,难道给投资人一笔糊涂账就OK了?所以,你应该字仔细的把成本都考虑清楚,如果你连加班要用的牙刷牙膏的成本都想到了,投资人会很欣慰的。

15、团队一定要性格互补,并有合作的经验
拉着几个人,谈了两三天,刚好几个人都没工作或者不满现状,就宣布团队成立了。这样的团队怎么让人放心,一到利益冲突的时候,亲兄弟都可能翻脸,何况是你们几个重来没有合作过的人组成的团队。到时候闹得不可开交,投资人的投资怎么办?我看投资人真投了,那才会天天睡不好觉,怕你们闹矛盾。所以,如果是团队作战,千万不要生拉硬拽,临时拼凑,这样就算得到了第一笔投资,后面的资金支持将会随着你们的分崩离析而荡然无踪。

16、有自己的独特的资源,并能够在网站上应用
你个人或者团队的资源整合能力和运营能力,是投资人相当重视的。如果你有好的资源,希望你能够利用到你的网站中去,不要另辟新径,因为新的途径你自己都不太了解。比如你以前做某个传统行业,那就不要做的网站和这个行业一点关系都没有;又比如你以前一直做某个互联网领域的运营或开发,就不要抛弃掉自己这方面的经验而去做什么所谓的热门概念。

17、什么都没有,只有一腔热情,还是先打打工吧
真的,如果你什么都没有,只有想法思路和一腔创业热情,也肯吃苦肯受罪,最好也不要期待投资人会给你投资。你这种人是最危险的,天使也怕你这样好高骛远的。所以,还是先冷静一下,把时间多用来先向一些公司学习工作经验吧。如果就是不甘心,就自己给自己做一个网站,并拼命把网站做好,做到一定的人气,我相信投资人会对你亲眼有加的。

18、不要固执,要能够听进别人的建议
投资人很害怕固执的人,最害怕根本听不进别人的建议的人和团队。这个在很多技术人员那里是个通病,所以,在你自己都找不到一个能够说服自己的伙伴和你配合之前,不要找投资人谈什么东西。你和投资人的洽谈只是让投资人后悔在你身上花了时间,下次再不愿意找你谈。

19、如果你是一个高管,并且让公司的某个项目成功,那么恭喜你,你得到投资至少有了基础
这个高管可不是一个项目开发主管,而是从策划到开发再到运营你都在参与和管理。为什么有这么多公司的高管出来创业,能够得到投资人的追捧,是因为他们身上有投资人需要的优良条件:有成功经验,有思路,有领导能力,有资源,有团队,有伙伴。

20、自己做出来的优秀网站,绝对不会埋没
如果你自己的网站正在良性发展,并且比较稳定,不要把主要精力用在投资的身上,你只要坚持把自己的网站逐渐的做好,投资人一定会发现的,不要因为暂时吃饭有困难就到处找钱,既然你已经没钱吃饭这么长时间了,再坚持几个月,努力再让自己的网站访问量提升一些,真的不用担心投资人不会关注到你。有时候救命稻草就在自己即将要淹死的那一刻。

我不是专业做投资的.所以此文仅供大家参考.
如果有真正的投资人看到这篇文章,不对之处万望批评指正.
希望能够认识更多的网络投资界的朋友.

到了中国才知道只生一个好

  
到了韩国才知道亚洲的足球让上王都差点疯掉

  
到了泰国才知道见了美女先别慌拥抱  

  
到了印度才知道人还得给牛让道

  
到了新加坡才知道四周都是水还得管别人要  

  
到了伊拉克才知道污染会让你死掉

  
到了阿拉伯才知道做男人有多么骄傲  

  
到了澳洲才知道有袋子的鼠肉也很有味道

  
到了德国才知道死板还有一套一套  

  
到了法国才知道被人调戏还会很有情调\’

  
到了西班牙才知道被牛拱到天上还能哈哈大笑  

  
到了奥地利才知道连乞丐都可以弹个小调

  
到了英国才知道为什么牛顿后来都信奉基督教  

  
到了荷兰才知道男人和男人当街拥吻也能那么火爆

  
到了瑞士才知道开个银行账户没有10万$会被嘲笑  

  
到了丹麦才知道写个童话可以不打草稿

  
到了希腊才知道迷人的地方其实都是破庙  

  
到了俄罗斯才知道有这么大块地也会有人吃不饱

  
到了美国才知道不管你是谁乱嚷嚷就会中炮  

  
到了古巴才知道雪笳有N种味道

  
到了巴西才知道衣服穿的很少也不会害臊  

  
到了埃及才知道一座塔也能有那么多奥妙

  
到了南非才知道随时都可能被艾滋病亲吻到  

  
到了两极才知道随地小便有多么糟糕

  
结束了。。。看贴不回帖的一律烧掉~~~

  为了拥有完美身材,不少青少年在饮用牛奶时只选择脱脂产品,殊不知,这会给你的面部带来麻烦,此起彼伏的痤疮很可能会找上门。

  《美国皮肤病学杂志》最近报道,摄入脱脂牛奶很可能导致青春期面部痤疮。美国哈佛大学的研究人员对47335名女性进行了回顾性调查分析,那些每天喝两杯以上脱脂牛奶的女性,面部长痤疮的几率要比常人高44%;如果不局限于脱脂牛奶,只要每天喝三杯以上,患痤疮的可能性也会提高22%。

对此,研究人员认为,痤疮和每天喝牛奶的多少有关,特别与脱脂牛奶的饮用量有更密切的关系。究其原因,并不是牛奶中的脂肪成分所致,而是与奶中的荷尔蒙和生物活性分子相关。但是,研究人员并不建议患痤疮的青少年停止饮用脱脂牛奶,其成长期间必须维持适量均衡的牛奶摄入。研究人员表示,全脂牛奶或其他类型的奶饮品也可以作为选择之一。