我們先來聊下搜索引擎研究,搜索引擎研究算法的文章我想大家也都在網上或者其它地方看過不少吧,我個人覺得那些深層次的就不用去研究了,畢竟我們不是專業做搜索引擎的,呵呵。下面就搜索引擎算法我談一些個人認識。
搜索引擎最主要的解決問題在于,如何有效快速地抓取互聯網的信息而不被無休止的重復鏈接,錯誤鏈接,及循環程序所困撓,并分類有序地存儲入庫。其次,就是要符合用戶體,給搜索用戶帶來親密感。反制垃圾SEO的干擾,就是搜索引擎最頭痛的問題所在。
如果大家只是做一個關鍵詞排名,抓取程序大可不必深究,因為以目前搜索引擎強大的索引能力,讓搜索引擎索引一個新站,那可是輕而易舉的事情。搜索引擎基本上是按照域名的重要性決定收錄網頁數量,百度的算法和GOOGLE的有些區別,百度在收錄網頁數量不足的情況下將會非常努力的遍歷網站的鏈接更深處,但GOOGLE對于動態網站則只會遍歷一定的鏈接層次,這個層次是多少,網上有很多種說法。所以需要我們制作網站地圖。
對于搜索引擎反作弊的手段,SEO也必須多多少少心里有桿秤吧,其實所有的SEO都是在人工干涉排名的。我們可以假設一下,如果沒有seo干涉,一個競爭激烈的關鍵詞排名會是怎么樣的呢?
第一、他的相關性肯定非常強;第二、內容豐富,更新平凡;第三、非常有權威。
但是如果加入seo元素就變了,那就是:關鍵詞密度、內部結構等因數都要非常合適,幾乎所有頁均被搜索引擎收錄,反向連接非常豐富,并確是非常自然的連接,連接種類也很多。
以上就可以看出我們做seo的工作重點在哪里了,那就是,使網站的關鍵詞突出,內容豐富,使網站結構合理,層次經可能的少些,擁有大量的反向連接并確盡可能的廣泛分布。
下面我們來講解關鍵詞。
關鍵詞包括:關鍵詞的位置,關鍵詞的密度,標簽對關鍵詞的作用。
在seo文章中對關鍵詞的位置和密度講解的最多,這里我就不詳細講解了。主要是《title》《alt》之類的標簽,文章的開頭、段落的開頭都要用到此類,其中《title》中和超鏈接中的文字對提升關鍵詞的相關性尤為重要。搜索對于關鍵詞的密度要求其實很松的,并不是某些人說的百分之五,或是百分之二十以內,只要不是惡意重復,自然一點就OK。諸如加粗加大的特殊標簽,對加強一篇文檔與被著重的關鍵詞相關性,作用也很明顯。但是在需要優化的關鍵詞數量非常多的情況下,如何控制好特殊標簽,從而使多篇文檔融合為一個有機互益的整體,就非常值得研究一下了。至于《h1》,《h2》,《h3》和《strong》標簽,下面我會說到。
但是過份的使用標簽,那就是關鍵詞作弊了。那樣搜索引擎就會K你了,呵呵。
講關鍵詞必然會談到鏈接,鏈接是一個網站在搜索引擎中表現的籌碼。在搜索引擎的搜索結果中存在著不相關內容會影響搜索引擎的功能性,而不按重要性無序排列的結果,將帶給用戶極壞的用戶體驗。
然而在搜索引擎算法中,重要性是如何體現的呢?顯然,只有鏈接。這里我們說的鏈接指的是外部鏈接。互聯網是靠超鏈接互相聯系起來的,不管是百度的鏈接分析算法,還是GOOGLE的PR算法,他們始終是圍繞以下幾點:1.鏈接的數量;2.鏈接的質量;3.鏈接的來源;4.鏈接文本;5.SPAN鏈接。
鏈接的數量,這個大家都很容易理解,我不必多說了。
鏈接的質量,網絡上有很多種說法,各搜索引擎角度也不一。GOOGLE的高質量鏈接是以給出鏈接的這個頁面在搜索引擎中的重要性較高。如果一個權重高的站給你做了鏈接,這個時候這個鏈接就是一個很高質量的連接,而百度更加看重首頁鏈接。對百度而言,內頁的連接質量永遠比首頁要低。當然,網站權重的高低也是一方面的。
這里我要重點想說的是SPAN鏈接。我想大家對SPAN鏈接應該都很熟悉吧,總結來說,SPAN鏈接是指用鏈接進行作弊,手段主要有,留言本span,BLOG span,Wiki span,以及Link Factory(連接工廠)。各搜索引擎之間差異最大的可能就是針對span的解決部分了,GOOGLE對于留言本群發之類的SPAN采用補充材料降權、不作處理的方式處理SPAN,對于Link Factory采用徹底封殺處理,這樣也導致一些網址導航站被無故封殺,這也是搜索機制存在的問題。
百度我們都很了解,稱為本土化的搜索引擎。我們談到百度最多的也就是百度的人工干涉。百度封殺SPAN可能采用程序和人工干涉相結果的辦法。先通過機制算法將問題連接頁面添加到數據庫,再由工作人員人工審核。從某種意義上來說,鏈接的來源和鏈接文本屬于相關性研究的范疇。鏈接作弊和關鍵字作弊屬于搜索引擎反作弊算法研究范疇。他們都可以算做是鏈接質量的一部分。
下面我們來分析不同搜索引擎的細微區別。
在一個網站的SEO過程中,最好是要兼顧多數搜索引擎的習慣。但在某些竟爭力相當大的關鍵詞SEO中,有針對性的SEO行為也是非常有意義的。所以研究分析不同搜索引擎之間的區別,也是很有必要的。這里我們就對百度,GOOGLE,YAHOO之間區別進行說明。百度是中文用戶市場份額最大的一個,但是百度的竟價排名,使大多數SEO都不注重百度的SEO,我想大家也是這樣的吧。GOOGLE是SEO們奮斗的焦點,而YAHOO最近一段時間則默默無聞,由于YAHOO和GOOGLE的相似程度比較高,所以GOOGLE SEOER們喜歡YAHOO,也比喜歡百度多一些。GOOGLE和YAHOO的區別在與,Google注重語義分析和鏈接,Yahoo注重title和外部鏈接。Google和Yahoo更新很快,蜘蛛很勤勞,由于只要把頁面本身優化好,就能在Yahoo中取得很好的排名,而這些頁面優化都是自己可以控制的,所以說Yahoo優化比Google優化更容易,所用時間更短。
特別是對于熱門關鍵詞,兩者的區別非常明顯。從另一個角度來說,能把Google優化好的人不一定水平有多高,可能只不過是手頭有較多的鏈接資源可以利用,要是服務期過了,把指向你的鏈接一撤,你的排名就會掉下來。但是你能把Yahoo優化好,說明你的網頁優化本身是好的,你的排名基礎是扎實的,你的優化工作做的很到位、很牛、很好很強大。特別強調一下Google的強大的語義分析能力,很多人說搜索引擎看不懂語義,這其實是錯的。我們做連接時,將關鍵詞和諧的組織到一個語句里,再進行關鍵詞連接優化,這樣的效果遠遠高于你單做一個詞的效果。在Google中搜“seo入門”, 結果你會發現“seo基礎”的網頁,這些網頁針對“seo基礎”作了很好的優化,但是并沒有出現一處“入門”。可見Google把“入門”和“基礎”看成極為接近的詞。
Google的PR和百度的超鏈分析。
網絡上對這一分析很多,其中最重要的兩句是:
“超鏈分析要解決的是文件與搜索關鍵詞的相關性。李彥宏提出的方法是,除了文件本身對關鍵詞的引用外,還需要考慮反向鏈接中的關鍵詞。”
“在Google的專利申請中,明確提到即使在考慮了指向文件的鏈接及鏈接錨文字之后,搜索引擎還有重要問題需要解決,那就是來自不同文件的鏈接有不同的權重值。”
我個人總結了一下,在關鍵詞分析方面,所有搜索都對標簽有所分析,但YAHOO的比重大些,GOOGLE還會分析語義及反向鏈接的質量及相關性。BAIDU的所謂中文分詞算法也只是對中文詞語的邏輯性分析比較強,語義分析沒怎么樣。這三大搜索引擎只有GOOGLE對META標簽還是有所看重,description中的關鍵詞仍被加紅顯示,GOOGLE對所謂的標準站點比較看重。可以看到,反向鏈接質量和數量較低的網站來自百度和GOOGLE的流量天差地別。而YAHOO關鍵詞排名對首頁比較看重,內頁關鍵詞不容易被深挖。GOOGLE對反向鏈接質量區別很嚴,非常看重來自頁面等級高的鏈接,而百度看似對首頁鏈接更喜歡一些。
短時間的大量群發鏈接,會導致網站在GOOGLE中進沙盒,但從沙盒出來以后鏈接仍有效果,不知道大家的站有沒有進過沙盒。而YAHOO效果則很明顯。但當一段時間鏈接不再增加以后,排名下降也會很快,YAHOO非常看重時效性。百度反作弊算法則認為群發鏈接是作弊,遞交人工審查后,垃圾站立馬被封。如果你站美工好點,或者是商業站點,或許會幸運一點,要么首頁被封,要么撒事沒有。
這個我做過很多實驗,垃圾站100%被封。對于反作弊,YAHOO以前顯然很不到位,但是現在弄出一個有獎搜蟲計劃,對于鏈接工廠,K的比百度GOOGLE還要嚴重。GOOGLE有著一套對首頁和內頁明顯不同的檢查標準,想作弊不被K,請用內頁優化,呵呵。
接著給大家講講拆分式優化。
字面上大家可以看的出來,拆分也就是說把你所需要優化的關鍵詞進行拆開,分解成一些比較常規的詞語、字或者短語。這樣做的用途是減輕主關鍵詞的競爭壓力、利用分解詞語推動主關鍵詞的排名提升。
年前我做了個站:上海機票 www.521yy.com 機票這樣的詞,看都不用看就知道競爭是很激烈的,如果按照常規的優化方法去做難度是很大的,而且 www.521yy.com 的域名質量及權重都不是很高,所以我改用了分解關鍵詞的優化方式,首先將關鍵詞“飛機票”拆分成“飛、飛機、機票、票”這4個常規詞,添加了大量與這4個詞有關的新聞及文章,在文章中“飛、飛機、機票、票”都以加粗處理 并在文章中用到《h1》,《h2》,《h3》和《strong》標簽,通過這些拆分后的關鍵詞進行輔助優化后,效果就很不錯。
分解優化需要涉及到《h1》,《h2》,《h3》和《strong》的用法,特別是博客。為什么呢?因為有些很好的博客已經做了很好的SEO,只要稍作優化,加強連接及連接廣泛度就能取得很好的成績。大家都知道這幾個標簽對于搜索引擎來說有比較重要的作用,在里面適當的放上關鍵詞有利于排名,但是標簽的位置和標簽的使用度一定要把握,不然也會被搜索引擎認為是作弊而打入沙盒或者直接K掉。
大家都知道,SEO的一個很重要的一點就是要把網站做的條理清晰,讓搜索引擎很容易的讀明白,讓蜘蛛爬行通暢,這個條理清晰不僅體現在網站的物理路徑、URL等地方,在《h1》《h2》《h3》等方面也是這樣。并不是《h1》對于關鍵字排名有幫助,如果在任何有關鍵詞出現的地方我們都用《h1》的話,這樣可能會被懲罰或者被搜素引擎降低你《h1》的權重而無法體現關鍵詞的重要性。《h1》《h2》《h3》需要層層遞進,依次類推主導詞,使得搜索引擎給予《h1》以很高的權重。
《h1》通常用于網站最重要的標題,所以在標題里面放上你網站的關鍵詞是很明智的做法。一個網站不僅僅只有一個頁面,還有很多欄目,欄目里面又還有子欄目,所以《h2》《h3》則分別用以類列表,內容標題列表,這樣網站標題-欄目標題-子欄目標題-內容列表標題的關系層層遞進,思路清晰,搜索引擎就很容易分辨你網站的那個地方重要,哪個地方是次重要。我認為,《strong》就沒有像《h1》《h2》《h3》這樣這么嚴格,在適當的位置都可以用此標簽來重點突出關鍵詞。
總的來說,這2種類型標簽相輔相成,要靈活的配合使用,會使你的網站層次分明,重點突出。對于標簽的使用我覺得大家應該多去google管理員博客看看,因為搜索引擎是不斷更新變化的,所以了解到最新的動態才能取得好的成績。只有你讓搜索引擎更輕松的閱讀你的網站,對于你重點體現的地方它就更容易讀出來,當然在排名上也就賦予了你更高的權重。層層遞進,以次推主。
最后我再對seo一些常見現象做一個說明。
1.提交網站至相關目錄
這幾乎是所有需要搜索引擎的站長都建議的方法,不過我好久不用了,因為效率極低。
2.網站內部結構優化,頁面靜態化
這種做法是非常有效且必要的,也是“講道德的”SEO所做的最重要的核心工作,屬于正常優化。也是我們所說的白帽優化。
3.關鍵字密度
搜索引擎早期最原期的作弊手法之一。不過現在搜索引擎幾乎不再懲罰了,但這種作弊起不到什么效果。只有在碰巧的情況下,會有個把關鍵詞排名還不錯。想要穩步提升關鍵詞排名,靠它幾乎是沒什么門了。
4.隱藏文字連接
隱藏文字連接和跳轉是GOOGLE最反感的作弊方式之一,多用于消除FLASH頁面不利于優化的缺點,其實只需要把頁面結構美化一下,這種風險實在是沒有必要冒。
5.頁面跳轉
和隱藏文字一樣,屬于沒有必要的風險,一般SEO也不太愿意做這種事,多數是被客戶或是現實逼迫的。
6.鏈接工廠
當前最最流行的作弊方式之一,但是由于網絡情況的復雜,大量網址站的存在,BLOG友情鏈接推薦等等和它相似但不屬于作弊情況的存在,使搜索引擎始終沒有辦法徹底清除。它對關鍵詞排名效果是最最明顯的,一旦被發現,將是致命的打擊。
7.信息群發
和鏈接工廠一樣,以前對于搜索引擎來說信息群發并不是作弊。GOOGLE對留言本采取寬容的態度,只是降低留言本鏈接的權值,并不加以懲罰。但以人工編輯為主的百度來講,這是一種絕對不能容忍的行為。這也是許多網站在GOOGLE中排名很好,但卻被百度拒絕收錄的主要原因之一。