洩漏事件背景與來源
2024年5月,SEO產業迎來了一件震撼事件:Google搜尋演算法內部文件的重大外洩。成千上萬頁的Google內部檔案(據稱超過2,500頁、14,000多項參數)被發現公開在GitHub上,由一個名為「yoshi-code-bot」的自動腳本於3月中上傳。這些文件隨後由一名SEO從業者Erfan Azimi發現並分享給SparkToro聯合創辦人Rand Fishkin。Rand與另一位技術SEO專家Michael King對文件進行了初步分析,在5月下旬向社群公布主要發現,引發軒然大波。由於Google演算法素以黑箱聞名,此次洩漏提供了前所未有的洞見,許多人稱之為SEO界歷史上最大的事件之一。值得一提的是,2023年Yandex演算法曾有過類似洩漏,讓外界窺見排名因子的奧秘;而Google這次的外洩規模更是被視為「本世紀之事」。
外洩文件的可信度也經多方驗證。文件內容被多名前Google員工(Xoogler)確認真實無誤。甚至Google官方在5月29日做出回應時,也默認了文件的存在,但強調外界對片面資訊的解讀可能有誤。總體而言,這批文件提供了Google搜尋排名系統在近期(文件日期至少更新至2023年8月)的一次「內窺」,為SEO社群帶來了寶貴而稀有的資訊。
洩漏文件揭露的排名演算法內幕
洩漏的內部文件讓我們看見Google排名演算法中許多過去僅有猜測、如今獲得實證的要素。以下是此次文件外洩披露的關鍵排名因素與系統:
-
- NavBoost 系統與使用者點擊:Google內部存在一套稱為「NavBoost」的系統,用於蒐集廣泛的使用者互動數據(例如搜尋查詢熱度、結果點擊模式、長點擊與短點擊等)來微調搜尋結果。文件顯示NavBoost將使用者點擊行為作為重要排名信號之一,透過分析某結果的點擊率和使用者後續行為來調整排名,以更貼近用戶意圖。早在2023年美國對Google的反壟斷訴訟中,就有證據提及NavBoost使用點擊數據提升排名相關性。
-
- 使用者點擊與滿意度指標:此次洩漏確認Google透過多種點擊互動指標評估頁面品質並影響排名,包括「好點擊」(goodClicks)、「壞點擊」(badClicks)、「最近一次最長停留點擊」(lastLongestClicks)和「未被壓縮點擊」(unsquashedClicks)等。這意味搜尋結果中使用者行為的細節(如點擊後停留時間長短、連續搜尋行為等)都在Google考量之內。如果某頁面排名高卻大量曝光但少人點擊,代表其對用戶吸引力不足,可能導致排名下滑;相反地,具有高點擊率且能讓使用者滿意的結果將獲得排名提升。換言之,點擊率(CTR)和用戶停留等互動數據確實影響SEO表現。
-
- SiteAuthority(網站權威):Google的確存在整體網站權威評分系統。文件揭示一項名為「siteAuthority」的指標,用於衡量網站作為整體的可信度與權威度。高網站權威將顯著提升該網站各個頁面的排名表現。事實上,Google早在2011年Panda演算法更新後曾公開表示「網站中低品質內容會拉低整體網站排名」,這暗示了網站級別評價的存在。然而近年來Google多次否認使用所謂「網站權威分數」作為排名因子。此次文件證實網站品質確有量化評估,意味著網站整體聲譽與內容品質會影響單頁排名。
-
- 外部連結與多樣性:外洩文件重申了外部連結在演算法中的重要性。連結多樣性與相關性依然是關鍵排名因素之一。Google仍使用傳統的PageRank模型,並在評估每個文件(網頁)時考慮該網站首頁的PageRank值。這表明高質量的外部鏈結對SEO依然有舉足輕重的作用,同時來自不同來源且主題相關的連結能提升可信度。值得注意的是,Google公關雖曾稱「連結的重要性相比過去有所下降」且不再是排名前三因素,但文件顯示連結信號依然在內部被廣泛使用——兩者並不矛盾,因為我們仍不清楚這些連結因素在演算法中的實際權重如何。
-
- 品牌影響力:從洩漏資訊中,Rand Fishkin提出「品牌的重要性高於任何單一因素」的觀點。Google似乎透過各種信號評估品牌在其領域的知名度與受歡迎程度,知名品牌往往更容易獲得用戶點擊、搜尋量和其他正面指標的加持。文件間接證實了一點:打造強勢品牌有助於SEO。用戶熟悉的品牌網站,其內容更容易在搜尋結果中脫穎而出。對行銷人員而言,這再次凸顯了在Google生態系統外建立品牌知名度,會在搜尋排名中轉化為優勢。
-
- 實體與作者資訊:Google內部系統會儲存內容相關的作者實體資訊,並嘗試判定某個實體是否為文件(內容)的作者。換言之,Google沒有真正終結「作者權威性」概念:他們依然在追蹤作者與內容之間的關聯。這與2014年結束的Google Authorship功能一脈相承,意味著如果某作者在網路上具有專業權威,其發布的內容可能獲得更高評價。內容與實體(如作者、品牌)之間的關係在排名考量中扮演了一定角色。
-
- 內容品質與原創性評分:文件顯示Google有專門機制評估內容品質,包括對「Your Money Your Life」(YMYL)類別的內容進行打分,如醫療、財經等涉及重大利益的主題。同時,內容長度與原創度也在演算法中考量:過長的文章可能只擷取部分內容計算,而偏短的內容會被給予0–512的原創性分數。這表示Google鼓勵內容具備獨特見解和價值,而非刻意拉長篇幅疊加重複資訊。當競爭對手紛紛模仿你的內容時,持續更新並保持原創性將有助於維持排名優勢。
-
- 用戶體驗與Chrome數據:值得警惕的是,Google可能利用Chrome瀏覽器收集的用戶瀏覽行為作為排名參考。文件中的「ChromeInTotal」模組顯示Google從Chrome瀏覽器獲取數據用於排名演算法。這意味著使用者在點擊搜尋結果後的行為(如是否很快返回搜尋結果頁,是否繼續點擊其他網站等)都可能被Google監測並作為對該結果頁滿意度的評估依據。先前Google雖從未明說使用Chrome瀏覽資料排名,但此次證據表明搜尋與瀏覽體驗已深度融合:網站若無法讓點擊進入的用戶滿意並繼續停留互動,排名可能受影響。
-
- 白名單與手動調整:文件提及Google針對某些敏感領域存在「白名單」(whitelist)機制。例如在COVID-19疫情期間以及選舉相關搜尋中,Google有模組標記「isCovidLocalAuthority」和「isElectionAuthority」,暗示對這些主題會預先允許可信來源網站佔據較高排名。早先業界就猜測過搜尋引擎為避免演算法誤殺會設例外名單,此次也得到驗證。此外,Google還有一類稱為「Twiddlers」的重新排序函數,可基於特定條件動態調整搜尋結果順位。文件顯示一個有趣的例子是標記「smallPersonalSite」的小型個人網站——Google可能透過Twiddler對此類網站進行適度保護或調整(例如新站初期的流量沙盒或額外加權),雖然具體細節不得而知。
-
- 新鮮度與更新歷史:Google內部非常重視內容的時效性(Freshness)。文件指出,Google會查看頁面上的日期資訊,包括作者署名日期、URL中的日期格式,以及內容本身提及的日期,以判斷該頁面是否新穎。此外,Google保存了每個網頁曾經的所有歷史版本,並在分析鏈結時至少考慮最近20次的內容變動。這表示網站內容定期更新有助於保持良好的排名活力,反之過於陳舊的內容可能逐漸被視為不相關。同時,Google也儲存域名的註冊資訊(RegistrationInfo)作參考,顯示網站的註冊年齡等可能在某種程度上影響評估(例如全新域名可能被謹慎對待)。綜合來看,持續提供最新可靠的內容對SEO表現至關重要。
以上只是此次外洩揭示的一部分內幕。這些資訊填補了SEO社群多年的諸多疑問,也驗證了一些長期以來的猜想。接下來,我們將探討這些發現如何與Google歷年官方說法產生矛盾,以及在SEO圈引發的衝擊。
與Google官方說法的矛盾與SEO社群的震撼
Google過去經常對外界否認某些排名因素的作用,然而此次外洩文件顯示許多官方說法與內部實情不符,令SEO社群震驚不已。例如:
-
- 點擊率與使用者行為:Google官員(如分析師Gary Illyes)曾公開表示「使用者點擊並不影響排名」,一度讓許多SEO相信CTR不是排名因素。但洩漏文件清楚提到Google在排名中使用了各種點擊和互動指標,甚至NavBoost系統就是專門處理點擊行為訊號。這種明顯矛盾讓許多從業者感到被誤導——Google多年的「點擊不計入演算法」說法如今看來並不真實。
-
- 網站權威評分:自Panda更新後,Google曾承認網站整體品質會影響排名,但又多次否認存在具體的「網站權威分數」。此次文件直接揭露了SiteAuthority指標的存在。這說明Google在與SEO社群溝通時,對於網站級別評價的描述有所保留,導致業界對「網站整體影響力是否計分」一直霧裡看花。現在實錘落地,證明Google確實有內部的網站信譽評分機制。
-
- 新站沙盒:Google官方一向否認有對新網站的「沙盒期」限制,聲稱沒有刻意降低新站曝光的演算法。然而文件暗示Google對新站或可疑站點設有觀察期。例如「smallPersonalSite」特性和文件提到的新站需要建立信任才能完全參與排名等。第三方分析指出,新網站或被懷疑為垃圾站的站點在最初幾個月確實受演算法限制可見度。這與Google長年否認沙盒存在的立場相左,證實了SEO圈長期以來對沙盒效應的猜測並非空穴來風。
-
- 域名年齡與資訊:Google過去也曾表示「域名年齡不是排名因素」,但文件顯示Google儲存了網站的域名註冊資訊。這暗示域名歷史可能間接影響信任評估(例如老牌域名可能更受信賴)。Google雖未明說「越老的域名排名越好」,但之前的絕對否認如今看來語帶保留。
-
- 白名單與人工干預:Google對於是否有人工作弊排名一直十分謹慎,公開場合通常強調演算法自動化、公平適用。但文件揭露的白名單機制和Twiddler調整,相當於承認了特殊情況下人工策略介入搜尋結果。Google其實先前在極少數情況下承認過存在「例外處理」(exception lists)和手動降權措施,但整體對外形象仍以「不干預自然排名」自居。如今實際證據擺在眼前,SEO業界對Google演算法透明度產生質疑:還有多少內部規則是外界不知道的?
這些矛盾之處在SEO社群引發巨大反響。一些資深從業者表示「終於證明我們的懷疑是正確的」,例如長期以來業界流傳的點擊影響排名、網站沙盒期等終獲官方文件印證;也有人對Google多年來的訊息感到失望,認為Google在某些問題上誤導了SEO社群。社群中一時出現興奮與迷惘交織的氛圍:一方面,大量新資訊湧入令人亢奮;另一方面,也需要冷靜思考如何解讀,避免過度解讀片面資料。
值得注意的是,Google在5月29日對此作出有限的官方回應。他們警告不要以片面的過時資訊做不準確假設,強調這些文件未必全面反映現行演算法,而且Google排名信號隨時間不斷演進。Google拒絕證實具體哪項洩漏元素真正在用、權重如何,表示細節不便公開,以免助長作弊。這番回應在平息外界猜測的同時,也等於默認了部分資訊的真實性。然而,許多SEO從業者依然認為此次事件證明Google對外溝通存在保留甚至語義遊戲,未來將對官方說法抱持更高懷疑態度。
整體而言,這次外洩讓SEO圈體認到:Google公開的排名原則只是冰山一角,內部運作遠比想像中複雜。接下來關鍵問題在於,這些新知識將如何改變SEO最佳實踐?我們又該如何調整策略來因應?
對SEO策略的實際影響
洩漏文件為SEO策略帶來諸多啟示,直接影響未來優化工作的重心。以下是此次揭露對SEO實務可能產生的幾項重大影響:
1. 內容品質與相關性更形關鍵:Google內部明確對內容品質、專業性和原創度打分,例如對YMYL內容的特殊評級和原創性評分機制。這表示優質內容的重要性被量化體現——未來劣質內容不僅難以排名,還可能拖累整站權威分數。另一方面,Google透過向量嵌入(vector embeddings)來判斷某頁面與整個網站主題的相關程度;若頁面主題脫離網站核心領域太遠,排名可能受限。因此,網站需要專注於其專業領域生產高品質內容,避免為了擴大流量隨意發布無關題材而分散主題焦點。內容策略上應強調專業深度、權威性和原創觀點,以迎合演算法對品質的偏好。
2. 使用者互動信號納入優化考量:過去SEO關注點多在關鍵字和鏈接等,現在證實使用者行為是排名的重要拼圖。這將改變優化工作的衡量指標:不再僅僅追求排名位置,更要追求點擊率(CTR)和用戶停留。具體而言,SEO人員需要開始密切關注Google搜尋主控台中的點擊和展示資料,特別是查找高曝光低點擊的頁面並改善之。這可能涉及優化標題和描述的撰寫,使其更具吸引力與相關性,以提升CTR。同時,網站內容需努力實現所謂「成功點擊」——使用者點擊進入後滿足其需求,不再立即返回Google搜尋。這意味頁面必須開門見山地解答用戶問題,提供良好體驗,因為一旦用戶長時間停留或不再重複搜尋,相當於向Google發出了正面信號。反之,若大量用戶點擊後立刻跳出,Google可能視其為結果不滿意的跡象而降低排名。
3. 品牌與整體站點經營提升重要性:文件證實了網站整體聲譽(SiteAuthority)和品牌知名度對SEO有長遠影響。這意味SEO不再只是頁面層面的遊戲,而更像經營品牌與社群。企業或網站需要注重建立離開Google生態的品牌聲量(如社群媒體曝光、口碑、傳統行銷),因為這些最終會透過使用者搜尋行為(品牌詞搜尋增加)、點擊率、自然鏈接等反映在Google排名上。一個受歡迎的品牌往往獲得更高點擊和更多自然提及,難怪Rand Fishkin將「打造知名品牌」視作提升搜尋流量的首要建議。此外,整站權威度的概念提醒我們不能讓網站某部分內容品質過低,這會拉低整體評價。未來策略應包含站點內容審核,剔除薄弱頁面或提升其品質,以維持整站權威形象。
4. 外部連結策略調整:連結依然在演算法核心,但側重點更精細化。首先,連結相關性比數量更被強調:Google注重鏈接所在頁面的主題和品質。因此,未來獲取來自高流量且相關網站的鏈接會更有價值;這鼓勵SEO從單純追求大量鏈接轉向精挑細選權威且相關的連結來源。其次,文件顯示Google可能對獲得點擊多的頁面上的連結賦予更高權重,因為這些頁面處在Google的「快取記憶」中。換言之,一條來自受眾常訪問、高互動頁面的外鏈,可能比隱僻角落網站的數十條外鏈影響更大。對行銷人員來說,這意味應將公關、內容行銷與SEO結合,努力在主流媒體或行業權威網站上獲得提及,而不是僅僅依賴過往交換連結、私網路(PBN)等舊手法。
5. 技術SEO與用戶體驗融合:Google引入Chrome瀏覽數據和強調用戶互動,使技術SEO與UX(使用者體驗)界線更加模糊。頁面速度、行動裝置友好度、結構良好的內容佈局等技術因素,現在和用戶行為一起作用:技術優化做得好才能承載用戶更多的停留和轉換。文件提到Googlebot爬蟲甚至有能力執行POST、PATCH等複雜請求,意味網站技術架構要能正確回應各類請求以利收錄。更重要的是,SEO人員需要與產品及設計團隊緊密合作,確保登錄頁或內容頁把用戶需求置於首位,提供直觀的資訊呈現和引導。例如,不要讓使用者為找一個關鍵資訊捲動太多篇幅或被繁複廣告干擾。滿意的使用者體驗將轉化為良好的互動信號,進一步正向影響排名。
綜上,Google演算法內部運作細節的曝光,其實最終指向一個核心:提升使用者滿意度。內容品質、相關性、權威度、用戶互動、技術優化,都是為了滿足搜尋使用者的需求與體驗。理解這點有助於我們在驚訝於技術細節之餘,把握不變的優化原則——以使用者為中心。
行銷專業人士應如何調整未來的SEO策略
面對這次震撼業界的資訊洩漏,行銷與SEO從業者需要採取行動,調整策略以保持在未來搜尋排名中的競爭力。以下是根據洩漏內容整理的SEO策略調整建議:
-
- 以用戶為中心,強化SEO與UX協同:將SEO目標從單純獲得排名轉為打造整體成功的用戶搜尋體驗。這需要SEO團隊與網站產品/設計團隊更緊密合作。確保當用戶透過Google點擊進入您的網站時,可以立即找到所需資訊並愉快地瀏覽互動,而非陷入冗長無關的內容。簡言之,SEO引人來,UX留人住——兩者缺一不可。
-
- 關注並優化點擊率(CTR):在有了確切證據後,SEO人員應正式將提升點擊率納入KPI。定期分析搜尋結果的點擊表現,改善標題與描述的撰寫,使其既含相關關鍵詞又具吸引力。同時,監控競爭對手在SERP上的呈現,如果發現自家頁面曝光高但點擊低,應視為緊急優化信號。例如,A/B測試不同的標題措辭,看何者能提升CTR。記住,Google對不同排名位置有預期CTR:若你的頁面低於該預期,可能被替換下去。
-
- 打造專業權威的內容與作者:針對內容策略,培養網站在特定領域的專業性。盡量讓少數具備專業背景的作者產出更多內容,而非大量分散給不同寫手。這有助於在Google內部建立作者實體的權威形象。同時,鼓勵作者在網路其它平台(如知名媒體、學術論壇)發表文章或被引用,以累積其在該主題的聲譽。當Google識別到某作者在全網的專業度,該作者撰寫的內容將更具可信度。未來SEO應該視作者為品牌的一部分,精心經營。
-
- 專注內容原創性與價值,適當控制長度:避免為SEO而SEO的冗長內容。文件顯示原創獨特的內容會有額外加分。行銷人員在策劃內容時,應優先思考有何新見解或獨家資訊能提供給受眾,強調原創研究、深度觀點。在滿足搜索者需求的前提下,不必強求篇幅達到某字數;若能用較短內容高效解決問題,Google也會給予獎勵。當然,對於競爭激烈的主題,可以循序漸進增加內容深度,但切忌為堆砌而拖沓冗長。
-
- 完善網站新鮮度與一致性訊號:為迎合Google對新鮮度的重視,制定內容更新計畫,定期審視舊內容,加入最新資訊或觀點。更新時注意所有日期訊息的一致性:確保文章頁面的顯示日期、模式結構化資料中的日期、站點地圖(XML sitemap)中的最後修改日期相符。這樣Google才能正確解讀內容的新舊程度,不會因日期矛盾而降低對更新的信任。同時,對於自然老化且流量下滑的內容,考慮進行全面翻新或合併重定向,以盤活Google對該URL的過往評價記錄。
-
- 審慎對待過往建站SEO技巧:此次內部資訊也提醒我們,一些舊有的SEO技術觀念可能需要拋棄。例如文件暗示「Link Juice傳遞」與「PageRank雕刻(透過nofollow控制流向)」等過去熱門話題已不再奏效。行銷人員應該持續關注業界新知,及時淘汰過時的最佳實踐,把精力投入更有效的策略上。如今更重要的是關注使用者、內容與品牌本身,而非試圖鑽演算法的空子。總之,以不變應萬變:提供真正有價值的內容與體驗,這仍是歷經演算法變遷後屹立不搖的策略。
-
- 培養實驗與數據驗證文化:鑑於Google官方資訊可能有所保留,SEO團隊更應該自行驗證各種策略的效果。建立小規模A/B測試或多變量實驗,觀察某項改動對流量和排名的影響,而不是僅憑坊間傳聞行事。鼓勵團隊關注多元資訊來源(業界專家文章、會議分享、研究報告),並積極參與SEO社群討論交流。唯有在實踐中驗證,才能找到真正適合自己網站的優化方法。當然,基本的大方向依然適用於所有網站——內容為王、體驗至上,但在細節戰術上,多一分實證就多一分勝算。
透過以上調整,行銷人員可望讓自身的SEO策略更貼合Google實際演算法運作,同時建立起在不可預測的變化中持續前進的能力。簡言之,擁抱以用戶價值為核心的SEO思維,就是對這次洩漏風波最好的回應。
對Google演算法透明度與業界信任的長遠影響
這次Google內部文件外洩事件的不僅對實際策略有影響,也對業界與Google之間的信任關係投下長遠的陰影。多年以來,SEO從業者大體信任Google公佈的指導原則,然而此次眾多內情與官方言論不符,勢必削弱未來社群對Google訊息的信賴。許多SEO人士表示,往後將對Google的說法更加存疑,傾向自己試驗驗證,而不再完全相信官方單方面陳述。這種信任赤字可能帶來幾個層面的影響:
一方面,Google若希望修補與SEO社群的關係,可能需要做出更多努力來增加透明度。業界已有呼聲希望Google能更坦率地與專業從業者交流,例如在不危及機密的前提下多分享一些演算法原理,或恢復昔日那種官方和SEO社群定期互動的傳統(如舉辦類似以前的Google Dance活動,加強彼此理解)。甚至有人建議Google應就以往可能具有誤導性的資訊道歉,重建誠信。雖然Google未必採納這些建議,但可以預見的是,演算法透明度將成為未來討論的焦點之一,尤其在監管機構日益關注大平台透明性的背景下。
另一方面,SEO產業本身可能變得更加自主與團結。這次事件中,社群展現了快速共享資訊、共同解讀研究的熱情。未來即使Google不主動公開細節,SEO專家們也會更積極地透過觀察、逆向工程和交流來揭開黑箱。整個行業或許會涌現更多第三方工具(如已有人將洩漏的14,000個變數製作成檢索工具)和民間研究,彌補資訊鴻溝。長期看,這將促使SEO知識體系更成熟,不再過度依賴Google單方面訊息。
總的來說,Google搜尋排名文件外洩為產業上了重要一課:透明與信任在生態中至關重要。對Google而言,如何在保護演算法安全的同時給予站長與優化人員足夠的指引,是重獲信任的課題;對SEO從業者而言,此事件提醒我們保持獨立思考和求證精神的重要性。未來的搜尋領域,變數也許更多,但唯有牢牢把握「以用戶為中心」這一定律,我們才能在演算法的風暴中立於不敗之地。
參考資料
-
- Danny Goodwin,《HUGE Google Search document leak reveals inner workings of ranking algorithm》,Search Engine Land (2024/5/28)searchengineland.comsearchengineland.com。
-
- Barry Schwartz, 《Google responds to leak: Documentation lacks context》,Search Engine Land (2024/5/29)searchengineland.comsearchengineland.com。
-
- Michael King, 《How SEO moves forward with the Google Content Warehouse API leak》,Search Engine Land (2024/5/30)searchengineland.comsearchengineland.com。
-
- Rand Fishkin, 《An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them》,SparkToro部落格 (2024/5/27)sparktoro.comsparktoro.com。
-
- Okoone數位顧問團隊, 《SEO insights from the Google API documentation leak》,Okoone Blog (2024/7/30)okoone.comokoone.com。
-
- Search Engine Land, 《HUGE Google Search document leak…》相關報導與資料searchengineland.comsearchengineland.com (內含對洩漏文件的分析摘要)。
- Digital Marketing Institute, Clark Boyd, 《The Google API Documentation Leak: 10 Insights for Digital Marketers》(2024/6/18)okoone.comokoone.com (提供行銷人員觀點的十大啟示)。
- Search Engine Land, 《HUGE Google Search document leak…》相關報導與資料searchengineland.comsearchengineland.com (內含對洩漏文件的分析摘要)。
