由週四發佈的“網路垃圾偵測(Webspam)報告“可知,Google搜尋在 2021 年過濾的垃圾網站數量、竟是 2020 年的六倍。據悉,作為 Alphabet 旗下子公司,Google 有一套名為 SpamBrian 的人工智慧垃圾過濾系統,並且可在超過 99% 情況下實現“不受垃圾所困擾”(spam-free)的搜尋體驗。
此前,SpamBrain 已被Google用於防止用戶點擊那些可能被注入了惡意軟體的有害網站、或旨在誘騙人們洩露個人資訊 / 匯款的詐騙網站。
Google 表示,鑒於垃圾資訊散播者在持續不斷地找到繞過過濾機制的方法,基於人工智慧的篩查系統也是相當必要的。
需要指出的是,搜尋是 Google 的重要收入來源之一。而高品質和安全的網站搜尋結果,也對該公司來說至關重要。
經過多年摸索,垃圾網站製作方早已精通搜尋引擎優化(SEO)技術,來人為地提升其搜尋排名。
作為應對,Google 也迫切需要排除掉那些利用欺詐演算法的垃圾網站。
截至目前,Google 已借助 SpamBrain 將垃圾網站砍掉 70%,其中包括被駭客入侵並植入有害代碼的感染網站。若被其得逞,受害者將被竊取登錄憑據等機密資訊。
其它類型的垃圾網站,還涉及將惡意軟體注入受害者的電腦、或誘導重定向至惡意網站。慶倖的是,Google 聲稱 SpamBrain 能夠將這類害群之馬排除在搜尋結果之外。
Google 政策溝通經理 Ned Adriance 在一封電子郵件中提到:
欺詐者經常拙劣地模仿其它網站,常見方法是填充替換關鍵字、假借品牌LOGO、並附上想要引誘受害者撥打的電話號碼。
而 Google 的 SpamBrain 演算法方案,能夠基本上確保此類欺詐型網站出現在相關搜尋結果頁面中,且過濾了 75% 的亂碼垃圾網站。
這些垃圾網站往往在一堆無意義的文本中填充大量關鍵字,以試圖提升其搜尋排名。有時甚至會砸錢掛上垃圾連結,來誘騙搜尋引擎的爬蟲和抬升 PageRank 品質評分。
對於用戶來說,時間總是相當寶貴的。而 Google 的各種解決方案,就希望為使用者帶來更好的內容觀看體驗。
【背景資料】
Google 於 2018 年推出的 SpamBrain 系統,且與近 20 年前剛開始治理惡意網站時相比,去年搜尋過濾的垃圾網站數量已暴增 200 倍。
即便如此,這場“道高一尺魔高一丈”的垃圾資訊攻防戰,顯然不會輕易完結。
消息來源
|