- 相關(guān)推薦
360搜索上線“后羿算法”保護(hù)原創(chuàng)
引導(dǎo)語:近日,360搜索發(fā)布站長(zhǎng)公告,宣布上線后羿算法,對(duì)低劣的采集站點(diǎn)加以控制,對(duì)原創(chuàng)和稀缺性網(wǎng)頁進(jìn)行保護(hù)和提權(quán),與站長(zhǎng)共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境。下面我們一起來看一下具體內(nèi)容。
互聯(lián)網(wǎng)冗余信息已達(dá)百億 嚴(yán)重挫傷原創(chuàng)積極性
“原創(chuàng)+轉(zhuǎn)載+信息分類聚合”已經(jīng)成為互聯(lián)網(wǎng)新聞網(wǎng)站的最常見內(nèi)容產(chǎn)出模式,比如新浪、搜狐、網(wǎng)易這些傳統(tǒng)門戶,和今日頭條等移動(dòng)APP。原創(chuàng)內(nèi)容保證了網(wǎng)站的獨(dú)特性,而轉(zhuǎn)載內(nèi)容保證網(wǎng)站信息的足夠全面,大量的分類聚合工作,讓互聯(lián)網(wǎng)信息條理清楚類目分明。
網(wǎng)站之間常規(guī)的轉(zhuǎn)載,要求轉(zhuǎn)載網(wǎng)站在醒目位置列出文章出處和原創(chuàng)頁面入口,用戶可以直接跳轉(zhuǎn)到原創(chuàng)頁面。但采集站,往往隱瞞或者篡改文章出處,且不分條理的盲目抓取互聯(lián)網(wǎng)信息。為了獲得流量收益,采集站會(huì)在頁面中夾雜大量的廣告和彈窗信息,不僅浪費(fèi)了搜索引擎的收錄資源,侵害了原創(chuàng)作者的版權(quán),用戶搜索體驗(yàn)也大打折扣。
據(jù)估計(jì),用戶喜歡的高質(zhì)量原創(chuàng)內(nèi)容,互聯(lián)網(wǎng)每天會(huì)誕生數(shù)十萬個(gè)頁面,與之成鮮明對(duì)比的是,采集網(wǎng)站帶來互聯(lián)網(wǎng)上的冗余信息則高達(dá)上百億個(gè)頁面,與冗余信息相比,原創(chuàng)內(nèi)容可謂九牛一毛。
采集站的內(nèi)容分布領(lǐng)域非常廣泛,常見的領(lǐng)域有普通問答類,商品購物類,娛樂新聞?lì)悾髽I(yè)商情類,成人色情類,賭博詐騙類,私服外掛類,違法違禁類等,涵蓋了互聯(lián)網(wǎng)內(nèi)容的各大領(lǐng)域。與此同時(shí),移動(dòng)互聯(lián)網(wǎng)的采集和垃圾網(wǎng)頁,雖然其數(shù)量級(jí)要比PC端要低,但在行為模式方面與PC端區(qū)別不大。
“后羿算法”倡導(dǎo)原創(chuàng),控制惡意采集
12月26日,360搜索發(fā)布站長(zhǎng)公告,宣布上線抑制采集保護(hù)原創(chuàng)的高級(jí)算法“悟空算法”,該算法將對(duì)低劣的采集站點(diǎn)加以控制,對(duì)原創(chuàng)和稀缺性網(wǎng)頁進(jìn)行保護(hù)和提權(quán)。360搜索表示,愿與無數(shù)專心做好站的站長(zhǎng)共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境
“后羿算法”上線后,對(duì)于內(nèi)容豐富的優(yōu)質(zhì)網(wǎng)頁(如原創(chuàng)、稀缺資源、精心編輯的內(nèi)容頁等),會(huì)增加其在用戶面前展現(xiàn)的機(jī)會(huì);對(duì)于濫用采集手段的行為(如整站大規(guī)模采集,頁面內(nèi)容拼湊、含有大量廣告干擾用戶閱讀、惡劣彈窗跳轉(zhuǎn)、大量堆砌無關(guān)熱詞、站內(nèi)搜索結(jié)果頁等),會(huì)顯著降低其展現(xiàn)機(jī)會(huì)和網(wǎng)頁收錄量;對(duì)于新聞網(wǎng)站正常的轉(zhuǎn)載行為,采取了合理引導(dǎo)和規(guī)范控制,而不是一棒子打死。
據(jù)悉,后羿算法采取了業(yè)界領(lǐng)先的大規(guī)模并行機(jī)器學(xué)習(xí)算法,通過億萬維度特征的刻畫,結(jié)合對(duì)搜索領(lǐng)域問題的不斷探索和實(shí)踐,對(duì)海量文本數(shù)據(jù)進(jìn)行主題和內(nèi)容傾向性分析,對(duì)用戶喜好程度進(jìn)行全面建模和應(yīng)用,能夠?qū)υ瓌?chuàng)信息進(jìn)行快速而精準(zhǔn)的鑒別,能夠?qū)Σ杉袨楹屠W(wǎng)頁進(jìn)行定向的約束和管控。
360搜索一直以來都掌握著采集類站點(diǎn)的完整索引量和歷史行為模式,并對(duì)之進(jìn)行長(zhǎng)期的密切的關(guān)注和監(jiān)控,一旦發(fā)現(xiàn)有惡劣作弊傾向就會(huì)進(jìn)行嚴(yán)肅處理,用“后羿“命名該算法,就是為了秉承了英雄后羿的“去除冗余,除暴安良”精神。
原創(chuàng)收錄異議 可求助站長(zhǎng)平臺(tái)
公告中,360搜索表示將矢志不移地與無數(shù)專心做好站的站長(zhǎng)共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境。360搜索建議那些存有惡意采集行為的站長(zhǎng),能夠從長(zhǎng)遠(yuǎn)發(fā)展考慮,積極完善網(wǎng)站建設(shè),提供更多時(shí)效性高、內(nèi)容豐富的原創(chuàng)內(nèi)容,引擎將隨著網(wǎng)站完善,不斷提升收錄量。
360搜索同時(shí)也歡迎原創(chuàng)網(wǎng)頁的作者,通過360站長(zhǎng)平臺(tái)主動(dòng)提報(bào)收錄缺失的信息。對(duì)于原創(chuàng)網(wǎng)站和作者,如發(fā)現(xiàn)自己的內(nèi)容被惡意采集,對(duì)采集判定結(jié)果及收錄狀況存在異議時(shí),360搜索建議通過站長(zhǎng)平臺(tái)的反饋中心及360搜索論壇版主進(jìn)行反饋:
●站長(zhǎng)平臺(tái)反饋中心:http://info.so.com/feedback.html?product=zhanzhang
●360搜索論壇: http://bbs.#/forum-137-1.html
●站長(zhǎng)平臺(tái)注冊(cè)地址:http://zhanzhang.so.com/
●站長(zhǎng)平臺(tái)使用說明請(qǐng)見:http://www.so.com/help/help_3_3.html
【360搜索上線“后羿算法”保護(hù)原創(chuàng)】相關(guān)文章:
線上線下創(chuàng)業(yè)項(xiàng)目05-02
京東商城圖書頻道上線 欲挑戰(zhàn)當(dāng)當(dāng)卓越05-26
搜狗向左 360向右 不是冤家不聚首06-12
大學(xué)生賣原創(chuàng)明信片 兩小時(shí)掙了600元05-08
360CEO周鴻祎:創(chuàng)業(yè),要少功利多學(xué)習(xí)05-29