百度搜索資源平臺(tái)于5月25日通過“VIP大講堂-網(wǎng)站安全專題”活動(dòng),正式發(fā)布HTTPS站點(diǎn)全流程支持方案,引發(fā)站長群體高度關(guān)注。現(xiàn)就該方案核心內(nèi)容進(jìn)行系統(tǒng)梳理,以供從業(yè)者參考。
HTTPS作為在HTTP協(xié)議基礎(chǔ)上融入TLS/SSL加密層的安全通信協(xié)議,通過數(shù)據(jù)加密傳輸機(jī)制,有效保障了網(wǎng)絡(luò)通信的機(jī)密性與完整性,能夠顯著抵御中間人攻擊、數(shù)據(jù)竊聽及內(nèi)容篡改等安全威脅,為用戶提供更安全的訪問環(huán)境。
百度Spider發(fā)現(xiàn)HTTPS站點(diǎn)主要通過四類路徑:其一,依據(jù)網(wǎng)頁中超鏈接的協(xié)議類型,若鏈接為HTTPS,則判定對(duì)應(yīng)站點(diǎn)為HTTPS站點(diǎn);其二,結(jié)合站長平臺(tái)主動(dòng)提交入口,若站長提交的文件鏈接為HTTPS,則按HTTPS路徑進(jìn)行發(fā)現(xiàn);其三,參考前鏈抓取的相對(duì)路徑邏輯,當(dāng)首個(gè)抓取網(wǎng)頁為HTTPS時(shí),其內(nèi)部相對(duì)路徑鏈接將自動(dòng)關(guān)聯(lián)為HTTPS;其四,鏈接歷史狀況輔助糾錯(cuò),針對(duì)HTTPS提取偏差問題,通過抓取失敗率、內(nèi)容展現(xiàn)一致性等指標(biāo)進(jìn)行校準(zhǔn),確保發(fā)現(xiàn)準(zhǔn)確性。
當(dāng)前HTTPS鏈接抓取主要涵蓋兩種模式:一是純HTTPS站點(diǎn)抓取,即站點(diǎn)無HTTP版本,直接通過HTTPS協(xié)議進(jìn)行內(nèi)容獲取;二是HTTP到HTTPS的重定向抓取,即用戶通過HTTP訪問時(shí),服務(wù)器通過301/302重定向至HTTPS,Spider同樣可完成正常抓取,其抓取效果與HTTP站點(diǎn)保持一致。
在搜索結(jié)果展現(xiàn)端,HTTPS站點(diǎn)數(shù)據(jù)將獲得顯著標(biāo)識(shí),通過瀏覽器安全鎖圖標(biāo)、https://前綴等視覺元素,向用戶直觀傳遞網(wǎng)站安全信息,提升用戶信任度。
針對(duì)站長在HTTPS升級(jí)過程中遇到的局部HTTP鏈接殘留問題,百度站長平臺(tái)已升級(jí)至全站HTTPS支持機(jī)制。此前平臺(tái)采用URL級(jí)逐條替換模式,需完成全站抓取才能實(shí)現(xiàn)協(xié)議轉(zhuǎn)換;如今平臺(tái)在左側(cè)工具欄新增“HTTPS認(rèn)證”功能模塊,引導(dǎo)站長進(jìn)行全站HTTPS配置。需特別注意的是,該功能僅適用于已完成全站HTTPS改造的站點(diǎn),否則可能因協(xié)議不一致導(dǎo)致站點(diǎn)體驗(yàn)受損。
站長完成HTTPS配置后,平臺(tái)將啟動(dòng)自動(dòng)化驗(yàn)證流程,主要從三方面進(jìn)行校驗(yàn):一是鏈接可抓取性驗(yàn)證,確保HTTPS鏈接能被正常訪問;二是證書合法性校驗(yàn),檢查證書是否由受信任的CA機(jī)構(gòu)簽發(fā);三是證書有效性校驗(yàn),核驗(yàn)證書是否在有效期內(nèi)及與域名匹配度,避免因證書問題導(dǎo)致配置失效。
驗(yàn)證通過后,平臺(tái)將實(shí)現(xiàn)全站HTTPS生效切換,具體包含兩方面:一是抓取端全面切換,Spider將以HTTPS協(xié)議作為主要抓取方式,提升HTTPS內(nèi)容抓取效率;二是展現(xiàn)端樣式統(tǒng)一,搜索結(jié)果中HTTPS站點(diǎn)標(biāo)識(shí)將全面覆蓋,該機(jī)制較傳統(tǒng)URL級(jí)替換效率顯著提升,通過跳過已收錄HTTP頁面的重復(fù)處理,直接實(shí)現(xiàn)HTTPS數(shù)據(jù)展現(xiàn)。
針對(duì)站長普遍關(guān)注的HTTPS升級(jí)影響問題,經(jīng)平臺(tái)驗(yàn)證:HTTPS升級(jí)不會(huì)影響爬蟲抓取,Spider可正常抓取合法HTTPS鏈接;不會(huì)影響索引量,建庫系統(tǒng)已支持HTTPS數(shù)據(jù)同步,無索引延遲;不會(huì)影響排名、點(diǎn)擊及流量,改造過程不涉及域名切換,可實(shí)現(xiàn)無損過渡;不會(huì)影響移動(dòng)適配,現(xiàn)有適配規(guī)則兼容HTTPS站點(diǎn);不影響站長平臺(tái)工具使用,鏈接提交等功能已全面支持HTTPS。
建議站長采用HTTP到HTTPS的301永久重定向配置,避免僅開放HTTPS訪問而無跳轉(zhuǎn)機(jī)制,單一HTTPS入口可能導(dǎo)致部分用戶因網(wǎng)絡(luò)環(huán)境或?yàn)g覽器兼容性問題無法正常訪問。
不建議HTTP與HTTPS版本長期并存,原因在于:一是增加雙版本維護(hù)成本,需同步更新兩套內(nèi)容;二是HTTP版本存在安全漏洞風(fēng)險(xiǎn),無法保障數(shù)據(jù)傳輸安全;三是長期并存易導(dǎo)致內(nèi)容不一致性,影響用戶體驗(yàn)。建議完成HTTPS改造后,通過跳轉(zhuǎn)預(yù)設(shè)確保唯一訪問入口。
HTTPS回退至HTTP的操作需嚴(yán)格規(guī)避。例如,若已向用戶推送HTTPS鏈接,卻突然回退至HTTP,將導(dǎo)致瀏覽器展現(xiàn)死鏈樣式,嚴(yán)重影響用戶體驗(yàn)。確需回退時(shí),務(wù)必提前24小時(shí)在站長平臺(tái)提交HTTPS校驗(yàn)及回退申請(qǐng),確保搜索結(jié)果平滑過渡,避免死鏈問題。
HTTPS網(wǎng)頁未完全建設(shè)完成前,不建議對(duì)外提供超鏈接。曾有案例顯示,部分站點(diǎn)在HTTPS內(nèi)容未完善時(shí),開放HTTP訪問或HTTPS頁面為臨時(shí)占位頁,導(dǎo)致站點(diǎn)被誤識(shí)別為HTTPS站點(diǎn)并展現(xiàn),引發(fā)用戶訪問體驗(yàn)問題。