- 相關(guān)推薦
有關(guān)淘寶首頁的基礎(chǔ)知識(shí)
很多人都用淘寶,但是對(duì)淘寶首頁并不了解,小編這里帶來一位淘寶首頁的設(shè)計(jì)師的講解,希望可以讓你對(duì)淘寶首頁有一個(gè)基本的認(rèn)識(shí)。
一、相關(guān)背景介紹
淘寶首頁是淘寶的門面,承載著幾乎淘系所有業(yè)務(wù)的入口,流量很大,量級(jí)單位為億。近幾年無線端崛起,業(yè)務(wù)重點(diǎn)開始向無線終端偏移(目前不能叫偏移,基本以無線為主了),所以淘寶 PC 端首頁的流量也有削減,不過即便如此,它的日均 PV 依然相當(dāng)高。
淘寶首頁一向是內(nèi)部平臺(tái)和技術(shù)的試驗(yàn)田,它一直在變化著。最新的框架和系統(tǒng)都會(huì)找淘寶首頁試點(diǎn),可以試想下,如果某一項(xiàng)需要推動(dòng)的升級(jí)或者優(yōu)化措施在淘寶首頁已經(jīng)上線,并且拿到了良好的數(shù)據(jù)和穩(wěn)定性,其他業(yè)務(wù)還有什么理由不去嘗試和更迭呢?同時(shí),去年一年身在淘寶前端的技術(shù)架構(gòu)組,自然而然也會(huì)主動(dòng)去 push 一些實(shí)驗(yàn)性的內(nèi)容到業(yè)務(wù)上。
淘系的站點(diǎn)頁面包括首頁、其他頻道頁和活動(dòng)頁等,這些頁面并不都由淘寶前端一行一行的代碼碼出來,業(yè)務(wù)如此之多,這種玩法即便人數(shù) double 也忙不過來。事實(shí)上,大多數(shù)頁面都是依托內(nèi)部的搭建平臺(tái)——運(yùn)營或者前端通過模塊搭建的方式——構(gòu)建的,而前端 focus 的重點(diǎn)在于搭建平臺(tái)的建設(shè)自身以及模塊的通用性和復(fù)用率的保障,當(dāng)然,還有一些工程化的東西。
使用搭建平臺(tái)搭建的頁面,前端只需要考慮組成頁面的原子模塊的開發(fā),整體的渲染由搭建平臺(tái)提供的統(tǒng)一腳本全權(quán)負(fù)責(zé)。而在淘寶首頁上,考慮到頁面模塊數(shù)量巨多,加上還有少量跨部門、跨團(tuán)隊(duì)的溝通,渲染模型略微不同。
二、淘寶首頁的整體變遷
背景中提到,淘寶首頁依托于內(nèi)部搭建平臺(tái),它的變遷自然也是跟著搭建系統(tǒng)的變化而變化的。
1、PHP 下的淘寶首頁
接手淘寶首頁不久,便遇到了一年一度的改版,那時(shí)它還運(yùn)行在 PHP 環(huán)境中。這里需要說明的是,淘寶首頁的所有代碼完全由前端掌控,前端不會(huì)直接跟數(shù)據(jù)庫打交道,其數(shù)據(jù)來源分為兩部分。
數(shù)據(jù)來源
一是運(yùn)營填寫的數(shù)據(jù)。 采用前端挖坑的形式,預(yù)留坑位讓運(yùn)營獲取填寫數(shù)據(jù),
運(yùn)營填寫這些坑位就會(huì)產(chǎn)生這份 PHP 模板對(duì)應(yīng)的數(shù)據(jù),最后渲染出來就是一個(gè)完整的 HTML 片段(實(shí)時(shí)性渲染)。
舊版搭建系統(tǒng)中就是通過這種方式構(gòu)造一個(gè)子模塊。我描述得十分簡單,但作為一個(gè)平臺(tái)它需要考慮的東西還有很多,比如數(shù)據(jù)順序的控制、定時(shí)發(fā)布、回滾機(jī)制、過濾機(jī)制、篩選機(jī)制、數(shù)據(jù)的同步、數(shù)據(jù)的更新、版本控制、權(quán)限控制、其他系統(tǒng)的引用等等。
二是后端或者個(gè)性化平臺(tái)提供的數(shù)據(jù)。 不同的業(yè)務(wù)有不同的訴求。一些業(yè)務(wù)有自己的后端,他們要求使用自己業(yè)務(wù)產(chǎn)出的數(shù)據(jù);有的業(yè)務(wù)希望用戶看到的內(nèi)容不一樣,千人千面,期望接入算法;一些業(yè)務(wù)跟賣家直接打交道,期望使用招商數(shù)據(jù);而有些業(yè)務(wù)期望采用運(yùn)營從數(shù)據(jù)池篩選出來的數(shù)據(jù)……總之,淘寶首頁需要對(duì)接形形色色的系統(tǒng),接口繁多。后面會(huì)提到對(duì)動(dòng)態(tài)數(shù)據(jù)源的整合。
并且這些系統(tǒng)對(duì)應(yīng)的域名是不一樣的,JSONP 格式自然也就成了首選。但一些特殊的系統(tǒng),比如廣告,它的渲染并不是一個(gè)簡單的 JSONP 請(qǐng)求,可能它還要干預(yù)整個(gè)廣告的渲染流程,比如加載他們的 JS,把渲染的控制權(quán)交過去。
頁面的架構(gòu)
上面介紹了數(shù)據(jù)的來源和子模塊的結(jié)構(gòu),那么整個(gè)頁面又是如何構(gòu)成的呢?模塊的搭建分為兩種,一種是可視化搭建,運(yùn)營或者前端可以將開發(fā)好的模塊(或者模塊庫中選取的模塊)拖拽到容器內(nèi),形成一個(gè)頁面:
當(dāng)然,上圖也只是一個(gè)模型,作為一個(gè)系統(tǒng)需要考慮的問題還有很多很多,如頁面的布局、多終端適配、模塊的臨時(shí)隱藏、位置調(diào)整、皮膚選擇、模塊的復(fù)制等等。
通過模塊 id 將模塊引入,并且添加一些類似 lazyload 的標(biāo)記,方便控制渲染節(jié)奏和數(shù)據(jù)入口。源碼搭建和模塊搭建的區(qū)別在于,前者更易于控制模塊的結(jié)構(gòu)以及模塊的渲染順序。
動(dòng)態(tài)數(shù)據(jù)源
首頁面對(duì)一大堆接口和平臺(tái),對(duì)接幾十個(gè)業(yè)務(wù)方,接口是個(gè)很大的問題,由于后臺(tái)系統(tǒng)的差異,基本沒有辦法統(tǒng)一數(shù)據(jù)源的格式,一旦運(yùn)營哪天心血來潮要換一個(gè)他自己覺得用的更爽的或者數(shù)據(jù)更好的系統(tǒng),前后端估計(jì)又得溝通和對(duì)接幾次。
平臺(tái)具備數(shù)據(jù)源接入的能力,也就是說我們挖的坑不僅僅可以讓運(yùn)營填數(shù)據(jù),還可以從各種數(shù)據(jù)源中直接導(dǎo)入數(shù)據(jù),當(dāng)然,這里需要進(jìn)行一次數(shù)據(jù)字段的映射轉(zhuǎn)換。
綁定之后,數(shù)據(jù)既可以同步輸出,也可以異步輸出,這些都是平臺(tái)提供的能力。這個(gè)方案基本上解決了后端系統(tǒng)/接口變化的問題,并且減少了前后端之間的溝通成本。
不過這里需要注意的是,雖然頁面上的接口都通過平臺(tái)統(tǒng)一梳理了一次,這也意味著,頁面所有的請(qǐng)求會(huì)先流經(jīng)平臺(tái),然后分發(fā)到各個(gè)后端,平臺(tái)的抗壓能力要求很高。
2、PHP 到 Node 的變遷
淘寶首頁日均請(qǐng)求的這個(gè)量級(jí),不可能是十幾二十臺(tái)臺(tái)服務(wù)器抗得住的,支撐它必須有一個(gè)服務(wù)集群。
每一個(gè) CDN 節(jié)點(diǎn)上都具備 PHP 渲染的能力,當(dāng)頁面發(fā)布時(shí),我們把該頁面所有的模塊和數(shù)據(jù)同步到全部 CDN 節(jié)點(diǎn)上,基本模式大概就是如此了?雌饋磉挺不錯(cuò),但是經(jīng)過一段時(shí)間的運(yùn)維,很多安全、性能問題都慢慢浮現(xiàn)出來了:
性能問題。 每個(gè) PHP 頁面包含多個(gè)子模塊,而子模塊也有可能引用了其他的子模塊,PHP 的 include 操作是存在消耗的,每一次引用都是一次磁盤 IO,一個(gè)渲染節(jié)點(diǎn)上跑了成千上萬個(gè)類似淘寶首頁的 PHP 頁面,并發(fā)一高其效率可想而知。
推送機(jī)制問題。 文件同步是一種比較惡心的機(jī)制。首先,時(shí)間上沒法控制,一個(gè)文件同步到所有的節(jié)點(diǎn),快則幾秒鐘,慢的話耗時(shí)會(huì)超過一兩分鐘;并且同步過程還有可能失敗,健康檢測的成本也是相當(dāng)高的。發(fā)布比較緊湊時(shí),需要同步的文件也很多,很容易造成隊(duì)列堆積,加劇同步差的體驗(yàn)。
實(shí)時(shí)性強(qiáng)需求問題。 文件在推送之前,還可能經(jīng)過一些前置系統(tǒng),發(fā)布鏈路越長,線上生效時(shí)間越慢,慢的時(shí)候大約五分鐘才生效,這樣的延時(shí)對(duì)于實(shí)時(shí)性要求很高(如秒殺)的需求來說是完全不能接受的。
當(dāng)然,還有很多其他問題,如運(yùn)維成本增高、安全風(fēng)險(xiǎn)增高、PHP 資深人才儲(chǔ)備不足等等。所以 PHP 渲染容器的命運(yùn),就是,被干掉。
服務(wù)集群為 Cache CDN,它只有靜態(tài)文件處理能力,沒有 PHP/Node 的渲染能力,所以處理效率高,性能也好,抗壓能力相當(dāng)強(qiáng),并且扛不住的時(shí)候還可以花錢買服務(wù),拓展 Cache 集群。
用戶訪問時(shí),Nginx 轉(zhuǎn)到 Cache CDN,如果命中緩存則直接返回,沒有命中便回源到源站服務(wù)器。源站服務(wù)器是具備模塊渲染能力的 Node 服務(wù),它可以做很多事情:
· 控制 Cache 響應(yīng)頭,通過 max-age 和 s-maxage 控制頁面在客戶端的緩存時(shí)間以及在 Cache 上的緩存時(shí)間,這個(gè)緩存時(shí)間可以根據(jù)需求隨時(shí)做調(diào)整,比如大促的時(shí)候調(diào)長一些;
· 控制內(nèi)外網(wǎng)環(huán)境,和 AB 測試狀態(tài);
· 融合前端相關(guān)的工具鏈,比如檢測、壓縮、過濾等等。
它的優(yōu)勢有很多,這里不一一列舉了。這個(gè)模式中還添加了一層容災(zāi),源站服務(wù)器每隔一段時(shí)間將數(shù)據(jù)推送到于 Cache 同機(jī)房的備份服務(wù)器,一點(diǎn)源站掛了,還能夠自動(dòng)容災(zāi)到備份數(shù)據(jù)上。
模式的變化不僅在運(yùn)維上有了突破,CDN 被攻擊時(shí)的安全風(fēng)險(xiǎn)也低了很多,同時(shí)也省卻了 sync 所需的各種檢測機(jī)制,每年節(jié)約成本也是百萬以上,優(yōu)勢還是相當(dāng)明顯。
3、Node,不一樣的模式
上面 PHP 模塊中,我們只說了 HTML 和數(shù)據(jù)部分,用心的讀者應(yīng)該已經(jīng)發(fā)現(xiàn),CSS 和 JS 這些靜態(tài)資源都沒提到,那頁面是如何渲染的呢?
舊版 PHP 頁面中,我們是直接引入了一個(gè) CSS 和一個(gè) JS,淘寶這邊采用的是 git 版本迭代發(fā)布,這些靜態(tài)資源都是直接放在一個(gè) git 倉庫中。也就是這樣:
每次發(fā)布完 git 文件,再修改 PHP 的版本號(hào),然后發(fā)布 PHP 代碼。當(dāng)然,也做了相關(guān)的優(yōu)化,比如發(fā)布 git 時(shí)自動(dòng)更新版本號(hào)等。
一個(gè)模塊的 CSS/JS 和模板放在一起,CSS/JS 與頁面其他模塊的靜態(tài)資源是相互獨(dú)立的,目的就是希望單個(gè)模塊也能夠完整的跑起來,更加利于模塊的復(fù)用。
而模塊的挖坑,也從模板中獨(dú)立了出來,采用 JSON Schema 的形式定義數(shù)據(jù)格式:
模塊之間相互獨(dú)立隔離,所以會(huì)存在一定程度的冗余,不過模塊解偶帶來的收益要比這點(diǎn)冗余要多得多。事實(shí)上,我們是通過一個(gè)倉庫去管理單個(gè)模塊的。頁面的渲染就比較簡單了,源站 Node 容器會(huì)將所有的 index.xtpl 合并成一個(gè) page.xtpl,為減少頁面請(qǐng)求,css 和 js 也會(huì) combo 成一個(gè)文件。
任何模塊的更新,頁面都會(huì)有感知,下次進(jìn)入系統(tǒng)時(shí),就會(huì)提示是否需要升級(jí)模塊和頁面。
三、淘寶首頁的性能優(yōu)化
首頁模塊眾多,如果一口氣吐出來,DOM 數(shù)量必然超過 4k 個(gè),其結(jié)果就是首屏?xí)r間極長。按照 TMS 的開發(fā)規(guī)范,每個(gè) TMS 模塊都包含一個(gè) index.js 和 index.css,最后展示出來兩個(gè) combo 的 js 和 css。首頁加載的時(shí)候也不會(huì)一口氣執(zhí)行所有 index.js,否則剛開始頁面阻塞會(huì)十分嚴(yán)重。
頁面的渲染邏輯
· 遍歷所有 TMS 模塊(包含一個(gè) J_Module 的鉤子);
· 部分 TMS 模塊無 JS 內(nèi)容,但是加載了一個(gè) index.js,為模塊添加 tb-pass 的 class,用于跳過該模塊 JS 的執(zhí)行;
· 將頁面分為兩塊,首屏為一塊,非首屏整體為第二塊,先將首屏模塊加入到懶加載監(jiān)控;
· 待首屏模塊加載完成,或者用戶處理了頁面交互時(shí)(滾動(dòng)、鼠標(biāo)移動(dòng)等),將非首屏模塊加入到懶加載監(jiān)控;
· 處理一些特殊模塊,它們會(huì)在進(jìn)入視窗之前幾百像素就開始加載;
· 監(jiān)控滾動(dòng),按照以上邏輯,渲染模塊;
· 部分模塊即便是被執(zhí)行了,也不一定渲染出來,因?yàn)樗膬?yōu)先級(jí)不高,在模塊內(nèi)部加了事件監(jiān)聽,比如等到 mouseover/onload 事件觸發(fā)的時(shí)候再渲染這些內(nèi)容。
代碼的性能優(yōu)化是一個(gè)精細(xì)活,如果你要在一個(gè)龐大的未經(jīng)優(yōu)化的頁面上做性能優(yōu)化,可能會(huì)面臨一次重構(gòu)代碼。上面的文章提到的是頁面內(nèi)部的細(xì)節(jié)優(yōu)化,但是在開發(fā)流程中做的規(guī)范化、標(biāo)準(zhǔn)化,以及線上訪問通路中的各個(gè)環(huán)節(jié)優(yōu)化還沒有提及。
四、淘寶首頁的穩(wěn)定性保障
在大流量下,任何小問題都會(huì)被放大成大問題,所以開發(fā)環(huán)節(jié)遇到的任何偶發(fā)性問題都需要引起重視。不過很多偶發(fā)性問題在我們的測試環(huán)境中是找不到的,比如與地域相關(guān)的問題(如上海的某個(gè) CDN 節(jié)點(diǎn)掛了),用戶屬性問題(如 nickname 最后一個(gè)為字母 s 的用戶頁面天窗),瀏覽器插件問題,運(yùn)營商廣告注入問題等等。
難以在上線之前把所有問題考慮周全,但是有兩點(diǎn)是必須做好的:兜底容災(zāi) + 監(jiān)控預(yù)警。
1、兜底容災(zāi)機(jī)制
兜底容災(zāi)有兩個(gè)層面的考慮:
· 異步接口請(qǐng)求錯(cuò)誤,包括接口數(shù)據(jù)格式錯(cuò)誤,接口請(qǐng)求超時(shí)等;
· 同步渲染,源站頁面渲染出錯(cuò)。
異步接口請(qǐng)求,主要涉及到的是后臺(tái)系統(tǒng),對(duì)接系統(tǒng)較多,各個(gè)系統(tǒng)的穩(wěn)定性和抗壓能力各不相同,這方面的保障有多種方案。
每次數(shù)據(jù)請(qǐng)求都緩存到本地,并且為每個(gè)接口都提供一個(gè)硬兜底。還有一種方案是「重試」,請(qǐng)求一次不成功那就請(qǐng)求第二次。
對(duì)于同步渲染,它只需要頁面模板和同步數(shù)據(jù),兩者中任一種存在錯(cuò)誤,源站都會(huì)報(bào)錯(cuò),此時(shí)回源返回的內(nèi)容就是一個(gè) error 頁面,狀態(tài)碼為 5xx。這個(gè)錯(cuò)誤不一定是開發(fā)者造成的,有可能是系統(tǒng)鏈路出現(xiàn)同步異;蛘邤嗦穯栴}。
一旦源站任何異常,Nginx 都會(huì)轉(zhuǎn)到與 Cache CDN 同機(jī)房的首頁鏡像上去,這個(gè)鏡像內(nèi)容就是淘寶首頁的 HTML 備份源碼。
2、監(jiān)控預(yù)警機(jī)制
監(jiān)控也有兩個(gè)層面:
· 模塊級(jí)別的監(jiān)控,接口請(qǐng)求布點(diǎn)、模塊天窗檢測等;
· 頁面的監(jiān)控,在頁面上添加特殊標(biāo)記,定時(shí)回歸所有 CDN 節(jié)點(diǎn),查看特殊標(biāo)記是否存在。
模塊層面的監(jiān)控,內(nèi)容還是相當(dāng)多的,監(jiān)控的點(diǎn)越多越詳細(xì),到最后定位問題的效率就會(huì)越高,比如在一個(gè)稍微復(fù)雜的模塊上,我會(huì)埋下這些監(jiān)控:
· 接口請(qǐng)求格式錯(cuò)誤、請(qǐng)求失敗、請(qǐng)求超時(shí),至少三個(gè)埋點(diǎn);
· 硬兜底數(shù)據(jù)請(qǐng)求失敗埋點(diǎn);
· 模塊 5s 內(nèi)沒有渲染完成統(tǒng)計(jì)埋點(diǎn);
· 模塊內(nèi)鏈接和圖片黑白名單匹配埋點(diǎn)。
其中部分監(jiān)控還會(huì)自動(dòng)處理明確的錯(cuò)誤,比如 https 頁面下出現(xiàn)了 http 的圖片,會(huì)立即自動(dòng)處理掉這些問題。
3、上線前的自動(dòng)化檢測
這屬于淘寶整個(gè)工程化環(huán)境的一部分,前端自動(dòng)化測試。一般會(huì)在上線之前處理這些問題:
· 檢測 HTML 是否符合規(guī)范
· 檢測 https 升級(jí)情況
· 檢測鏈接合法性
· 檢測靜態(tài)資源合法性
· 檢測 JavaScript 報(bào)錯(cuò)
· 檢測頁面加載時(shí)是否有彈出框
· 檢測頁面是否調(diào)用 console.*
· 頁面 JS 內(nèi)存記錄
當(dāng)然,也可以自己添加測試用例,比如檢測接口數(shù)據(jù)格式、模塊天窗問題等。自動(dòng)化檢測也可以設(shè)定定時(shí)回歸,還是比較有保障的。
五、淘寶首頁的敏捷措施
1、健康檢查
頁面模塊眾多,為了能夠追蹤頁面上每一個(gè)小點(diǎn)的變化,我在請(qǐng)求、渲染的每一個(gè)環(huán)節(jié)都做了詳細(xì)的統(tǒng)計(jì)。
一旦接口請(qǐng)求失敗,或者接口走了容災(zāi)邏輯,或者模塊渲染超過 5s,控制臺(tái)都會(huì)有黃色警報(bào),當(dāng)然此時(shí),也已經(jīng)向服務(wù)器發(fā)送了警報(bào)統(tǒng)計(jì)。
2、接口 Hub
接口 Hub 是對(duì)數(shù)據(jù)請(qǐng)求的管理工具。
頁面很多模塊的渲染都需要一個(gè)以上的數(shù)據(jù)源,一旦運(yùn)營反饋頁面渲染數(shù)據(jù)異常,可以直接通過 Hub 找到數(shù)據(jù),加速 Bug 定位效率。同時(shí) Hub 也可以用來切換環(huán)境,將一個(gè)接口的請(qǐng)求切換到日;蛘哳A(yù)發(fā)環(huán)境的接口之中,它是調(diào)試的利器。
3、快捷通道
我在頁面腳本執(zhí)行前后都放了一個(gè)快捷操作通道,一旦遇到緊急線上問題,比如樣式錯(cuò)亂溢出、接口報(bào)錯(cuò)導(dǎo)致天窗等,可以通過快捷通道直接修改頁面的 CSS 和 JS,兩分鐘內(nèi)上線。
不過這類通道只適合緊急問題的修復(fù),畢竟隨意插入 JS 代碼是存在很大風(fēng)險(xiǎn)的。
【淘寶首頁的基礎(chǔ)知識(shí)】相關(guān)文章:
淘寶店鋪首頁裝修框架的6大技巧09-12
網(wǎng)站首頁被K的四種原因分析07-27
關(guān)鍵詞做到首頁未必有訂單11-03
如何從SEO的角度優(yōu)化網(wǎng)站首頁結(jié)構(gòu)布局08-21
SEO優(yōu)化網(wǎng)站關(guān)鍵詞快速上首頁方法10-22
網(wǎng)站首頁活躍度對(duì)百度收錄的影響09-12
商務(wù)禮儀的基礎(chǔ)知識(shí) 禮儀基礎(chǔ)知識(shí)05-04
zblog asp設(shè)置首頁和分類不顯示置頂文章的方法07-28
帳篷基礎(chǔ)知識(shí)05-13