這一系列文總共有三篇,這是最後一篇。
Funliday 重磅推出新的 prerender 套件 pppr!這是一個 zero config 的 express middleware,只要 npm install pppr,然後在 app.js 裡面加一行 app.use(pppr()) 就可以直接拿來用了。
---
原本在使用 prerender.io 這個套件有時候會出現 504 timeout 的問題,後來發現這個套件用的是比較底層的 API (Chrome DevTools Protocol, CDP),研究它的原始碼後發現 render HTML 的 timeout 判斷上有些怪怪的,本來想試著去改這塊,但對 CDP 不熟,所以用 puppeteer 重寫一套 prerender service,pppr 也就應運而生。
簡單先解釋一下,puppeteer 是基於 CDP 封裝後成為比較容易使用的 API。因為 client side rendering (CSR) 的流行,所以現在要做網路爬蟲的話,愈來愈多會選擇用 puppeteer 來處理。這裡來分享一下在開發 pppr 的時候,有哪些東西要注意的。
1. 把 URL 放到像是 50 人的 LINE 熱門群組,prerender 會遭到大量的 request,因為每個使用者接收到這個訊息之後,因為要顯示 og data,所以就會去打一次 prerender。這裡姑且先稱之為 OG-DDoS 好了 XD,所以一定要做 cache,讓第一個 request 把 HTML 產生出來之後就放到 cache 裡面。然後可以用 LRU cache 來處理,因為這類 URL 都是短時間會被大量使用,之後就很少被用了,用 LRU cache 剛剛好。
1-1. 其實這一段實作還有一些問題,如果在第一個 request 還沒產生出 HTML 之前,第二個同樣 request 就進來了,這樣子 cache 可以說是根本沒作用,還要再找時間來處理 lock 機制才行。
2. 每一個 request 要新開一個 page 才行,如果沒有每個 request 都開新 page 的話,會造成 A request 還沒處理完,B request 就用同一個 page 做 render,這樣子 A request 就會 504 timeout 了。所以一定要記得每個 request 都要新開 page。
3. 因為 headless chrome 的 user agent 就叫做 HeadlessChrome,為了避免在 render 的時候會出現意料外的狀況,保險一點還是把 HeadlessChrome 改成 Chrome 會比較好。
4. 注意 redirect。因為 expressjs 跟 puppeter 是兩個不同的 context,對於 redirection 來說,expressjs 會回傳 3xx 系列的狀態碼,但 puppeteer 則會直接執行完成。所以把 puppeteer 放在 expressjs 裡面執行的話,必須要處理 redirect chain,讓 expressjs 能回給 client 正確的狀態碼才行。
5. pppr 因為是發想自 prerender.io,所以 interface 也一樣是 /render?url=https://example.com。 但有時候原始的 url 後面會包含 query string,所以 expressjs 要用 URLSearchParams 另外做些處理,才能取得完整的 url。
開發 pppr 基本要注意的事項大概就這樣,總之記得給星,有任何問題歡迎發 issue 跟 pr 喔!
#pppr #prerender #funliday
「express timeout」的推薦目錄:
- 關於express timeout 在 Kewang 的資訊進化論 Facebook 的最佳解答
- 關於express timeout 在 TAVAR 台灣虛擬及擴增實境產業協會 Facebook 的精選貼文
- 關於express timeout 在 Express.js Response Timeout - Stack Overflow 的評價
- 關於express timeout 在 What is the default timeout of a req in express? #3330 - GitHub 的評價
- 關於express timeout 在 HAIR.MAKEUP.EXPRESS - Timeout | Facebook 的評價
- 關於express timeout 在 Authentication in Node.js - #9 Session Timeout - YouTube 的評價
express timeout 在 TAVAR 台灣虛擬及擴增實境產業協會 Facebook 的精選貼文
XR Hack Fest / XR 開發者黑客松大賽 #圓滿落幕
由經濟部、文化部以及國發會共同指導,並由DEIPO x XR EXPRESS Taiwan xTAVAR共同主辦的「#第四屆XR開發者黑客松大賽」於上週7/28(日)圓滿落幕。
🎉🎉恭喜 「產業應用開發組」#言行橘、「#星岩發大財」、「#TimeOut」,「內容創意組」#荷蘭船長、#髮際戰線聯盟、#全球動力 奪得今年大賽冠亞季軍,成為本屆 #XR之星 ⭐️🌟⭐️
別忘記~8/28(三) #2019亞太創新科技產業高峰會 的 #跨國新創商機交流會 還有頒獎典禮哦~得獎團隊將於會上發表得獎作品✨✨
今年賽事順利落幕,感謝所有參賽者、觀賽者及工人員們的努力,,XR開發者黑客松大賽,我們明年見 !👋
#上週黑客松的大合照出來啦
#快來找找看自己在哪裡🕵️♀
#XRHackFest2019
#Maythe4thbewithyou
2019 第四屆 XR Hack Fest 黑客松大賽圓滿落幕~~
We'd like to thank our hackers, mentors, volunteers, and sponsors for a successful HackFest!
CONGRATULATIONS HACKFEST 2019 WINNERS!
See you all next year!!
大家明年見!!
#XRHackFest/XR開發者黑客松大賽
#digispace
#XREXPRESSTW
express timeout 在 What is the default timeout of a req in express? #3330 - GitHub 的推薦與評價
Hi @flickz by default, Express sits on top of the built-in Node.js HTTP server. You can find the documentation on the timeout in the Node.js ... ... <看更多>
express timeout 在 HAIR.MAKEUP.EXPRESS - Timeout | Facebook 的推薦與評價
Join. or. Log ... ... <看更多>
express timeout 在 Express.js Response Timeout - Stack Overflow 的推薦與評價
... <看更多>
相關內容