關於 python middleware ，我們在網路上蒐集到這些相關的討論、資訊與評價

Q: python middleware軟體開發學習資訊分享 在Facebook 的評價

使用 Python 進行 Web ScrapingPart1 腳本爬蟲部分涉及內容：開發環境搭建學習requests 程式庫的使用視覺化爬蟲的緩存文件，圖表顯示資料庫xpath 獲取網頁圖片，批量下載並保存本地使用用戶代理和 ip 代理，防ban工具：sqlalchemy、pygal、sqlite、requests、lxml、jupyterPart2 Scrapy框架：scrapy 互動命令和最基礎爬蟲的使用scrapy 框架流程和函數間回調傳參CrawlSpider 和 Spider 的區別和使用Scrapy 框架的內置管道 Pipeline 學習和使用Scrapy 開發多 web 要求的爬蟲專案瞭解常見反爬措施使用下載器中間件切換 UserAgent 和 ProxyIP學習和使用爬蟲中間件工具：scrapy、shell、spider、pipeline、middlewarehttps://softnshare.com/bulabean-superscrapy-21days/

「python middleware」的推薦目錄：

關於python middleware 在 Kewang 的資訊進化論 Facebook 的最佳貼文
關於python middleware 在 91 敏捷開發之路 Facebook 的精選貼文
關於python middleware 在軟體開發學習資訊分享 Facebook 的最佳解答

關於python middleware 在コバにゃんチャンネル Youtube 的精選貼文
關於python middleware 在大象中醫 Youtube 的最佳貼文
關於python middleware 在大象中醫 Youtube 的最佳貼文

python middleware 在 Kewang 的資訊進化論 Facebook 的最佳貼文

By Kewang 的資訊進化論

2021-01-12 09:47:01 有 44 人按讚

最近 Funliday-旅遊規劃常發一些精選旅遊回憶的 App 通知給使用者，在去年十一二月的時候發通知 Server 還能撐的了瞬時大流量的 request。

但今年開始發這類通知，總共發了三次，三次都造成 Server 被打掛，而且重開 AP 還緩解不了，瞬間手足無措。大概都要等過了十分鐘左右，Server 才將這些 request 消化完。

這裡就來簡單整理一下時間軸，順便分享一下 Funliday 是如何解決這個問題。

---

* 1/6 1900：系統排程發送精選旅遊回憶的 App 通知
* 1/6 1900+10s 開始：Server 收到極大量的 request
* 1/6 1900+20s：Nginx 出現錯誤訊息 1024 worker not enough，並回傳 http status code 503
* 1/6 1900+25s：PostgreSQL 出現錯誤訊息 could not fork new process for connection (cannot allocate memory)
* 1/6 1900+38s：Node.js 收到 PostgreSQL 的 exception。There was an error establishing an SSL connection error
* 1/6 1900+69s：PostgreSQL 出現錯誤訊息 database system is shut down
* 1/6 1900+546s：PostgreSQL 出現錯誤訊息 the database system is starting up

---

看了時間軸就覺得奇怪，先不論 10s 的時候發了極大量 request，造成 20s 在 Nginx 出現 worker not enough 的錯誤訊息。而是要關注 25s 時的 PostgreSQL 出現 could not fork new process for connection 的錯誤訊息。

Funliday 用了同時可承載 n 個 connection 的資料庫，而且程式碼又有加上 connection pool，理論上根本不該出現這個錯誤訊息。但整個時間軸看下來感覺就是 PostgreSQL 的 capacity 問題，造成系統無法運作。

因為就算將 Nginx 的 worker connection size 再加大 10 倍，只是造成 PostgreSQL 要接受的 request 也跟著被加大 10 倍，但 PostgreSQL 那裡因為 request 變多，原本在 69s 直接關機的時間點只會提早，而無法真正緩解這個狀況。

基於以上狀況，小編就開始回去看自己的程式碼是不是哪裡寫錯了。會這樣想也是覺得 PostgreSQL 應該沒這麼弱，一下就被打掛，一定是自己程式碼的問題 Orz

---

這邊來分享一下自己程式碼的寫法，圖一是原始寫法，在每個 API 都 create 一個 db client instance 來處理該 API 層的所有 db request。這是蠻單純的做法，也是 day 1 開始的處理方式。但有個小問題，就是每個 API 層都要自己 create instance，不好管理，且浪費資源。

後來因為想要做 graceful shutdown 的關係，所以調整了一下 db client instance 的建立方式，用 inject 將 instance 綁在 request 上面，如圖二。這樣只要在 middleware 建立 db client instance 就好，好管理，而且只要有 req 就可以取得 instance，非常方便。而這也是 1/6 時的程式碼，就從這裡開始研究吧。

---

直接切入 node-postgres 的文件，認真讀了一下 pool 有下面兩種使用方式：

1. pool.connect, pool.release：文件寫著 checkout, use, and return，光看描述就應該用這個沒錯。
2. pool.query：適用於不需要 pool 的連線方式，文件上也清楚寫著內部實作是直接 call client.query，所以用了這個方式是完全跟 pool 扯不上邊。

但偏偏小編從 day 1 用的就是第 2 種方式 Orz，雖然看起來應該是寫錯，但也是要修改後實測，才知道是不是真的可以解決問題。

---

如圖三，這是修改後的程式碼。想了一下子，覺得目前在 API 層使用 req.pool.query 還不錯，不想用官方的建議做法：先 create client，然後 query 之後，再使用 release。

如果照官方建議做法，API 層的程式碼會多一堆與商業邏輯無關的程式碼，也不好維護。所以在不想動到 API 層的程式碼，只能使用 monkey patch 的方式來達到這個需求。

monkey patch 可以將原方法利用類似 override 的方式，將整個方法改掉，而不改變 caller 的程式碼，這也是 JavaScript, Ruby, Python 這類動態語言的特性之一，但真的要慎用，一不小心就會把原方法改成完全不同意義的方法了。

所以原本應該要在 API 層實作 connect, query, release 一大堆程式碼，可以用 monkey patch 完美解決這一大堆程式碼。

---

在 dev 壓測後至少 capacity 可以達到原本的 4 倍以上，隔天實際上 production 之後也確實如壓測般的數據，可以承載目前的流量。

其實這篇分享的重點只有一點，文件看仔細才是最重要的事啦！如果沒把文件看仔細，然後開發經驗也不足的話，什麼 RCA、monkey patch 都幫不上忙啦！

---

後記：有夠丟臉，其實完全用不到圖三，只要把圖二的 pool creation 放到最外層就好了，因為 pool.query 的內部實作已經有做 connect, query, release 了。

感謝下面的 Mark T. W. Lin 及 Rui An Huang 的幫忙，實在是太搞笑了 Orz

* Pool 的文件：https://node-postgres.com/features/pooling
* 官方建議寫法：https://node-postgres.com/guides/project-structure
* pool.query 的內部實作：https://github.com/brianc/node-postgres/blob/master/packages/pg-pool/index.js#L332

#expressjs #nodejs #javascript #postgresql

Kewang 的資訊進化論

About author

這個粉絲頁會不定期分享小編從每日 RSS 清單所閱讀的心得或是自己的開發心得。

python middleware 在 91 敏捷開發之路 Facebook 的精選貼文

By 91 敏捷開發之路

2020-09-01 23:21:55 有 23 人按讚

最近碰到蠻多朋友或客戶的需求，想要針對 ActionFilter, Decorator, DI 的 service locator，middleware/interceptor 或是其他 static helper 相依的情況寫單元測試，卻總是不順、卡手。（尤其是 service locator)
　
總把測試寫得牛鬼蛇神的，即使看到了綠燈，這測試活超過一個月之後，就人見人厭、爹不親娘不愛的。
　
更甚至總覺得寫測試很花時間，維護起來更花時間。
　
其實這些有一半是產品設計不良，有一半是測試設計不良。
　
（說難聽點，就不是測試的問題，是工程師能力的問題）
　
很多時候，沒見過人家可以怎麼行雲流水地在 legacy code 上整理、抽絲剝繭，一路用工具重構到具備可測試性，再把測試重構到跟人話、規格、需求情境一樣，是很難想像 #原來可以這樣寫Code 的。
　
今年的梯次已滿，明天一月的【#針對遺留代碼加入單元測試的藝術】，只剩下 5 席，live demo 支援 java/kotlin, python, php 與 C#。
　
參考：https://dotblogs.com.tw/hatelove/2020/08/21/Unit-testing-effectively-with-legacy-code-202101
　
會不會到時已經可以支援 node.js 與 Ruby 我也不知道，但基本上一法通、萬法通，概念都一樣。
　
#動態語言其實相對單元測試好寫很多，不寫真的是太浪費了。（寫得醜，更浪費人生）
　
想要觀望晚點才報名的同學，恩....good luck....luck 可能也沒有用，你的問題可能不在寫程式，而是在執行力上。

Tags: python middleware 原來可以這樣寫Code 針對遺留代碼加入單元測試的藝術動態語言其實相對單元測試好寫很多

91 敏捷開發之路

About author

我是 Joey Chen，闖蕩江湖的稱號是 91，熱血點火師，專門燃起大家心裡面的熱情與初衷。目前為 Odd-e Taiwan 的負責人，同時也是 JetBrains 在台灣的培訓夥伴，至今也仍是熱愛學習與享受各種程式語言之美的 programmer。身為敏捷教練，擅長 Agile、Scrum、LeSS 等敏捷文化與協作框架的落實與導入，如何讓大家 being agile 而不是 doing agile。同時喜歡結合各家所長，例如 Lean, Kanban 等，重點是持續改善、解決問題、端出成果，而不執著於某種特定方法論或框架。身為技術教練，我也是極限編程（extreme programming）的狂熱者，我擅長用這些技術與工程實踐來提昇產品的品質、團隊的生產力、降低營運風險，因應市場與公司的商業目標，讓團隊能具有高適應與反應能力的基礎建設。例如實例化需求、ATDD、BDD、TDD、重構、自動化單元測試/整合測試/驗收測試、CI/CD、code review、pair programming、mob-programming 等等。同時，我也是推崇極速開發的 developer，追求從想法到產品程式碼的完成，中間的時間差能趨近於零，也就是劍隨心轉，想到哪，程式碼就長到哪的境界。從想法到實現中間的等待，其實在實務上佔了很大的 context switch 成本，如果能讓這段時間縮到最短，就能比其他人多嘗試更多種解決方案，進而挑選出最剛好的方案。同時也是技術社群的活躍份子，從 2010 年開始連任九屆的微軟 MVP，兼任 MSDN 論壇板主，也曾經獲得年度 MSDN 文件庫刊登數量世界第一的榮耀。對微軟技術有愛，對 C# 有愛，對自動測試有愛，對重構與設計模式有愛。近年來對 Java, PHP, Python 也充滿濃厚的興趣，曾帶領客戶團隊中不會寫程式的 QA ，一起用 Python 完成超過百個 mobile UI 自動化測試。擁有超過十年擔任開發團隊 tech leader, trainer, coach 與 mentor 的經驗，進行的企業內部與公開技術培訓課程已超過 100 場，培訓過的開發人員超過 1000 位，擔任研討會與社群活動的講師次數超過 30 次。同時也是技術書籍的作者與譯者，與朋友合著的書籍包含《ASP.NET MVC 5：網站開發美學》、《ASP.NET MVC 4 網站開發美學》，翻譯的書籍有《單元測試的藝術-第二版》、《敏捷開發實踐》、《進入IT產業必讀的200個 .NET面試決勝題》。如果想跟我即時互動，歡迎直接私訊或 email 至 [email protected]。

請參考：https://tdd.best/about/

python middleware 在軟體開發學習資訊分享 Facebook 的最佳解答

By 軟體開發學習資訊分享

2020-02-03 12:31:00 有 28 人按讚

使用 Python 進行 Web Scraping

Part1 腳本爬蟲部分涉及內容：

開發環境搭建
學習requests 程式庫的使用
視覺化爬蟲的緩存文件，圖表顯示資料庫
xpath 獲取網頁圖片，批量下載並保存本地
使用用戶代理和 ip 代理，防ban
工具：sqlalchemy、pygal、sqlite、requests、lxml、jupyter

Part2 Scrapy框架：

scrapy 互動命令和最基礎爬蟲的使用
scrapy 框架流程和函數間回調傳參
CrawlSpider 和 Spider 的區別和使用
Scrapy 框架的內置管道 Pipeline 學習和使用
Scrapy 開發多 web 要求的爬蟲專案
瞭解常見反爬措施
使用下載器中間件切換 UserAgent 和 ProxyIP
學習和使用爬蟲中間件
工具：scrapy、shell、spider、pipeline、middleware

https://softnshare.com/bulabean-superscrapy-21days/