HTTP架構(gòu)師通常使用許多復(fù)雜的機制將多個子模塊組合成一個HTTP服務(wù)器。網(wǎng)站云服務(wù)器。如今,網(wǎng)絡(luò)爬蟲已經(jīng)形成了四種基本模式。如果已經(jīng)編寫了生成動態(tài)內(nèi)容的Python代碼,并且選擇了支持WSGI的API或框架,那么HTTP服務(wù)應(yīng)該如何在線部署?
第一步是運行一個Python編寫的服務(wù)器,一個web爬蟲,在服務(wù)器的代碼中可以直接調(diào)用WSGI接口。最受歡迎的服務(wù)器是綠色獨角獸(Gunicorn),但也有其他純Python服務(wù)器可以在生產(chǎn)環(huán)境中使用。
第二,配置mod_wsgi并運行Apache,在單獨的WSFIDaemonProcess中運行Python代碼,通過mod_wsgi啟動守護進程。
第三步:在后端運行類似Gunicorn的Python HTTP服務(wù)器(或者任何支持所選異步框架的服務(wù)器),然后在前端運行一個既能返回靜態(tài)文件,又能反向代理Python編寫的動態(tài)資源服務(wù)的Web服務(wù)器。
第四步是在前端運行一個純反向代理(比如清漆),反向代理后端運行Apache或者nginx,后端運行Python編寫的HTTP服務(wù)器。這是一個三層架構(gòu)。這些反向代理可以分布在不同的地理位置,以便最靠近客戶端的反向代理上的緩存資源可以返回給發(fā)送請求的客戶端。
長期以來,這四種架構(gòu)的選擇主要是基于CPPython三個運行時的特點,即解釋器占用內(nèi)存大,解釋器運行慢,全局解釋器鎖(GIL)禁止多個線程同時運行Python字節(jié)碼。但同時,內(nèi)存中只能加載一定數(shù)量的Python實例。IPIDEA提供HTTP代理、HTTPS代理、Socks5代理等。住宅代理響應(yīng)迅速,保證了用戶信息的安全。有不懂的請咨詢夢飛服務(wù)器了解。