一、對于大流量的網站解決各頁面訪問量統計問題的方法
1、使用日志分析工具
日志分析工具可以記錄每一個用戶訪問網站的請求,并根據相應的日志信息生成報告。這種方法可以幫助網站管理員了解哪些頁面被訪問非常多、哪些頁面被訪問時長最長等關鍵指標。
2、使用計數器
計數器是一種簡單的工具,可以記錄一個頁面被訪問的次數。但是,計數器的數據可能不夠精確,因為有些用戶可能使用不同的設備或者瀏覽器訪問同一個頁面。
3、使用JavaScript代碼
使用JavaScript代碼:通過添加JavaScript代碼到網站上,可以記錄每一次頁面被訪問的信息。這種方法可以識別不同的用戶和設備,并提供更準確的數據統計。
4、使用分布式緩存
使用分布式緩存:當網站流量非常大時,通常需要使用分布式緩存來存儲和處理訪問量數據。這種方法可以提高網站的性能和可擴展性,并且可以支持多個數據源和不同的數據格式。
二、免費開源的網站流量分析統計工具
1、Umami
Umami 是一個簡單易用、自托管的開源(基于 MIT 協議)網站訪問統計分析工具。Umami 不使用 Cookie,不跟蹤用戶,且所有收集的數據都會匿名化處理,符合 GDPR,資源占用很低,雖然功能簡單,但分析的數據內容很豐富,基本的來源國家,來源域名,使用的瀏覽器、系統、設備,訪問的網頁這些都有,還支持多國語言。
2、Shynet
Shynet 是自建的、開源的(基于 Apache-2.0 協議)網站統計分析工具,它在沒有 Cookie 的情況下工作,不會像其它公共統計工具一樣追蹤你的訪客,它只收集足夠有用的數據。同時可以不使用 Javascript 運行,分析腳本十分輕量,不到 1kb。
不過 Shynet 并不適合所有人,它非常適合個人項目和中小型網站,但尚未在高流量網站上進行測試。因此還需要大量的不斷的維護升級,因此如果您需要一鍵式解決方案,較好使用其他工具。
3、Plausible
Plausible Analytics 是一個 100% 開源的(基于 AGPL-3.0 協議)輕量化網站統計分析工具。網站所有者獲得一些可操作的數據來幫助他們學習和改進,同時不會使用 Cookie,沒有跨站點或跨設備跟蹤,也不會收集個人數據,并且完全符合 GDPR、CCPA 和 PECR 等隱私政策。
Plausible Analytics Cloud 默認是收費的版本,采用訂閱制,直接托管在官方的服務器上,不需要自己搭建。但是也可以選擇免費自建方案,自建的版本功能也很完善,只是發布頻率較低,每半年才會整合更新一次。
4、Fathom
Fathom Analytics 是一個更簡單、注重隱私的 Google Analytics 替代方案。Fathom 尊重用戶的隱私,不會收集任何個人身份信息。同時為用戶提供有關網站的所需信息。
Fathom 也有 Lite 和 Pro 版本,Pro 版本和上面的一樣,采用付費訂閱制,不使用 Cookie;而 Lite 版本是免費開源的(基于 MIT 協議),可以自己搭建,但是目前不符合 PECR,因為它使用匿名的 Cookie,同時 Lite 版本相比 Pro 版本,分析的數據很少,只有上圖中的基礎數據,沒有語言、來源位置、設備分析等數據。
5、Ackee
Ackee 是一個關注隱私的開源(基于 MIT 協議)自建分析工具,采用輕量級的 Node.js 和 MongoDB 架構。Ackee 界面簡潔美觀,采用匿名數據采集的方式,分析你網站的流量并在最小的界面中提供有用的統計信息。對于不需要像 Google Analytics 或 Matomo 這樣的全功能營銷分析平臺的個人來說,是一款非常不錯的工具。
三、對于大流量的網站解決訪問量問題的方法
確定當前服務器設備是否滿足流量需求。使用Memcache緩存技術,把動態內容緩存到文件中,動態網頁直接調用這些文件,而不必再訪問數據庫。禁止外部盜鏈,圖片和文件外部盜鏈會給服務器帶來大量的負載壓力,可以通過refer來禁止外部盜鏈,或者使用apache來配置禁止盜鏈。控制大文件的下載,大文件的下載對于非SCSI硬盤來說會占用大量的資源,導致服務器的響應能力下降。使用不同的主機分流主要流量,使服務器均衡負載。使用流量統計軟件統計分析網站流量,可以知道哪些地方耗費了大量的流量,哪些頁面需要再進行優化。延伸閱讀1:大型網站系統的特點
高并發,大流量,需要面對高并發用戶,大流量訪問,Google日均PV數為35億,日均IP訪問數為3億,2011年騰訊QQ最大用戶在線數1.4億,淘寶2012年雙11活動一天交易額191億,活動開始名列前茅分鐘獨立訪問用戶達1000萬。