除了從文件加載數據,另一個數據源是互聯網,互聯網每天產生各種不同的數據,可以用各種各樣的方式從互聯網加載數據。
成都創新互聯是一家集網站建設、網站制作、網站頁面設計、網站優化SEO優化為一體的專業的建站公司,已為成都等多地近百家企業提供網站建設服務。追求良好的瀏覽體驗,以探求精品塑造與理念升華,設計最適合用戶的網站頁面。 合作只是第一步,服務才是根本,我們始終堅持講誠信,負責任的原則,為您進行細心、貼心、認真的服務,與眾多客戶在蓬勃發展的市場環境中,互促共生。
一、了解Web API
Web 應用編程接口(API)自動請求網站的特定信息,再對這些信息進行可視化。每次運行,都會獲取最新的數據來生成可視化,因此即便網絡上的數據瞬息萬變,它呈現的信息也都是最新的。
Web API是網站的一部分,用于與使用非常具體的URL請求特定信息的程序交互。這種請求稱為API調用。請求的數據將以易于處理的格式(如JSON或CSV)返回。
GitHub(https://github.com/)上的項目都存儲在倉庫中,后者包含與項目相關聯的一切:代碼、項目參與者的信息、問題或bug報告等,編寫一個自動下載GitHub上的Python項目的相關信息。
在瀏覽器中打開: https://api.github.com/search/repositories?q=language:python&sort=stars,可以看到如下內容,
此調用返回GitHub當前托管了total_count 個Python項目,還有最受歡迎的Python倉庫的信息。
其中第一部分( https://api.github.com/ )將請求發送到GitHub網站中響應API調用的部分;
第二部分( search/repositories )讓API搜索GitHub上的所有倉庫。
repositories 后面的問號指出我們要傳遞一個實參。 q 表示查詢,而等號讓我們能夠開始指定
查詢( q= )。通過使用 language:python ,我們指出只想獲取主要語言為Python的倉庫的信息。
最后一部分( &sort=stars )指定將項目按其獲得的星級進行排序。
但我們不能每次通過打開網頁的形式來獲取數據。但可以通過python中相關庫
二、安裝requests
requests是一個很實用的Python HTTP客戶端庫,專門用于發送HTTP請求,方便編程,編寫爬蟲和測試服務器響應數據時經常會用到,
Requests主要相關參數有:
r.status_code 響應狀態碼
r.heards 響應頭
r.cookies 響應cookies
r.text 響應文本
r. encoding 當前編碼
r. content 以字節形式(二進制)返回
鑒于一直都使用的是anaconda3,可直接打開 anaconda prompt,然后輸入命令:pip install --user requests 安裝即可。
下面來編寫一個程序,執行API調用并處理結果,找出GitHub上星級最高的Python項目,代碼如下:
import requests # 導入模塊requests url='https://api.github.com/search/repositories?q=language:python&sort=stars'#存儲API調用的URL r = requests.get(url) # 調用get()并將URL傳遞給它,響應對象存儲在變量 r中 print("Status code:",r.status_code) #包含一個名為status_code的屬性 response_dict = r.json() # 使用方法json()將這些信息轉換為一個Python字典 print(response_dict.keys()) #打印出字典的key
分享文章:python數據可視化-matplotlib入門(7)-從網絡加載數據及數據可視化的小總結
轉載來源:http://m.kartarina.com/article38/dsogpsp.html
成都網站建設公司_創新互聯,為您提供動態網站、網站維護、Google、定制開發、域名注冊、軟件開發
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯