当前位置: 首页>Python>正文

bilibili播放量排行榜,b站每日排行榜爬蟲

bilibili播放量排行榜,b站每日排行榜爬蟲

歡迎關注微信公眾號:Smilecoc的雜貨鋪
回復b站每日排行榜爬蟲獲取全部源碼

爬取B站排行榜前100名的視頻名稱,作者和播放量,用到的主要有request庫獲取網頁信息,用正則解析網頁并使用openpyxl將信息保存在Excel中

bilibili播放量排行榜,第一部分為請求網頁獲取信息部分,request庫的基本用法

def get_html_text(url,self_header):try:response = requests.get(url,headers=self_header,timeout=30)response.raise_for_status()response.encoding = response.apparent_encodingreturn response.textexcept:return ""

第二部分為用正則表達式解析網頁內容并保存到Excel

def re_get_inf(html):list=[]rank_list=re.findall(r'<div class="num">(\d*)</div>',html)#排名title_list=re.findall(r'<div class="info"><a href=[\s\S]*?class="title">([\s\S]*?)</a><!---->',html)#視頻名稱play_num=re.findall(r'<div class="detail"><span class="data-box"><i class="b-icon play"></i>(\d*.\d*)\S</span>',html)#播放量author_list=re.findall(r'<span class="data-box"><i class="b-icon author"></i>([\s\S]*?)</span>',html)#UP主名稱wb=Workbook()#新建保存文件sheet=wb.activesheet.append(['rank','title','playnum','author'])#寫入標題名稱for i in range(len(rank_list)):rank = rank_list[i]title = title_list[i]playnum=play_num[i]author=author_list[i]sheet.append([rank,title,playnum,author])#寫入數據wb.save('bilibili_rankdata.xlsx')#保存文件

完整代碼與注釋,結果文件鏈接:

python爬取b站評論、https://github.com/smilecoc/bilibili_rankdata

個人公眾號:Smilecoc的雜貨鋪,歡迎關注!
在這里插入圖片描述

https://www.nshth.com/python/338564.html
>

相关文章:

  • bilibili播放量排行榜
  • python爬取b站評論
  • b站直播爬蟲
  • 如何爬取b站評論
  • 嗶哩嗶哩日報排行
  • 嗶哩嗶哩爬蟲
  • b站榜單在哪里
  • b站手機up主排行榜在哪
  • 國二python難嗎,python字符串(二)
  • 電腦軟件下載app,在電腦上體驗了 16 款手機 App 后,我很失望
  • elasticsearch中文文檔,Elastic安全分析新利器 —— Event Query Language (EQL) 介紹
  • 數據結構與算法python,[FreeCodeCamp筆記] Python 數據結構和算法1 二分搜索 Binary Search
  • 黑蘋果macOS系統鏡像工具,MacOS Monterey 12.2.1 (21D62) OC 0.7.8 / Cl 5144 / PE 三分區原版黑蘋果鏡像
  • 51單片機畢業設計論文,【畢業設計】基于單片機無線充電的4軸飛行器 -物聯網 嵌入式 stm32
  • 數據庫基礎知識整理,數據庫筆記整理
  • python運行不報錯又無任何結果輸出,linux 正確錯誤輸出_報告錯誤的正確方法
  • 計算機組成原理第六版課后答案,杭電計算機組成原理實驗九R-I,杭電計組實驗9-實現R-I型指令的CPU設計實驗.doc
  • python面向對象,Python零基礎速成班-第10講-Python面向對象編程(下),Property屬性、特殊方法、設計模式、鏈表應用
  • 數據庫視圖是什么,【SpringMVC】SpringMVC模型數據+視圖解析器
  • mp3格式轉換器,FFmpeg支持的音頻和視頻編解碼格式
  • 音樂學校招生要求,學校的音樂樓
  • c語言輸入兩個數輸出較大數,C語言求兩個數的較大值
  • 定義一個函數求三個數的最大值,輸入兩個整數,要求輸出其中值較大者。要求用函數求出最大值
  • MySQL學習 DAY1
  • 一個眼神一個微笑就讓人滿足,看得到的微笑
  • centos7安裝MySQL,centos7下載spark連接mysql數據庫提取數據(pyspark,Scala,python獨立執行)
  • node.js開發,從零開始nodejs系列文章-nodejs到底能干什么
  • python控制軟件自動化,Python實現網站自動登錄---傻瓜教程
  • get all of,resent = msg.get_all('Resent-Date') AttributeError: 'str' object h
  • opencv人體動作識別,torchvision使用keypoint rcnn 進行人體關鍵點定位
  • 深度卷積神經網絡原理與實踐,卷積神經網絡resent網絡實踐
  • 服務器,win服務器系統路由器,Windows server 2012 之路由功能
  • 小青蛙走迷宮的問題
  • 漢諾塔-小青蛙
  • 小青蛙oracle跟蹤,在小青蛙TOAD中用oracle語句寫
  • 音頻頻譜分析儀安卓版,[Android]自定義繪制一個簡易的音頻條形圖,附上對MP3音頻波形數據的采集與展現
  • 連乘符號∏的運算法則,∏這個是什么符號?
  • 用例失敗jenkins卻構建成功,jenkins 構建異常_jenkins構建失敗的原因是什么?