用python做一個簡單的游戲,python有什么好玩的書_史上最全的Python書排行榜|你想知道的都在這里
用python做一個簡單的游戲,python有什么好玩的書_史上最全的Python書排行榜|你想知道的都在這里
這是菜鳥學Python的第99篇原創文章
閱讀本文大概需要3分鐘
引用
用python做一個簡單的游戲,學Python這么久了,回首想想自己看過的Python書也不少,到底哪本書最牛,哪本書最火呢,哪個出版社出版的Python最多的,實力最強,這一系列的問題我都想知道.于是我就做了一個全網Python書的排行榜,前面兩篇文章分別從思路和爬蟲的角度去給大家分享,今天我就從數據的角度來給大家排個榜吧
一共1218本Python的書,有國人寫的,也有老外寫的,也有日本人寫的,我把這些書全部存入了SQL數據庫中,下面就給大家分享一下數據分析的結果
0.準備工作
1).數據存入了sqlite db里面,建了一個 books的表格,我把"作者","書名","ISDN","頁數","價格","出版社","出版日期","點評人數","翻譯","鏈接","評分",一共11個維度全部存入表里
python好玩又簡單的代碼,數據庫books表頭是:
HEADERS=['author', 'book', 'isdn', 'page', 'price','pub_company', 'pub_date', 'rating_people','translator', 'url', 'vote_num']
2).建一個class 專門查詢
為了方便,我們把連接數據庫和關閉數據庫都提取到類里面的兩個方法
python爬蟲書籍、連接SQLite3其實還好,但是如果用MySQL的時候,要用connect可能會報錯,所以建議都加異常保護.
查詢的方法我們可以封裝在類里面,這樣清晰簡單些
1.出版社Top10
在1200多本Python書中,到底哪家出版社出版的書最多呢:
python編程游戲?發現出版最多的是"Packt Publishing",然后就是人郵
2.評分最高Top10:
相信很多同學買書的時候,一定會查這本書的評分如何,我這里列出了評分最高的10本書,看看有沒有你心儀的哪本
第一名是"Fluent Python",第二名:"流暢的Python"其實一個是英文版,一個是中文版,看來流暢的Python目前是頭牌
python3自學用什么書、有同學一定不服氣,說我心目中的Python Cookbook, Python核心編程也是很不錯呀,為啥連前10都沒有上榜
好,確實不太公平,如果一本書10人評價,10個人都是給高分,這樣是不是樣本太少了,好我們繼續往下看
3.人氣最高Top15:
為了更公平的評價到底哪一本才是人氣最高的書,我們綜合"點評人數"和"評分"兩個維度去分析,把這兩個數據相乘,Python好書太多了,我取前15名:
原來人氣最高的是"Python基礎教程" 1518個點評,7.9分
我最喜歡的"A byte of Python"排第4
4.出版社哪家Python書最牛:
下面是我寫這個程序的最初的目的,我就想知道哪家出版社的Python書賣的最好,最牛呢(因為有4家出版社陸陸續續跟我聯系過關于出書的事情)。其實要分析也很簡單,把Top10的出版社的出版的書的評分求和,然后求均值再排序就可了
第一名:實力最強的看來是"機械工業出版社"
第二名:人民郵電出版社
第三名:O'Reolly Media
其實第二名和第三名比分很接近了
6.出版Python最多的是哪一年
大家是不是也先想知道,這么多Python書,到底哪一年出版的書最多呢,
從這個數字的背后也反應了Python是從哪一年開始火起來了,不信我們分析一下
我們把數據庫里面的出版日期全部提取出來,然后稍微要進行一下數據清洗,因為日期里面有'September 2007','2007年9月','April 09, 2007','2017-9','2017-8-25',5種雜亂的數據格式,我用正則進行了清洗(插一句正則對數據分析來說非常非常重要,不懂的小伙伴可以看我的歷史文章,有詳細的介紹)
然后把年份過濾提取,在用colleaction里面的Counter進行排序
發現年份最多的是2015年,其次是2016年,正好是Python開始火的時候
[(u'2015', 167), (u'2016', 144), (u'2017', 97)]
7.其他有趣的發現
1).Python書名最長的:174個字符
2).日期最老的Python書:1975年就出版了
3).頁數最多的Python書:有1632頁
4).頁數最少的Python書
書名叫:Good morning,Little Python! 只有12頁
結論:
好,今天的全網分析Python書,結論篇,就講道這里,這個實戰項目算是結束了,后面還有很多好玩的文章要跟大家分享,數據分析是一個非常有趣的話題。這個實戰項目有興趣的小伙伴,也可以自己動手寫一下哦。源碼我會放github上,到時會通知大家,若有什么問題,也歡迎留言討論一下.另外過兩天還有送書的活動,大家敬請期待~~
關注微信公眾號“菜鳥學python”,獲得更多免費電子書和源碼資料