Pathon攀上小说榜的起点。如何写web代码?
在chrome中使用response来分析其html代码。
1.你可以在chrome中使用response来分析它的html代码。html代码是标记格式的,每个标记成对出现。我们需要抓取小说排行榜的信息,检查html代码,发现标签中的信息就是小说排行榜中的信息。
2.进一步查看每本书的信息,用标签汇总。
3.dat-rid标签表示它在这个网页中属于哪个排名,panclass="rank-tagnoXX "表示这个本身的book-mid-info标签中的XX有标题信息。
4.要捕获的排名帮助和标题信息在上面两个部分。然后通过正则匹配表达式提取每本书的上述两行信息,并重新定义了一个函数get_top_number_and_book_name。
5.因为小说的名字都是中文的,所以需要用\u4e00-\u9fa5,意思是要和这一段的汉字匹配。[\u4e00-\u9fa5]+表示匹配所有中文,小说名称除了中文以外都是英文,还有逗号、冒号等其他特殊形式。
Python是一种计算机编程语言。作为一种叫做ABC的语言的替代品。Python是一种面向对象、直译的计算机编程语言。