- 博客(10)
- 资源 (71)
- 论坛 (3)
- 问答 (2)
- 收藏
- 关注
原创 Python爬虫入门教程 36-100 酷安网全站应用爬虫 scrapy
爬前叨叨2018年就要结束了,还有4天,就要开始写2019年的教程了,没啥感动的,一年就这么过去了,今天要爬取一个网站叫做酷安,是一个应用商店,大家可以尝试从手机APP爬取,不过爬取APP的博客,我打算在50篇博客之后在写,所以现在就放一放啦~~~酷安网站打开首页之后是一个广告页面,点击头部的应用即可页面分析分页地址找到,这样就可以构建全部页面信息我们想要保存的数据找到,用来后续的...
2018-12-27 16:22:02
14074
9
原创 Python爬虫入门教程 35-100 知乎网全站用户爬虫 scrapy
爬前叨叨全站爬虫有时候做起来其实比较容易,因为规则相对容易建立起来,只需要做好反爬就可以了,今天咱们爬取知乎。继续使用scrapy当然对于这个小需求来说,使用scrapy确实用了牛刀,不过毕竟本博客这个系列到这个阶段需要不断使用scrapy进行过度,so,我写了一会就写完了。你第一步找一个爬取种子,算作爬虫入口https://www.zhihu.com/people/zhang-jia-we...
2018-12-19 16:59:25
14268
4
原创 AttributeError: 'module' object has no attribute 'SFrame'
异常记录import graphlabsf = graphlab.SFrame('xxxx.csv')报错AttributeError: 'module' object has no attribute 'SFrame'你应该是使用了下面的一句代码安装了某些内容graphlab.get_dependencies()downloading xz extracting xz解决...
2018-12-18 14:55:54
13906
原创 安装graphlab 报错 No matching distribution found for graphlab-create>=2.1
异常记录在安装graphlab 的过程中,发现如下错误Could not find a version that satisfies the requirement graphlab-create>=2.1 (from GraphLab-Create-License==2.1) (from versions: )No matching distribution found for gr...
2018-12-18 11:59:38
15360
1
原创 Python爬虫入门教程 34-100 掘金网全站用户爬虫 scrapy
爬前叨叨已经编写了33篇爬虫文章了,如果你按着一个个的实现,你的爬虫技术已经入门,从今天开始慢慢的就要写一些有分析价值的数据了,今天我选了一个《掘金网》,我们去爬取一下他的全站用户数据。爬取思路获取全站用户,理论来说从1个用户作为切入点就可以,我们需要爬取用户的关注列表,从关注列表不断的叠加下去。随便打开一个用户的个人中心绿色圆圈里面的都是我们想要采集到的信息。这个用户关注0人?那么你...
2018-12-17 14:29:05
14301
5
原创 Python爬虫入门教程 33-100 《海王》评论数据抓取 scrapy
写在前面海王上映了,然后口碑炸了,对咱来说,多了一个可爬可分析的电影,美哉~摘录一个评论零点场刚看完,温导的电影一直很不错,无论是速7,电锯惊魂还是招魂都很棒。打斗和音效方面没话说非常棒,特别震撼。总之,DC扳回一分( ̄▽ ̄)。比正义联盟好的不止一点半点(我个人感觉)。还有艾梅伯希尔德是真的漂亮,温导选的人都很棒。真的第一次看到这么牛逼的电影 转场特效都吊炸天爬取数据数据爬取...
2018-12-11 10:50:34
14270
10
原创 影评分析第3篇 上映4天,票房7.4亿的《海王》,用数据看大片!
写在前面今天我要蹭个热点,我要用Python加上一些数据分析,来证明《海王》好看。《海王》一部电影带你重温《驯龙高手》《变形金刚》《星球大战》《星河战队》《铁血战士》《安德的游戏》《异形》可能还借鉴了对手的《钢铁侠》与《黑豹》剧情,再稍稍带一点《大鱼海棠》的味道,配上一丢丢温子仁式恐怖片套路,优秀的商业片,应该是DC年度最佳了。温子仁,优秀的集大成者。上映4天,票房7.4亿看评...
2018-12-10 23:11:30
19602
27
原创 影评分析第2篇 《博人传-火影忍者新时代》透过2W条评论看动漫
写在前面日本电视动画《BORUTO -火影新世代》(中国大陆译名《博人传:火影忍者新时代》)改编自岸本齐史原作并监修、池本干雄编绘、小太刀右京编剧的同名漫画,是《火影忍者》系列的续篇,讲述原作故事完结后漩涡鸣人之子漩涡博人的冒险故事。动画的后续剧情将对岸本齐史负责脚本的剧场版《火影忍者剧场版:博人传》作出补充 。动画与前作《火影忍者》《火影忍者疾风传》一样由Studio Pierrot(小丑...
2018-12-10 20:31:45
16899
7
原创 Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy
1. 写在前面今天闲着无聊,抓取一下B站的评论数据,视频动画那么多,也不知道抓取哪个,选了一个博人传跟火影相关的,抓取看看
2018-12-06 20:41:28
14818
6
原创 Python爬虫入门教程 31-100 36氪(36kr)数据抓取 scrapy
1. 写在前面今天抓取一个新闻媒体,36kr的文章内容,也是为后面的数据分析做相应的准备的,预计在12月底,爬虫大概写到50篇案例的时刻,将会迎来一个新的内容,系统的数据分析博文,记得关注哦~36kr 让一部分人先看到未来,而你今天要做的事情确实要抓取它的过去。网址 https://36kr.com/2. 数据分析36kr的页面是一个瀑布流的效果,当你不断的下拉页面的时候,数据从后台...
2018-12-03 20:54:51
14264
3
Python爬虫入门教程 89-100 定个小目标,先用Python爬个一亿B站用户
2020-09-11
Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事.zip
2020-09-16
爬虫代码汇总.zip
2021-02-12
SDL2-2.0.10.zip
2020-07-02
Python爬虫百例第78讲.zip
2020-08-26
爬虫百例第76例子.zip
2020-08-13
pywin32-224.win32-py3.7与pywin32-225.win-amd64-py3.7.exe.zip
2020-08-31
中药材数据、图谱(10000条左右),包含原形态、性味、用法用量、功能主治内容
2020-11-21
梦想橡皮擦的留言板
发表于 2020-01-02 最后回复 2020-01-11
如何在网页中嵌入activeX控件
发表于 2011-07-27 最后回复 2019-11-06
.actionScriptProperties这种格式的文件怎么运行啊
发表于 2011-11-15 最后回复 2012-12-21
每日一问 | 学习 Python 时,你最想解决的问题是?
2020-12-18
说出你心目中的 Python 学习路线吧
2020-12-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝