自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

橡皮擦,一个逗趣的互联网高级网虫

现象级专栏 《Python 爬虫 100 例》作者、《Python OpenCV 365 天取经计划》发起者、《滚雪球学 Python 专栏》原创者,顺带写了一个《无编码学爬虫》的专栏。

  • 博客(10)
  • 资源 (88)
  • 论坛 (3)
  • 问答 (2)
  • 收藏
  • 关注

原创 Python爬虫入门教程 36-100 酷安网全站应用爬虫 scrapy

爬前叨叨2018年就要结束了,还有4天,就要开始写2019年的教程了,没啥感动的,一年就这么过去了,今天要爬取一个网站叫做酷安,是一个应用商店,大家可以尝试从手机APP爬取,不过爬取APP的博客,我打算在50篇博客之后在写,所以现在就放一放啦~~~酷安网站打开首页之后是一个广告页面,点击头部的应用即可页面分析分页地址找到,这样就可以构建全部页面信息我们想要保存的数据找到,用来后续的...

2018-12-27 16:22:02 14360 9

原创 Python爬虫入门教程 35-100 知乎网全站用户爬虫 scrapy

爬前叨叨全站爬虫有时候做起来其实比较容易,因为规则相对容易建立起来,只需要做好反爬就可以了,今天咱们爬取知乎。继续使用scrapy当然对于这个小需求来说,使用scrapy确实用了牛刀,不过毕竟本博客这个系列到这个阶段需要不断使用scrapy进行过度,so,我写了一会就写完了。你第一步找一个爬取种子,算作爬虫入口https://www.zhihu.com/people/zhang-jia-we...

2018-12-19 16:59:25 14862 5

原创 AttributeError: 'module' object has no attribute 'SFrame'

异常记录import graphlabsf = graphlab.SFrame('xxxx.csv')报错AttributeError: 'module' object has no attribute 'SFrame'你应该是使用了下面的一句代码安装了某些内容graphlab.get_dependencies()downloading xz extracting xz解决...

2018-12-18 14:55:54 14072

原创 安装graphlab 报错 No matching distribution found for graphlab-create>=2.1

异常记录在安装graphlab 的过程中,发现如下错误Could not find a version that satisfies the requirement graphlab-create>=2.1 (from GraphLab-Create-License==2.1) (from versions: )No matching distribution found for gr...

2018-12-18 11:59:38 15591 1

原创 Python爬虫入门教程 34-100 掘金网全站用户爬虫 scrapy

爬前叨叨已经编写了33篇爬虫文章了,如果你按着一个个的实现,你的爬虫技术已经入门,从今天开始慢慢的就要写一些有分析价值的数据了,今天我选了一个《掘金网》,我们去爬取一下他的全站用户数据。爬取思路获取全站用户,理论来说从1个用户作为切入点就可以,我们需要爬取用户的关注列表,从关注列表不断的叠加下去。随便打开一个用户的个人中心绿色圆圈里面的都是我们想要采集到的信息。这个用户关注0人?那么你...

2018-12-17 14:29:05 14573 5

原创 Python爬虫入门教程 33-100 《海王》评论数据抓取 scrapy

写在前面海王上映了,然后口碑炸了,对咱来说,多了一个可爬可分析的电影,美哉~摘录一个评论零点场刚看完,温导的电影一直很不错,无论是速7,电锯惊魂还是招魂都很棒。打斗和音效方面没话说非常棒,特别震撼。总之,DC扳回一分( ̄▽ ̄)。比正义联盟好的不止一点半点(我个人感觉)。还有艾梅伯希尔德是真的漂亮,温导选的人都很棒。真的第一次看到这么牛逼的电影 转场特效都吊炸天爬取数据数据爬取...

2018-12-11 10:50:34 14690 12

原创 影评分析第3篇 上映4天,票房7.4亿的《海王》,用数据看大片!

写在前面今天我要蹭个热点,我要用Python加上一些数据分析,来证明《海王》好看。《海王》一部电影带你重温《驯龙高手》《变形金刚》《星球大战》《星河战队》《铁血战士》《安德的游戏》《异形》可能还借鉴了对手的《钢铁侠》与《黑豹》剧情,再稍稍带一点《大鱼海棠》的味道,配上一丢丢温子仁式恐怖片套路,优秀的商业片,应该是DC年度最佳了。温子仁,优秀的集大成者。上映4天,票房7.4亿看评...

2018-12-10 23:11:30 20109 27

原创 影评分析第2篇 《博人传-火影忍者新时代》透过2W条评论看动漫

写在前面日本电视动画《BORUTO -火影新世代》(中国大陆译名《博人传:火影忍者新时代》)改编自岸本齐史原作并监修、池本干雄编绘、小太刀右京编剧的同名漫画,是《火影忍者》系列的续篇,讲述原作故事完结后漩涡鸣人之子漩涡博人的冒险故事。动画的后续剧情将对岸本齐史负责脚本的剧场版《火影忍者剧场版:博人传》作出补充 。动画与前作《火影忍者》《火影忍者疾风传》一样由Studio Pierrot(小丑...

2018-12-10 20:31:45 17149 7

原创 Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy

1. 写在前面今天闲着无聊,抓取一下B站的评论数据,视频动画那么多,也不知道抓取哪个,选了一个博人传跟火影相关的,抓取看看

2018-12-06 20:41:28 15327 6

原创 Python爬虫入门教程 31-100 36氪(36kr)数据抓取 scrapy

1. 写在前面今天抓取一个新闻媒体,36kr的文章内容,也是为后面的数据分析做相应的准备的,预计在12月底,爬虫大概写到50篇案例的时刻,将会迎来一个新的内容,系统的数据分析博文,记得关注哦~36kr 让一部分人先看到未来,而你今天要做的事情确实要抓取它的过去。网址 https://36kr.com/2. 数据分析36kr的页面是一个瀑布流的效果,当你不断的下拉页面的时候,数据从后台...

2018-12-03 20:54:51 14620 3

cosplay8图片压缩包,900 M

cosplay8图片压缩包,900 M

2021-06-16

cosplay8图片压缩2.zip

cosplay8图片压缩2.zip

2021-06-16

需求分析及评审模板

非常好的需求分析及评审模板,我找了很久才找到得

2011-09-13

项目阶段评审表

项目阶段评审表 需求分析文档 需求分析文档 需求分析文档

2011-09-13

2568家小吃加盟店的一丢丢数据,可扩展

https://dream.blog.csdn.net/article/details/118706925

2021-07-16

SDL2-2.0.10.zip

Python PyBoy库用到的资源,具体文章参照 用Python忆童年,最终还真把模拟器跑起来了,https://dream.blog.csdn.net/article/details/107085774

2020-07-02

数据库优化

数据库优化 数据库优化 数据库优化 数据库优化

2011-09-13

绝密,上万素颜照,一键拥有!!!.zip

爬虫采集素材,素颜小照片,https://dream.blog.csdn.net/article/details/118385640

2021-07-02

汉服图片数据,采集过程中产生的预览数据(部分).zip

程序员(媛)不懂汉服?岂能让别人小看,咱先靠肉眼大数据识别万张穿搭照 https://dream.blog.csdn.net/article/details/118541741

2021-07-07

Python爬虫120例之350图图.7z

Python爬虫120例之350图图.7z

2021-05-21

10000+漫展数据,还有10000+.zip

10000+漫展数据,还有10000+.zip

2021-07-05

ASP.NET+开发文档规范

ASP.NET+开发文档规范

2011-09-20

奥特曼识图包,包含60+ 奥特曼大图,男孩子的乐趣

全部奥特曼大图,可提供给孩子学习

2021-06-10

腾讯动漫基础数据.csv

爬虫120例案例数据 https://blog.csdn.net/hihell/category_11079529.html

2021-06-29

7000+动漫封面图.7z

因文件限制,随机选择7000+封面图上传

2021-06-27

613张高清壁纸,爬虫编写过程中爬取数据.zip

613张高清壁纸,爬虫编写过程中爬取数据.zip

2021-06-23

524页动漫静态数据.zip

爬虫爬取过程中的524页静态数据

2021-06-27

10000+部动漫名称,作者,评分

10000+部动漫名称,作者,评分 https://blog.csdn.net/hihell/article/details/118222271

2021-06-27

中药材数据、图谱(10000条左右),包含原形态、性味、用法用量、功能主治内容

中药材数据、图谱(10000条左右),包含原形态、性味、用法用量、功能主治内容。数据格式为 JSON,可解析之后用于多项目用途。中药材数据,中药材数据,收录了药材的性味归经、功能主治等详细信息。

2020-11-21

3190张手机壁纸,爬虫程序编写过程中,爬取资源.zip

5000张高清壁纸大图(手机用),用Python在法律的边缘又试探了一把

2021-06-23

10000条热门评论(2014年_2020年) ).rar

10000 条网络评论资源,excel 格式。采集自 2020 年 11 月份,可用于数据分析。适用于各种编程语言。

2021-06-25

《可爱图片网》3000张图片.zip

《可爱图片网》3000+图片,爬虫120例素材图

2021-06-21

Python爬虫120例之1776图图.7z

Python爬虫120例之1776图图.7z

2021-05-21

爬虫代码汇总.zip

https://dream.blog.csdn.net/article/details/113787642 博客涉及的爬虫代码,嘿嘿,喜欢又不想编写的,可以付个1.9元,如果想要白嫖,那必须添加橡皮擦wechat去索取了, moshanba

2021-02-12

CSS3颜色表单,我珍藏的给大家了

CSS3颜色表单,我珍藏的给大家了,你绝对想要的

2011-09-09

JavaScript学习书籍PDF格式

JavaScript学习书籍PDF格式 扫面格式的 还可以 主要希望大家学习一下里面的例子

2010-09-03

2000+多肉图,让你直接变身多肉小达人

都是多肉,很多植物了,爬虫程序顺手下载的

2021-06-15

需求与设计评审

需求与设计评审,需求与设计评审 需求与设计评审

2011-09-13

Python爬虫入门教程 89-100 定个小目标,先用Python爬个一亿B站用户

Python爬虫入门教程 89-100 定个小目标,先用Python爬个一亿B站用户 参照链接 https://dream.blog.csdn.net/article/details/108513271

2020-09-11

Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事.zip

Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事 Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事

2020-09-16

爬虫卡死问题解决.zip

爬虫百例第68案例素材,可以直接下载运行,主要是解决了tkiner页面卡死的问题

2017-07-21

C#的简单打地鼠游戏 简单代码

一个C#的小游戏 ,大家下来参考一下 里面的老鼠 改成地雷了 这不影响游戏 ,我希望给大家 一点点参考 大家喜欢 就一起研究一下了

2010-04-26

Python爬虫百例第78讲.zip

Python爬虫百例第78讲.zip,详细网址参考https://dream.blog.csdn.net/article/details/108225659

2020-08-26

需求管理-需求分析文档

需求管理 需求分析文档

2011-09-13

爬虫百例第76例子.zip

对于分布式爬虫学习来说,或者对于技术学习来说,没有捷径,两条路可以走,第一自己反复练习,孰能生巧;第二看别人分享的代码反复学习别人的写法,直到自己做到。 今天继续通过`celery`实现分布式爬虫爬取`https://book.douban.com/tag/?view=type&icn=index-sorttags-all` 简单回忆下上篇博客涉及celery相关的知识点,celery官方定义为分布式任务队列,核心就是通过队列来实现跨线程或者跨终端进行作业分发。 队列的输入是一个作业单元,被称为`task`,我们只需要在定义好的函数上方,增加`@app.task` 装饰一下即可,查阅手册可以查看其它参数内容。 定义好task之后,执行`worker` 监控这个队列,有新作业即执行。

2020-08-13

pywin32-224.win32-py3.7与pywin32-225.win-amd64-py3.7.exe.zip

pywin32-224.win32-py3.7与pywin32-225.win-amd64-py3.7.exe.zip

2020-08-31

curl-7.64.1.zip

Python爬虫入门教程 82-100 在windows搭建scrapyd跑scrapy爬虫 应用资源

2020-08-31

SQl常用语句汇总(PDF格式的)

我收藏的 一本SQL常用语句,个人觉得还可以

2010-08-26

需求跟踪、评审、配置管理.

需求跟踪、评审、配置管理.需求跟踪、评审、配置管理.

2011-09-13

数据结构 (C#语言版)

数据结构 (C#语言版) 主要就是讲解数据结构 的一本C#书籍 希望大家学习到自己的东西

2010-09-03

梦想橡皮擦的留言板

发表于 2020-01-02 最后回复 2020-01-11

如何在网页中嵌入activeX控件

发表于 2011-07-27 最后回复 2019-11-06

.actionScriptProperties这种格式的文件怎么运行啊

发表于 2011-11-15 最后回复 2012-12-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除