pipy国内镜像目前有:
http://pypi.douban.com/ 豆瓣
http://pypi.hustunique.com/ 华中理工大学
http://pypi.sdutlinux.org/ 山东理工大学
http://pypi.mirrors.ustc.edu...
拈花古佛
11年前 (2015-08-02) 14445℃ 0评论
1喜欢
为了能够将爬取到的数据存入本地数据库,现在本地创建一个mysql数据库example,然后
在数据库中建立一张表格douban_db,示例如下:
CREATE TABLE `douban_db` (
`url` varchar(20) NOT NULL,
`direc...
拈花古佛
11年前 (2015-07-25) 14600℃
1喜欢
sqlalchemy是python的一款orm框架
sqlalchemy可以链接mysql,sqlite,sqlserver,oracle等等数据库,基本上现在程序开发人员使用的数据库它都可以链接。
操作系统:Ubuntu 12.04 STL
python版本:2.7.5
首先,...
拈花古佛
11年前 (2015-07-22) 9005℃ 0评论
0喜欢
urllib模块提供的上层接口,使我们可以像读取本地文件一样读取www和ftp上的数据。每当使用这个模块的时候,老是会想起公司产品的客户端,同事用C++下载Web上的图片,那种“痛苦”的表情。我以前翻译过libcurl教程,这是在C/C++环境下比较方便实用的网络操作库,相比起l...
拈花古佛
11年前 (2015-07-22) 8444℃ 0评论
0喜欢
初学 Python 的开发者经常会发现很多 Python 函数中用到了 yield 关键字,然而,带有 yield 的函数执行流程却和普通函数不一样,yield 到底用来做什么,为什么要设计 yield ?本文将由浅入深地讲解 yield 的概念和用法,帮助读者体会 Python...
拈花古佛
11年前 (2015-07-14) 8571℃ 0评论
0喜欢
project
脚本分为不同的 project,不同的 project 之间的任务互相独立,建议为不同的站点建立不同的 project
project 属性
group – 分组标识,暂时仅用于区分
name – 脚本的名字,只允许 a-zA-Z0-9_
status – 任务状...
拈花古佛
11年前 (2015-07-14) 15705℃ 3评论
2喜欢
本文主要用python实现了对网站的模拟登录。通过自己构造post数据来用Python实现登录过程。
当你要模拟登录一个网站时,首先要搞清楚网站的登录处理细节(发了什么样的数据,给谁发等…)。我是通过HTTPfox来抓取http数据包来分析该网站的登录流程。同时,我们...
拈花古佛
11年前 (2015-07-10) 8625℃ 0评论
0喜欢
福利啊福利,本次为大家带来的项目是抓取淘宝MM照片并保存起来,大家有没有很激动呢?
本篇目标
1.抓取淘宝MM的姓名,头像,年龄
2.抓取每一个MM的资料简介以及写真图片
3.把每一个MM的写真图片按照文件夹保存到本地
4.熟悉文件保存的过程
1.URL的格式
在这里我们用到的...
拈花古佛
11年前 (2015-07-09) 8355℃ 0评论
1喜欢
安装
python2.7环境(仅在 Linux 和 OSX 环境下测试通过)
pip install --allow-all-external -r requirements.txt
如果你使用 ubuntu,依赖以下二进制包:
apt-get install python py...
拈花古佛
11年前 (2015-06-24) 15056℃ 0评论
5喜欢
我们在Github上的贡献者和提交者之中检查了用Python语言进行机器学习的开源项目,并挑选出最受欢迎和最活跃的项目。”
图1:在GitHub上用Python语言机器学习的项目,图中颜色所对应的Bob, Iepy, Nilearn, 和NuPIC拥有最高的价值。
1. Sci...
拈花古佛
11年前 (2015-06-24) 8612℃ 0评论
2喜欢