python2.7爬虫<1>

什么是爬虫

爬虫就是一种生物,爬来爬去的

第一个爬虫

我们第一个爬虫的内容是爬下一个网页的源代码

import urllib2 #导入必要库

response = urllib2.urlopen("http://www.baidu.com") # 打开网址获取源代码
print response.read() #打印源代码

我们这个程序只干了三件事:

  1. 第一行导入的是urllib2

[拓展]:urllib和urllib2有什么区别和联系

  1. 第二行是urllib2提供的一个方法urlopen(),这个方法用来打开url,并返回网站的源代码
  2. 第三行就是将response对象里面的内容打印下来。

python

JavaScript的基本数据结构

使用JavaScript的两种方式

直接使用

  • 在任何可以设置URL的地方都可以使用javascript: + 代码使用。

  • <script>标签内书写代码

javascript

Python中的命令行解析参数工具介绍

首先要知道什么是命令行参数解析

比如,

python ex15.py [<参数1> <参数2> ……]

下面的工具就是负责解析这些参数,以方便程序中使用。

sys.argv

这是我第一个接触到的。


import sys

for arg in sys.argv:

    print arg

可以看出,sys.argv[0],即第一个参数是执行脚本的名字,所以,一般获取参数从 第二位开始,即sys.arg[1:]

这种方法非常简单,实现的功能也很少,如果想让脚本看起来专业点:比如支持长短格式,长格式添加=,帮助信息等完善的参数操作,通过相应的类库可以较快实现

argparse

参考文章:

  1. Argparse简易教程
  2. Python中的命令行解析工具介绍
  3. Python 命令行参数解析

python

Linux环境xampp本地部署wordpress遇到“上传文件ftp验证问题”

在Linux上面搭建了wp,上传主题的时候,告诉我要ftp账号?

喵喵喵?

我用的是xampp,也不知道ftp账号密码

找到配置文件httpd.conf,路径为: /etc/httpd.conf​

打开文件找到这一段

#
# If you wish httpd to run as a different user or group, you must run
# httpd as root initially and it will switch.  
#
# User/Group: The name (or #number) of the user/group to run httpd as.
# It is usually good practice to create a dedicated user and group for
# running httpd, as with most system services.
#
User daemon
Group daemon ​​

User daemon
Group daemon ​​

改成

User 系统用户名(比如我就是hewro)
Group staff

然后重启一下apache服务

然后一切就都顺利了。

wordpress