用Snoopy模拟登录网页并抓取登录后的页面数据

snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务。
下面是一个模拟登录页面并完成登录后的页面数据抓取工作的例子:

<?php
include "Snoopy.class.php";
$snoopy = new Snoopy;
$submit_url = "http://www.a.com/jira/login.jsp"; //form表单 post的地址
$submit_vars["os_username"] = "your username"; //登录的用户名
$submit_vars["os_password"] = "your password"; //登录的秘密
$submit_vars["login"] = "Log In";
$submit_vars["os_destination"] = "/secure/";
$snoopy->submit($submit_url,$submit_vars);
//print $snoopy->results;

// 登录后的任意页面
$snoopy->fetch("http://www.a.com/jira/secure/Dashboard.jspa");
echo $snoopy->results;
?>

执行上述程序,可以看到模拟登录显示出来的页面和我们正常登录的页面一样。

除非注明,本博客文章均为原创,转载请以链接形式标明本文地址

本文地址: http://blog.cnwyhx.com/?p=82

Linux下删除指定时间之前的文件

具体命令如下:


find /data1/xxx/ -type f -mtime +3 -name "*.txt" -exec rm -f {} \;

/data1/xxx/是要删除的文件所在的目录。
+3 是三天前的意思,这里可以修改为自己需要的时间。
*.txt 是要删除的文件,这里寻找的是所有以txt结尾的文件。

除非注明,本博客文章均为原创,转载请以链接形式标明本文地址

本文地址: http://blog.cnwyhx.com/?p=71

重游丽江

去年一部《北京青年》勾起了我许多回忆,在一番准备之后,我踏上了我的重走青春之路。此行的目的地就是《北京青年》里面的外景地之一——丽江。十三年前,曾经年少的我,和三位朋友一起结伴到过彩云之南,雪山之巅。如今算是故地重游。

一到丽江,费了九牛二虎之力才在古城里面找到我住宿的客栈。

DSC_0543

Continue reading

CentOS 5.3 编译内核 增加对8250多串口卡的支持

下载linux-2.6.x.tar.bz2(版本号>=2.6.28)到/usr/src
# wget http://www.kernel.org/pub/linux/kernel/v2.6/linux-2.6.x.tar.bz2
# tar -jxvf linux-2.6.x.tar.bz2
# cd linux-2.6.x
# make mrproper
# make menuconfig
进入General Setup,选中enable deprecated…..(下图中高亮部分),将它编进内核。然后退出保存即可。

Continue reading