GOOGLE搜索结果页面的抓取

Filed under: 程序开发 |
Posted on

1.获取某关键词的结果页面的HTML代码
2.清除代码中的回车及换行(这个步骤很重要,否则无法采用第三步来获取正确的结果,我就是在这里被卡了很久)
3.正则表达式获取每个URL标题及摘要区域的HTML代码
4.正则表达式分别获取URL,标题及摘要

相关文章

Trackback url : u can trackback from your own site

Leave a Reply