教程中国
PHOTOSHOP CS9.0中文版 MAYA 8.5 FOR WINDOWS Corel Painter v9.0 Flash MX2004 中文版 Illustrator cs2 中文版
VC++6.0含sp6 中英文版 VB6.0 +sp6 简体中文版 Borland Delphi 7汉化版 MSDN for vb6.0中文版 Visual Studio 2005简体
教程中国下属 文件存储共享专家BIBIDU.COM 提供大型软件,教材,源码,电影,音乐,图书等下载 更多精品请点此进入
  您目前所在位置: 教程中国 >> VB >> 编程实例 >> 跟我用VB来做采集(1) RSS订阅
跟我用VB来做采集(1)
教程(视频,书籍)下载:  ASP.NET AutoCAD 数据库 C# ASP java photoshop 网页设计 delphi 3dmax Flash C++ VB 张孝祥 实例   更多请进入BIBIDU搜索
IT搜索引擎   

首先,我们引用一个Inet控件.这里有朋友要问,为什么用Inet而不用webbrowser,跟朋友们解释一下,用Inet直接读取源文件,而用webbrowser是先在此控件中打开网页,然后我们再去取网页代码,也就是多了一步解释,为了速度,我们就采用了Inet控件.

我们在窗体中加入Inet控件,和三个textbox控件,textbox1为标题,textbox2为简介,textbox3为内容.我比较懒,只是说明,所以就懒得给控件改名了,大家在设计程序时,一定要注意细节.比如textbox1改名为title这样自己看得比较方便.

Private Sub Form_Load()
Dim tempstr As String, astr As String, website As String
website = Inet1.OpenURL("http://news.163.com/06/1229/06/33G7FBBR000120GU.html") '下载此网页
astr = Trim(website) '定义astr内容为网页内容

'首先,我们要取这个网页的新闻标题.打开网页,查看源代码,我们可以发现<h3>至</h3>代码中间,就是我们所需要的新闻标题,而且在整个网页代码中,<h3>是唯一的,相当方便.所以我们开始下面的代码.

tempstr = "<h3>" '定义取值范围开始
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 4) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "</h3>"  '定义结束
pos = InStr(astr, tempstr) '重新获取
Text1.Text = Trim(Left(astr, pos - 1))'好了,我们要得到的新闻标题出来了.

'现在开始要取简介了,不详细讲了,和上面一样的道理.

tempstr = "<ul><li>" '定义取值范围开始
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 8) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "</li></ul>"  '定义结束
pos = InStr(astr, tempstr) '重新获取
Text2.Text = Trim(Left(astr, pos - 1))

'现在开始要取内容了,不详细讲了,和上面一样的道理.

tempstr = "</TBODY></TABLE></CENTER>" '定义取值范围开始"
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 25) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "<a"  '定义结束
pos = InStr(astr, tempstr) '重新获取
Text3.Text = Trim(Left(astr, pos - 1))

End Sub

 

好了,我们采集的第一步,就这么完成了.下节课,我们讲解如何根据ID,循环得到我们要采集的文章页面代码.比如我们从http://xxx.com/info.asp?id=1开始采集,一直采集到id=1000,就是设置一个数值,让其循环,从1至1000.

课程安排:1,初级页面内容获取   2,循环页面内容获取   3,将采集到的内容入库(sql或access)   4,讲解虚拟主机用户如何入库(直接边采集边发表)

来源:教程中国upschool.com.cn
作者:吴龙杰
关键字:vb,采集,教程,中国,网页,入库,sqlserver
发表日期:2006-12-29 22:42:35

网页显示有限 阅读全文请下载本文完整版WORD文档

上一篇:--氢原子电子云模拟显示   下一篇:


本文的相类似文章
  • 跟我用VB来做采集(1)
  • 教你用Photoshop打造动感网页按钮
  • Photoshop教程:美女图片上色教程
  • 教你用Photoshop打造精美的中国结
  • Photoshop中吃光照片的修复教程
  • Photoshop金属木材质感经典教程
  • Photoshop经典美女插画手绘教程
  • Photoshop超强打造精美陶瓷教程
  • PhotoShop制作超酷黄金喜字教程
  • Photoshop经典CG鼠绘教程:《拓》
  • 网友评论 查看本文全部评论
    笔 名: *
    评 论:
    最多500字。当前字数:0
    联系方式:
    验证码:
    在学习中进步 在进步中成长 教程中国相随您的成长之路
    华腾联合科技股份有限公司版权所有
    广告联系:Rosibo@163.com