码迷,mamicode.com
首页 > Web开发 > 详细

字符串分析网页源码

时间:2015-03-07 14:00:55      阅读:118      评论:0      收藏:0      [点我收藏+]

标签:

在特殊的情况下,我们不能使用TWebBrowser来进行源码的分析,那么我们怎么从String里提取我们需要的链接和文本呢?以下是我查阅网络上的一些方法。

获取网站链接:(此方法获取的链接不是绝对链接,需要自己写个替换)

procedure TForm1.Button1Click(Sender: TObject);
var
  doc:IHTMLDocument2;
  ln:IHTMLAnchorElement;
  i:integer;
  vHTML : OleVariant;
begin
  doc:=CoHTMLDocument.Create as IHTMLDocument2;
  doc.designMode:=ON;
  doc.charset:=UTF-8;
  vHTML := VarArrayCreate([0, 0], varVariant);
  vHTML[0] := strs.text;  //这里strs.text是我事先取得的一个页面的代码
  doc.Write(PSafeArray(TVarData(vHTML).VArray));

  for i:=0 to doc.links.length-1 do begin
    if SUCCEEDED(doc.links.item(i,0).QueryInterface(IHTMLAnchorElement, ln)) then
      memo2.Lines.Add(ln.href);
  end;
  doc.close;
  doc:=nil;
end;

 

字符串分析网页源码

标签:

原文地址:http://www.cnblogs.com/sishen/p/4320061.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!