字符串分析网页源码

时间：2015-03-07 14:00:55 阅读：118 评论：0 收藏：0 [点我收藏+]

标签：

在特殊的情况下，我们不能使用TWebBrowser来进行源码的分析，那么我们怎么从String里提取我们需要的链接和文本呢？以下是我查阅网络上的一些方法。

获取网站链接：(此方法获取的链接不是绝对链接，需要自己写个替换)

procedure TForm1.Button1Click(Sender: TObject);
var
  doc:IHTMLDocument2;
  ln:IHTMLAnchorElement;
  i:integer;
  vHTML : OleVariant;
begin
  doc:=CoHTMLDocument.Create as IHTMLDocument2;
  doc.designMode:=‘ON‘;
  doc.charset:=‘UTF-8‘;
  vHTML := VarArrayCreate([0, 0], varVariant);
  vHTML[0] := strs.text;  //这里strs.text是我事先取得的一个页面的代码
  doc.Write(PSafeArray(TVarData(vHTML).VArray));

  for i:=0 to doc.links.length-1 do begin
    if SUCCEEDED(doc.links.item(i,0).QueryInterface(IHTMLAnchorElement, ln)) then
      memo2.Lines.Add(ln.href);
  end;
  doc.close;
  doc:=nil;
end;

字符串分析网页源码

标签：

原文地址：http://www.cnblogs.com/sishen/p/4320061.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行