开发者论坛

 找回密码
 注册 (请使用非IE浏览器)
查看: 5319|回复: 10

[求助] html分析

[复制链接]

0

精华

0

贡献

144

赞扬

帖子
37
软币
625
在线时间
44 小时
注册时间
2014-11-22
发表于 2014-11-22 09:02:03 | 显示全部楼层 |阅读模式
大家,我是一个网虫业余爱好者,全凭兴趣。
目前碰到一个问题,即---从某一网站GET   “html源码”,对其进行分析,先用HtmlElementCollection hc = htmldocument.GetElementsByTagName("a");
再使用html.GetAttribute("href").ToString();可以取出基中的"网址", 但要取中其中的汉字
却卡住了。

html源码的一部分如下
<a href="http://dajia.qq.com/blog/429276092112644" target="_blank" boss="{id:1220, sBiz:'dajia_web', name:'right_list_title', sBak1:'home', sBak2:'_no_login_'}"  ><span class="tj">推荐</span>阿西们涉过愤怒的河流</a>

html.GetAttribute("这里应该填什么才能取出------阿西们涉过愤怒的河流").ToString();
望指点一二为谢!
回复

使用道具 举报

0

精华

0

贡献

0

赞扬

帖子
3
软币
83
在线时间
1 小时
注册时间
2014-11-22
发表于 2014-11-22 21:17:57 | 显示全部楼层
可以考虑用正则表达式匹配试试
回复

使用道具 举报

0

精华

0

贡献

144

赞扬

帖子
37
软币
625
在线时间
44 小时
注册时间
2014-11-22
 楼主| 发表于 2014-11-23 09:39:40 | 显示全部楼层
a790926 发表于 2014-11-22 21:17
可以考虑用正则表达式匹配试试

正是不想用“正则”,太头痛了。
回复

使用道具 举报

0

精华

1

贡献

1

赞扬

帖子
25
软币
208
在线时间
21 小时
注册时间
2014-5-13
QQ
发表于 2014-11-24 11:54:28 | 显示全部楼层
dyyyj 发表于 2014-11-23 09:39
正是不想用“正则”,太头痛了。

用Jquery
回复

使用道具 举报

0

精华

0

贡献

1

赞扬

帖子
9
软币
119
在线时间
14 小时
注册时间
2014-11-24
发表于 2014-11-29 14:03:34 | 显示全部楼层
这里就不能用 GetAttribute了,
见如下代码参考:

[C#] 纯文本查看 复制代码
html.InnerHTML(); 

这句可以取到a标签的内部html,即
[HTML] 纯文本查看 复制代码
<span class="tj">推荐</span>阿西们涉过愤怒的河流



然后再截取字符串,就可以获得你要的字符串了;

评分

参与人数 1赞扬 +1 收起 理由
羽叶 + 1 赞一个

查看全部评分

回复

使用道具 举报

0

精华

0

贡献

0

赞扬

帖子
35
软币
166
在线时间
15 小时
注册时间
2014-11-20
发表于 2014-11-29 15:05:26 | 显示全部楼层
html.text方法直接获取文本。。。。也可以用string的方法
回复

使用道具 举报

0

精华

0

贡献

144

赞扬

帖子
37
软币
625
在线时间
44 小时
注册时间
2014-11-22
 楼主| 发表于 2014-11-30 08:56:24 | 显示全部楼层
xiehun 发表于 2014-11-29 15:05
html.text方法直接获取文本。。。。也可以用string的方法

我上次看的回复到哪里去了?还有人删贴!? 太巩怖了!
回复

使用道具 举报

0

精华

0

贡献

0

赞扬

帖子
35
软币
166
在线时间
15 小时
注册时间
2014-11-20
发表于 2014-12-2 22:22:11 | 显示全部楼层
dyyyj 发表于 2014-11-30 08:56
我上次看的回复到哪里去了?还有人删贴!? 太巩怖了!

什么回复?应该不会乱删了,除非违规了
回复

使用道具 举报

0

精华

0

贡献

144

赞扬

帖子
37
软币
625
在线时间
44 小时
注册时间
2014-11-22
 楼主| 发表于 2014-12-3 14:49:02 | 显示全部楼层
xiehun 发表于 2014-12-2 22:22
什么回复?应该不会乱删了,除非违规了

我上次的回复已经解决了这个问题。可是现在竟然找不着了。
回复

使用道具 举报

0

精华

0

贡献

0

赞扬

帖子
35
软币
166
在线时间
15 小时
注册时间
2014-11-20
发表于 2014-12-4 23:00:58 | 显示全部楼层
可能是回复者不小心删了
回复

使用道具 举报

0

精华

2

贡献

0

赞扬

帖子
15
软币
96
在线时间
2 小时
注册时间
2014-1-21
发表于 2014-12-20 10:16:12 | 显示全部楼层
还是正则吧,亲~
回复

使用道具 举报

Archiver|手机版|小黑屋|开发者网 ( 苏ICP备08004430号-2 )
版权所有:南京韵文教育信息咨询有限公司

GMT+8, 2024-11-1 07:20

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表