본문 바로가기

C#

[C# html 파싱]GetAttribute와 class

아래코드 적용중 적용이 안되는 사례발견


html 소스를 분석하며 


doc.GetElementsByTagName("div")에도 잘 적용되고

정식 HTML코드(?)가 아니어도 잘 되는것 같지만 


다음과 같이 


<div class = test>


요런식으로 된 코드를 파싱하려고 할때 

GetAttribute에서 class를 인식하지 못하는 것 같다.



해결 : 구글링에서 외국사이트에서 찾음


만약 <div class = test>로 묶여있는 부분의 내용을 파싱하려할때에는


doc.GetElementsByTagName("div")[i].GetAttribute("class").IndexOf("test") 하면 잡아오지 못하고

doc.GetElementsByTagName("div")[i].GetAttribute("className").IndexOf("test") 라고해서 


GetAttribute를 className로 해야한다.

'C#' 카테고리의 다른 글

C# html 파싱(2)  (0) 2011.01.04
C# html 파싱  (0) 2011.01.04