아래코드 적용중 적용이 안되는 사례발견
html 소스를 분석하며
doc.GetElementsByTagName("div")에도 잘 적용되고
정식 HTML코드(?)가 아니어도 잘 되는것 같지만
다음과 같이
<div class = test>
요런식으로 된 코드를 파싱하려고 할때
GetAttribute에서 class를 인식하지 못하는 것 같다.
해결 : 구글링에서 외국사이트에서 찾음
만약 <div class = test>로 묶여있는 부분의 내용을 파싱하려할때에는
doc.GetElementsByTagName("div")[i].GetAttribute("class").IndexOf("test") 하면 잡아오지 못하고
doc.GetElementsByTagName("div")[i].GetAttribute("className").IndexOf("test") 라고해서
GetAttribute를 className로 해야한다.
'C#' 카테고리의 다른 글
C# html 파싱(2) (0) | 2011.01.04 |
---|---|
C# html 파싱 (0) | 2011.01.04 |