SAX PULL DOCUMENT解析XML總結
一、SAX解析
本文引用地址:http://dyxdggzs.com/article/201609/303742.htm1、繼承DefaultHandler類(lèi),重寫(xiě)startDocument、startElement、character、endElement、endDocument方法,startDocument在讀取時(shí)調用,可寫(xiě)一些實(shí)例化列表等;startElement在讀取每個(gè)標簽時(shí)調用,通過(guò)判斷歷史標簽需要是否為需要獲取的值的頭;characters用來(lái)讀取標簽中的值;endElement讀取標簽的結束,用來(lái)保存characters獲取的值;endDocument一般不做處理。
2、調用,用SAXParser或者XMLReader來(lái)解析
SAXParser解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); saxParse.parse(input, saxForHandler); ListMapString, Object>> userList = saxForHandler.getUser(); |
XMLReader解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService();
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParse = spf.newSAXParser();
// 為xmlReader設置內容處理器
XMLReader reader = saxParse.getXMLReader();
reader.setContentHandler(saxForHandler);
// 開(kāi)始賦值
reader.parse(new InputSource(new StringReader(xml)));
List> userList = saxForHandler.getUser();
在解析時(shí),一定要小心,不要忽略空白的地方,Sax解析器會(huì )把它認為是一個(gè)TextNod
二、PULL解析
與SAX類(lèi)似,同樣有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT
1、實(shí)例化XmlPullParser解析器,設置輸入編碼(setInput),獲得事件類(lèi)型(getEventType),用SAX相同的處理進(jìn)行,next()方法往下繼續讀取
三、DOCUMENT解析
1、實(shí)例化DocumentBuilderFactory,代碼如下:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(input);
Element root = document.getDocumentElement();
2、跟xml傳入的數據結構進(jìn)行處理
3、返回需要的列表值即可
工程下載:ParseTest.rar
四、三者區別
DOM:
解析器讀入整個(gè)文檔,然后構建一個(gè)駐留內存的樹(shù)結構,然后代碼就可以使用 DOM 接口來(lái)操作這個(gè)樹(shù)結構。
優(yōu)點(diǎn):整個(gè)文檔樹(shù)在內存中,便于操作;支持刪除、修改、重新排列等多種功能;
缺點(diǎn):將整個(gè)文檔調入內存(包括無(wú)用的節點(diǎn)),浪費時(shí)間和空間;
使用場(chǎng)合:一旦解析了文檔還需多次訪(fǎng)問(wèn)這些數據;硬件資源充足(內存、CPU)
SAX/PULL:
事件驅動(dòng)。當解析器發(fā)現元素開(kāi)始、元素結束、文本、文檔的開(kāi)始或結束等時(shí),發(fā)送事件,程序員編寫(xiě)響應這些事件的代碼,保存數據。
優(yōu)點(diǎn):不用事先調入整個(gè)文檔,占用資源少
缺點(diǎn):不是持久的;事件過(guò)后,若沒(méi)保存數據,那么數據就丟了;無(wú)狀態(tài)性;從事件中只能得到文本,但不知該文本屬于哪個(gè)元素;
使用場(chǎng)合:只需XML文檔的少量?jì)热?,很少回頭訪(fǎng)問(wèn);一次性讀取;機器內存少;
注意:SAX 解析器不創(chuàng )建任何對象。
評論