структуры документа с помощью функций обратного вызова. Более того, в примере 14.6 не делается столько проверок, как в примере 14.3: здесь, например, не проверяется порядок следования дочерних элементов элемента животного. К счастью, существует гораздо более простой способ проверки структуры документа с использованием SАХ2, как вы это увидите в рецептах 14.5 и 14.6.
Рецепты 14.1, 14.4, 14.5 и 14.6.
14.4. Манипулирование документом XML
Требуется представить документ XML в виде объекта С++, чтобы можно было манипулировать его элементами, атрибутами, текстом, DTD, инструкциями обработки и комментариями
Используйте реализованную в Xerces модель W3C DOM. Во-первых, используйте класс xercesc::DOMImplementationRegistry
для получения экземпляра xercesc::DOMImplementation
, затем используйте DOMImplementation
для создания экземпляра парсера xercesc::DOMBuilder
. На следующем шаге зарегистрируйте экземпляр xercesc::DOMErrorHandler
для получения уведомлений об ошибках, обнаруженных в ходе анализа, и вызовите метод парсера parseURI()
, передавая в качестве аргумента URI документа XML или полное имя файла. Если анализ документа завершается успешно, метод parseURI
возвратит указатель на объект DOMDocument
, представляющий документ XML. Затем вы можете использовать функции, определенные в спецификации W3C DOM для просмотра и манипулирования документом.
Обработав документ, вы можете сохранить его в файле, получая DOMWriter
из DOMImplementation
и вызывая его метод writeNode()
с передачей указателя на DOMDocument
в качестве аргумента.
Пример 14.10 показывает, как можно использовать DOM для синтаксического анализа документа
#include <exception>
#include <iostream> // cout
#include <xercesc/dom/DOM.hpp>
#include <xercesc/framework/LocalFileFomatTarget.hpp>
#include <xercesc/sax/SAXException.hpp>
#include <xercesc/util/PlatformUtils.hpp>
#include 'animal.hpp'
#include 'xerces_strings.hpp'
using namespace std;
using namespace xercesc;
/*
* Определить XercesInitializer, как это сделано в примере 14.8
*/
// Утилита RAII, которая освобождает ресурс при выходе из области видимости.
template<typename T>
class DOMPtr {
public:
DOMPtr(T* t) : t_(t) {}
~DOMPtr() { t_->release(); }
T* operator->() const { return t_; }
private:
// запретить копирование и присваивание
DOMPtr(const DOMPtr&);
DOMPtr& operator=(const DOMPtr&);
T* t_;
};
// Сообщает об ошибках, обнаруженных в ходе синтаксического анализа с
// использованием DOMBuilder.
class CircusErrorHandler : public DOMErrorHandler {
public:
bool handleFrror(const DOMError& e) {
std::cout << toNative(e.getMessage()) << '
';
return false;
}
};
// Возвращает значение элемента 'name', дочернего по отношению к элементу
// 'animal'.
const XMLCh* getAnimalName(const DOMElement* animal) {
static XercesString name = fromNative('name');
// Просмотреть дочерние элементы объекта animal
DOMNodeList* children = animal->getChildNodes();
for (size_t i = 0, len = children->getLength(); i < Len; ++i) {
DOMNode* child = children->item(i);
if (child->getNodeType() == DOMNode::ELEMENT_NODE &&
static_cast<DOMElement*>(child)->getTagName() == name) {
// Мы нашли элемент 'name'.
return child->getTextContent();
}
}
return 0;
}
int main() {
try {
// Инициализировать Xerces и получить DOMImplementation;
// указать, что требуется функция загрузки и сохранения (Load and
// Save - LS)
XercesInitializer init;
DOMImplementation* impl =
DOMImplementationRegistry::getDOMImplementation(fromNative('LS').c_str()
);