|
(PHP 3>= 3.0.8, PHP 4) xml_parse_into_struct - разбирает XML-данные в структуру массива. Описаниеint xml_parse_into_struct (resource parser, string data, array &values, array &index)
Эта функция разбирает XML-файл на две параллельные структуры: одна из которых (index) содержит указатели на местонахождение соответствующих значений в массиве
values array. Последние два параметра обязаны передаваться по ссылке.
Пример иллюстрирует внутреннюю структуру сгенерированных массивов. Мы используем простой тэг
note, встроенный в тэг para, а затем разбираем это и выводим сгенерированные структуры:
$simple = "<para><note>simple note</note></para>";
$p = xml_parser_create();
xml_parse_into_struct($p,$simple,$vals,$index);
xml_parser_free($p);
echo "Index array\n";
print_r($index);
echo "\nVals array\n";
print_r($vals); |
На выводе будет:
Index array
Array
(
[PARA] => Array
(
[0] => 0
[1] => 2
)
[NOTE] => Array
(
[0] => 1
)
)
Vals array
Array
(
[0] => Array
(
[tag] => PARA
[type] => open
[level] => 1
)
[1] => Array
(
[tag] => NOTE
[type] => complete
[level] => 2
[value] => simple note
)
[2] => Array
(
[tag] => PARA
[type] => close
[level] => 1
)
) |
Разбор на основе событий (на основе библиотеки expat) может усложниться, если у вас сложный XML-документ.
Эта функция не производит объект в стиле DOM, а генерирует структуры,
отвечающие за то, чтобы быть пересечёнными в манере дерева. Таким образом, мы
может легко создавать объекты, представляющие данные в XML-файле. Рассмотрим
следующий XML-файл, представляющий собой небольшую БД с информацией об аминокислотах:
Пример 1. moldb.xml - небольшая БД с молекулярной информацией
<?xml version="1.0"?>
<moldb>
<molecule>
<name>Alanine</name>
<symbol>ala</symbol>
<code>A</code>
<type>hydrophobic</type>
</molecule>
<molecule>
<name>Lysine</name>
<symbol>lys</symbol>
<code>K</code>
<type>charged</type>
</molecule>
</moldb> |
|
и небольшой код для разбора документа и генерации соответствующих объектов:
Пример 2.
parsemoldb.htm - разбирает moldb.xml на массив молекулярных объектов
<?php
class AminoAcid {
var $name; // имя aa
var $symbol; // трёхбуквенный символ
var $code; // однобуквенный код
var $type; // hydrophobic, charged или neutral
function AminoAcid ($aa) {
foreach ($aa as $k=>$v)
$this->$k = $aa[$k];
}
}
function readDatabase($filename) {
// читать xml БД аминокислот
$data = implode("",file($filename));
$parser = xml_parser_create();
xml_parser_set_option($parser,XML_OPTION_CASE_FOLDING,0);
xml_parser_set_option($parser,XML_OPTION_SKIP_WHITE,1);
xml_parse_into_struct($parser,$data,$values,$tags);
xml_parser_free($parser);
// цикл по этим структурам
foreach ($tags as $key=>$val) {
if ($key == "molecule") {
$molranges = $val;
// каждая пара вхождений массива это нижняя и верхняя
// границы диапазона для определения каждой молекулы
for ($i=0; $i < count($molranges); $i+=2) {
$offset = $molranges[$i] + 1;
$len = $molranges[$i + 1] - $offset;
$tdb[] = parseMol(array_slice($values, $offset, $len));
}
} else {
continue;
}
}
return $tdb;
}
function parseMol($mvalues) {
for ($i=0; $i < count($mvalues); $i++)
$mol[$mvalues[$i]["tag"]] = $mvalues[$i]["value"];
return new AminoAcid($mol);
}
$db = readDatabase("moldb.xml");
echo "** Database of AminoAcid objects:\n";
print_r($db);
?> |
|
После выполнения parsemoldb.htm переменная $db содержит массив
AminoAcid-объектов, и вывод скрипта подтверждает это:
** Database of AminoAcid objects:
Array
(
[0] => aminoacid Object
(
[name] => Alanine
[symbol] => ala
[code] => A
[type] => hydrophobic
)
[1] => aminoacid Object
(
[name] => Lysine
[symbol] => lys
[code] => K
[type] => charged
)
) |
| |