From 905c85813a24f02050421df8a7b1bf7ffbf4d987 Mon Sep 17 00:00:00 2001 From: Jacek Kowalski <Jacek@jacekk.info> Date: Sat, 01 Nov 2014 23:52:41 +0000 Subject: [PATCH] [core] Zablokowanie przetwarzania XML External Entities --- data/lotto/pobierz.php | 251 +++++++++++++++++++++++++++----------------------- 1 files changed, 135 insertions(+), 116 deletions(-) diff --git a/data/lotto/pobierz.php b/data/lotto/pobierz.php index 625d9c2..73e7aeb 100644 --- a/data/lotto/pobierz.php +++ b/data/lotto/pobierz.php @@ -3,16 +3,23 @@ class lotto { // Zawartość strony http://lotto.pl/wyniki-gier + // jako obiekt DOMDocument protected $strona = NULL; + // Powiązany DOMXPath + protected $xpath = NULL; + + // Specjalne zachowania dla gier + const NONE = 0; + const PLUS = 1; + const LOTTOPLUS = 2; + const EKSTRA = 3; // Lista gier. protected $gry = array( - // nazwa => array(ilość liczb, plus?) - 'lotto' => array(6, FALSE, 'dl'), - 'mini-lotto' => array(5, FALSE, 'el'), - 'kaskada' => array(12, FALSE, 'ka'), - 'multi-multi' => array(20, TRUE, 'mm'), - 'joker' => array(5, FALSE, 'jk') + // nazwa + 'lotto', 'mini-lotto', + 'kaskada', 'multi-multi', + 'joker', 'ekstra-pensja' ); // Spróbuj pobrać stronę http://lotto.pl/wyniki-gier @@ -43,166 +50,178 @@ } } - // Dane są nieaktualne, więc pobieramy je ponownie + $strona = ''; + $this->strona = new DOMDocument(); + if($cache == '' OR !$recent) { - $this->strona = @file_get_contents('http://lotto.pl/wyniki-gier'); - if(!$this->strona) { + // Dane są nieaktualne, więc pobieramy je ponownie + $strona = @file_get_contents('http://lotto.pl/wyniki-gier'); + if(!$strona) { throw new Exception('Nie udało się pobrać wyników.'); } // Można zapisać do cache'a... if($cache != '') { // ...więc zapamiętujemy arkusz. - file_put_contents($cache, $this->strona); + file_put_contents($cache, $strona); } + + @$this->strona->loadHtml($strona); } else { // Dane w cache są aktualne, więc załaduj je. - $this->strona = file_get_contents($cache); + @$this->strona->loadHtmlFile($cache); } + + $this->xpath = new DOMXPath($this->strona); } - // Znajduje w $gdzie ciągi $od i $do, po czym zwraca - // treść znajdującą się pomiędzy tymi wartościami. - protected function wytnij(&$gdzie, $od, $do, $blad = NULL, &$pozycja = NULL) { - if($blad === NULL) { - $blad = 'Nie znaleziono wymaganego elementu'; - } - - $start = strpos($gdzie, $od, $pozycja); - if($start === FALSE) { + // Znajduje odpowiedni element w pliku HTML lub zwraca błąd. + protected function wytnij($zapytanie, $gdzie = NULL, $blad = 'Brak danych') { + $rezultat = $this->xpath->query($zapytanie, $gdzie); + if(!$rezultat OR $rezultat->length <= 0) { throw new Exception($blad); } - $start += strlen($od); - - $stop = strpos($gdzie, $do, $start); - if($stop === FALSE) { - throw new Exception($blad); - } - - if($pozycja !== NULL) { - $pozycja = $stop + strlen($do); - } - - return trim(substr($gdzie, $start, $stop-$start)); + return $rezultat; } // Zwraca wynik gry (domyślnie lotto). function wynik($gra = 'lotto') { $wyniki = $this->wyniki($gra, 1); + if(!isset($wyniki[0])) { + throw new Exception('Brak wyników dla gry.'); + } return $wyniki[0]; } // Zwraca $liczba ostatnich wyników gry (domyślnie lotto), // jednak nie więcej niż 5 (tyle jest na stronie Totalizatora). - function wyniki($gra = 'lotto', $liczba = 1000) { - if(!isset($this->gry[$gra])) { + function wyniki($gra = 'lotto', $zwroc = 1000) { + if(!in_array($gra, $this->gry)) { throw new Exception('Podana gra liczbowa nie jest obsługiwana.'); } - $wyniki = array(); - $dane = $this->wytnij($this->strona, '<div class="start-wyniki_'.$gra.'">', - '<div class="start-wyniki_', 'Nie znaleziono na stronie wyników dla gry '.$gra); + $rezultaty = array(); - $poz_dane = 0; - for($l = 1; $l <= $liczba; $l++) { - $data = $this->wytnij($dane, '<div class="wyniki_data">', '</div>', - 'Nie znaleziono '.$l.'-ej informacji o losowanu gry '.$gra, $poz_dane); + $dane = $this->wytnij('//div[@class="start-wyniki_'.$gra.'"]', NULL, + 'Nie znaleziono na stronie wyników dla gry '.$gra); + $dane = $dane->item(0); + + + $daty = $this->wytnij('div[contains(concat(" ", @class, " "), " wyniki_data ")]', $dane, + 'Nie znaleziono informacji o losowanu gry '.$gra); + $wyniki = $this->wytnij('div[contains(concat(" ", @class, " "), " glowna_wyniki_'.$gra.' ")]', $dane, + 'Nie znaleziono wyników losowania gry '.$gra); + + $plusy = NULL; + try { + $plusy = $this->wytnij('div[@class="wynik_'.$gra.'_plus"]', $dane); + } catch(Exception $e) {} + + $lottoplusy = NULL; + try { + $lottoplusy = $this->wytnij('//div[@class="glowna_wyniki_'.$gra.'plus"]', $dane); + } catch(Exception $e) {} + + for($l = 0; $l < $daty->length && $l < $wyniki->length && $l < $zwroc; $l++) { + $rezultat = array(); - $pozycja = 0; - $wynik['data'] = $this->wytnij($data, '<strong>', '</strong>', - 'Nie znaleziono '.$l.'-ej daty losowania gry '.$gra, $pozycja); - $wynik['godzina'] = $this->wytnij($data, '<strong>', '</strong>', - 'Nie znaleziono '.$l.'-ej godziny losowania gry '.$gra, $pozycja); + // Znajdź $l-tą datę losowania i jego wynik + $data = $daty->item($l); + $wynik = $wyniki->item($l); try { - $liczby = $this->wytnij($dane, '<div class="glowna_wyniki_'.$gra.'">', "\t".'</div>', - 'Nie znaleziono na stronie '.$l.'-ch wyników dla gry '.$gra, $poz_dane); - } - catch(Exception $e) { + // Znajdź datę i godzinę + $data = $this->wytnij('strong', $data, 'Nie znaleziono '.$l.' daty losowania gry '.$gra); + $rezultat['data'] = trim($data->item(0)->textContent); + if($data->length > 1) { + $rezultat['godzina'] = trim($data->item(1)->textContent); + } + + // Znajdź poszczególne liczby w wyniku + $liczby = $this->wytnij('div[@class="wynik_'.$gra.'"]', $wynik, + 'Nie znaleziono liczb w '.$l.' losowaniu gry '.$gra); + $rezultat['liczby'] = array(); + foreach($liczby as $liczba) { + $rezultat['liczby'][] = trim($liczba->textContent); + } + } catch(Exception $e) { break; } - // Pobierz kolejne liczy zawarte pomiędzy <div class="wynik_NAZWAGRY"> a </div> - $wynik['liczby'] = array(); - $pozycja = 0; - for($i = 0; $i < $this->gry[$gra][0]; $i++) { - $wynik['liczby'][] = $this->wytnij($liczby, '<div class="wynik_'.$gra.'">', - '</div>', NULL, $pozycja); - } + try { + // Szukamy plusa + if($plusy && $plusy->length > $l) { + $rezultat['plus'] = trim($plusy->item($l)->textContent); + } + } catch(Exception $e) {} - // Szukamy plusa - if($this->gry[$gra][1]) { - $wynik['plus'] = $this->wytnij($dane, '<div class="wynik_'.$gra.'_plus">', - '</div>', NULL, $poz_dane); - } + try { + // Szukamy ekstra liczby + $ekstra = $this->wytnij('div[@class="wynik_'.strtr($gra, '-', '_').'"]', $wynik, + 'Nie znaleziono ekstra w '.$l.' losowaniu gry '.$gra); + $rezultat['ekstra'] = trim($ekstra->item(0)->textContent); + } catch(Exception $e) {} - $wyniki[] = $wynik; + try { + // Szukamy lottoplusa + if($lottoplusy && $lottoplusy->length > $l) { + $liczby = $this->wytnij('div[@class="wynik_'.$gra.'plus"]', $lottoplusy->item($l), + 'Nie znaleziono liczb w '.$l.' losowaniu gry '.$gra.'plus'); + $rezultat['plus'] = array(); + foreach($liczby as $liczba) { + $rezultat['plus'][] = trim($liczba->textContent); + } + } + } catch(Exception $e) {} + + $rezultaty[] = $rezultat; } - return $wyniki; + return $rezultaty; + } + + protected $skroty = array( + 'lotto' => 'dl', 'mini-lotto' => 'el', + 'kaskada' => 'ka', 'multi-multi' => 'mm', + 'joker' => 'jk', 'ekstra-pensja' => 'ep' + ); + + function pobierz_jeden($skrot, $wynik) { + $last_data = @file_get_contents('./last_'.$skrot.'.txt'); + if($last_data != $wynik['data']) { + foreach($wynik['liczby'] as $i => $liczba) { + $wynik[$i+1] = $liczba; + } + file_put_contents('./last_'.$skrot.'.txt', $wynik['data']); + file_put_contents('./'.$skrot.'.txt', serialize($wynik)); + file_put_contents('./archiwum/'.$skrot.'_'.date('j.m.Y', strtotime($wynik['data'])).'.txt', serialize($wynik)); + echo OK; + } else { + echo NOT; + } } function pobierz() { - foreach($this->gry as $gra => $data) { + foreach($this->gry as $gra) { echo STAR.'Wyniki gry '.$gra.'...'; if($gra == 'multi-multi') { + echo "\n"; $wyniki = $this->wyniki($gra, 2); - $wynik = $wyniki[0]; - $skrot = $data[2].substr($wynik['godzina'], 0, 2); - $last_data = @file_get_contents('./last_'.$skrot.'.txt'); - if($last_data != $wynik['data']) { - $output = array(); - $output['data'] = $wynik['data']; - for($i = 0; $i < $data[0]; $i++) { - $output[$i+1] = $wynik['liczby'][$i]; + foreach($wyniki as $wynik) { + $godzina = substr($wynik['godzina'], 0, 2); + echo ' '.STAR.'godzina '.$godzina.'...'; + if($godzina == '21') { + $godzina = '22'; } - if($data[1]) { - $output['plus'] = $wynik['plus']; - } - file_put_contents('./last_'.$skrot.'.txt', $output['data']); - file_put_contents('./'.$skrot.'.txt', serialize($output)); - file_put_contents('./archiwum/'.$skrot.'_'.date('j.m.Y', strtotime($output['data'])).'.txt', serialize($output)); + $skrot = $this->skroty[$gra].$godzina; + + $this->pobierz_jeden($skrot, $wynik); } - - $wynik = $wyniki[1]; - $skrot = $data[2].substr($wynik['godzina'], 0, 2); - $last_data = @file_get_contents('./last_'.$skrot.'.txt'); - if($last_data != $wynik['data']) { - $output = array(); - $output['data'] = $wynik['data']; - for($i = 0; $i < $data[0]; $i++) { - $output[$i+1] = $wynik['liczby'][$i]; - } - if($data[1]) { - $output['plus'] = $wynik['plus']; - } - file_put_contents('./last_'.$skrot.'.txt', $output['data']); - file_put_contents('./'.$skrot.'.txt', serialize($output)); - file_put_contents('./archiwum/'.$skrot.'_'.date('j.m.Y', strtotime($output['data'])).'.txt', serialize($output)); - } + } else { + $this->pobierz_jeden($this->skroty[$gra], $this->wynik($gra)); } - else - { - $wynik = $this->wynik($gra); - $skrot = $data[2]; - $last_data = @file_get_contents('./last_'.$skrot.'.txt'); - if($last_data != $wynik['data']) { - $output = array(); - $output['data'] = $wynik['data']; - for($i = 0; $i < $data[0]; $i++) { - $output[$i+1] = $wynik['liczby'][$i]; - } - if($data[1]) { - $output['plus'] = $wynik['plus']; - } - file_put_contents('./last_'.$skrot.'.txt', $output['data']); - file_put_contents('./'.$skrot.'.txt', serialize($output)); - file_put_contents('./archiwum/'.$skrot.'_'.date('j.m.Y', strtotime($output['data'])).'.txt', serialize($output)); - } - } - echo OK; } } } -- Gitblit v1.9.1