Jacek Kowalski
2020-01-28 3d1e543a6771b8c532ae90d06f5094790d7f39f1
parse.php
@@ -1,142 +1,91 @@
<?php
require('vendor/autoload.php');
require('common.php');
require_once(__DIR__.'/vendor/autoload.php');
require_once(__DIR__.'/config.php');
use transit_realtime\FeedMessage;
class IdMapper {
   private $jsonTrips = [];
   private $gtfsTrips = [];
   private $specialNames = [
      'Zjazd do zajezdni',
      'Przejazd techniczny',
      'Wyjazd na trasÄ™',
   ];
   public static function convertTripId($tripId) {
      $tripId = explode('_', $tripId);
      if($tripId[0] != 'block') return;
      if($tripId[2] != 'trip') return;
      return 4096 * (int)$tripId[1] + (int)$tripId[3];
   }
   public function loadJson($file) {
      $json = json_decode(file_get_contents($file));
      foreach($json->vehicles as $vehicle) {
         if(isset($vehicle->isDeleted) && $vehicle->isDeleted) continue;
         if(!isset($vehicle->tripId) || !$vehicle->tripId) continue;
         if(!isset($vehicle->name) || !$vehicle->name) continue;
         if(!isset($vehicle->latitude) || !$vehicle->latitude) continue;
         if(!isset($vehicle->longitude) || !$vehicle->longitude) continue;
         foreach($this->specialNames as $name) {
            if(substr($vehicle->name, -strlen($name)) == $name) {
               continue;
foreach($sources as $name => $source) {
   $logger = new Monolog\Logger('fetch_'.$name);
   try {
      $logger->info('Fetching '.$name.' GTFS position data ...');
      $updated = Fetch::auto($source['gtfsrt'], $source['gtfsrt_file']);
      if(!$updated) {
         $logger->info('Nothing to do, remote file not newer than local one');
         continue;
      }
      $logger->info('Fetching '.$name.' TTSS position data...');
      Fetch::auto($source['ttss'], $source['ttss_file']);
      $logger->info('Loading data...');
      $mapper = new Mapper();
      $mapper->loadTTSS($source['ttss_file']);
      $timeDifference = time() - $mapper->getTTSSDate();
      if(abs($timeDifference) > 120) {
         throw new Exception('TTSS timestamp difference ('.$timeDifference.'s) is too high, aborting!');
      }
      $mapper->loadGTFSRT($source['gtfsrt_file']);
      $timeDifference = time() - $mapper->getGTFSRTDate();
      if(abs($timeDifference) > 120) {
         throw new Exception('GTFSRT timestamp difference ('.$timeDifference.'s) is too high, aborting!');
      }
      $db = new Database($source['database']);
      $logger->info('Finding correct offset...');
      $offset = $mapper->findOffset();
      if(!$offset) {
         throw new Exception('Offset not found');
      }
      $logger->info('Got offset '.$offset.', creating mapping...');
      $mapping = $mapper->mapVehicleIdsUsingOffset($offset);
      $logger->info('Checking the data for correctness...');
      $weight = count($mapping);
      $correct = 0;
      $incorrect = 0;
      $old = 0;
      $maxWeight = 0;
      foreach($mapping as $id => $num) {
         $dbVehicle = $db->getById($id);
         if($dbVehicle) {
            $maxWeight = max($maxWeight, (int)$dbVehicle['weight']);
            if($num === $dbVehicle['num']) {
               $correct += 1;
            } else {
               $incorrect += 1;
            }
         }
         $this->jsonTrips[(int)$vehicle->tripId] = [
            'id' => $vehicle->id,
            'latitude' => (float)$vehicle->latitude / 3600000.0,
            'longitude' => (float)$vehicle->longitude / 3600000.0,
         ];
      }
      ksort($this->jsonTrips);
   }
   public function loadGtfs($file) {
      $data = file_get_contents($file);
      $feed = new FeedMessage();
      $feed->parse($data);
      foreach ($feed->getEntityList() as $entity) {
         $vehiclePosition = $entity->getVehicle();
         $position = $vehiclePosition->getPosition();
         $vehicle = $vehiclePosition->getVehicle();
         $trip = $vehiclePosition->getTrip();
         $tripId = $trip->getTripId();
         $this->gtfsTrips[self::convertTripId($tripId)] = [
            'id' => $entity->getId(),
            'num' => $vehicle->getLicensePlate(),
            'tripId' => $tripId,
            'latitude' => $position->getLatitude(),
            'longitude' => $position->getLongitude(),
         ];
      }
      ksort($this->gtfsTrips);
   }
   public function findOffset() {
      if(count($this->jsonTrips) == 0 || count($this->gtfsTrips) == 0) {
         return NULL;
      }
      $jsonTripIds = array_keys($this->jsonTrips);
      $gtfsTripIds = array_keys($this->gtfsTrips);
      $possibleOffsets = [];
      for($i = 0; $i < count($this->jsonTrips); $i++) {
         for($j = 0; $j < count($this->gtfsTrips); $j++) {
            $possibleOffsets[$jsonTripIds[$i] - $gtfsTripIds[$j]] = TRUE;
         }
      }
      $possibleOffsets = array_keys($possibleOffsets);
      $bestOffset = 0;
      $maxMatched = 0;
      $options = 0;
      foreach($possibleOffsets as $offset) {
         $matched = 0;
         foreach($gtfsTripIds as $tripId) {
            $tripId += $offset;
            if(isset($this->jsonTrips[$tripId])) {
               $matched++;
            }
            continue;
         }
         
         if($matched > $maxMatched) {
            $bestOffset = $offset;
            $maxMatched = $matched;
            $options = 1;
         } elseif($matched == $maxMatched) {
            $options++;
         $dbVehicle = $db->getByNum($num);
         if($dbVehicle && $dbVehicle['id'] !== $id) {
            $old += 1;
         }
      }
      $logger->info('Weight: '.$weight.', correct: '.$correct.', incorrect: '.$incorrect.', old: '.$old);
      if($incorrect > $correct && $maxWeight > $weight) {
         throw new Exception('Ignoring result due to better data already present');
      }
      
      if($options != 1) {
         fwrite(STDERR, 'Found '.$options.' possible mappings!'."\n");
         return FALSE;
      }
      return $bestOffset;
      $output = new Output($db, $mapper, $source['vehicle_types']);
      $logger->info('Saving mapping...');
      $db->addMapping($mapping, $mapper);
      $fullMapping = $output->createMapping($source);
      $logger->info('Creating vehicle list...');
      $output->createVehiclesList($fullMapping, $source);
      $logger->info('Finished');
   } catch(Throwable $e) {
      $logger->error($e->getMessage(), ['exception' => $e, 'exception_string' => (string)$e]);
   }
   public function getMapping($offset) {
      $result = [];
      foreach($this->gtfsTrips as $gtfsTripId => $gtfsTrip) {
         $jsonTripId = $gtfsTripId + $offset;
         if(isset($this->jsonTrips[$jsonTripId])) {
            $data = numToTypeB($gtfsTrip['id']);
            $num = $gtfsTrip['num'];
            if(!is_array($data) || !isset($data['num'])) {
               $data = [
                  'num' => $num,
                  'low' => 2,
               ];
            } elseif($data['num'] != $num) {
               // Ignore due to incorrect depot markings in the data
               //fwrite(STDERR, 'Got '.$num.', database has '.$data['num']."\n");
            }
            $result[$this->jsonTrips[$jsonTripId]['id']] = $data;
         }
      }
      return $result;
   }
}
$mapper = new IdMapper();
$mapper->loadJson('./data/vehicles_A.json');
$mapper->loadGtfs('./data/VehiclePositions_A.pb');
$offset = $mapper->findOffset();
if($offset) {
   echo json_encode($mapper->getMapping($offset));
}