Il tempo di risposta TR osservato dal cliente vale:
ove TS è il tempo di Servizio (elaborazione), cioè il tempo impiegato dal server per servire una richiesta isolata, TC è il tempo di comunicazione medio e TQ il tempo di accodamento medio.
Con lunghe code di richieste TS può diventare molto minore degli altri fattori, cioè il tempo di risposta diventa molto maggiore del tempo di elaborazione della richiesta.
Un server sequenziale elabora una richiesta per volta ed accoda le altre.
Se N è la lunghezza della code di richieste in attesa, trascurando il tempo di comunicazione, il tempo di risposta medio vale N/2+1 del tempo di elaborazione.
Soluzione:
- limitare la lunghezza della coda
- rifiutare le richieste a coda piena
Per evitare attese, un server sequenziale può servire un traffico di K clienti con R richieste/secondo, se la richiesta ha mediamente un tempo di elaborazione minore di R/K, quindi meglio servizi brevi.