SETI@home grafici e dati
di Ron Hipschman
Titolo originale: "About The SETI@home Screensaver"
Traduzione di Babboia e Bruno Moretti Turri IK2WQA, SETI ITALIA G. Cocconi


Vedi anche i nuovi grafici personalizzabili di BOINC SETI@home

Il salvaschermo di SETI@home è un complesso esempio di software per l'analisi scientifica
che esegue un grande numero di operazioni matematiche sui dati scaricati dal server di Berkeley.
Quello che vedi sullo schermo del tuo computer è un pallido riflesso di quello che succede
dentro al tuo computer.
Il salvaschermo di SETI@home è diviso in quattro sezioni principali:
User Info, Data Info, Data Analisys e Grafica .

User Info = informazioni sull'utente

Questa sezione fornisce informazioni sull'utente che sta analizzando l'unità dati corrente.
E' visualizzato il nome, il numero totale di unità di lavoro (work-unit) che ha completato
e il tempo totale che il computer ha impiegato per analizzare i dati.
Da notare che questo è solo il tempo impiegato dal salvaschermo e non il tempo totale
in cui il computer è rimasto acceso.

Data Info = informazioni sui dati
In questa sezione sono visualizzate le informazioni sulla work-unit che il vostro screensaver
analizza. Queste informazioni sono essenziali perchè ci permettono, nel caso fosse rilevato
un segnale interessante, di ricontrollare lo stesso punto della volta celeste e la parte corretta
dello spettro radio.

Dove sto guardando?
La prima riga di questa sezione specifica le coordinate celesti del punto del cielo dove i dati
sono stati captati. Proprio come latitudine e longitudine descrivono una posizione sulla Terra,
la declinazione e l'Ascensione Retta (sistema equatoriale) le descrivono nella sfera celeste.
I poli celesti nord e sud e l'equatore celeste sono analoghi ai poli ed all'equatore terrestri,
proiettati nello spazio. La declinazione (l'asse y delle nostre mappe stellari) è misurata in
gradi nord (numeri positivi) o sud (numeri negativi) dall'equatore celeste.
L'ascensione retta può essere misurata anche in gradi ma è invece comunemente misurata
in tempo (ore, minuti, secondi).
Da un punto di vista terrestre, il cielo ruota di 15 gradi ogni ora (cioé 360 gradi ogni 24 ore).


Mappa del cielo. Clicca per ingrandire.

Il telescopio di Arecibo può "vedere", essendo fisso, circa 1/3 della volta celeste,
quindi la ricerca di SETI@home è limitata allo spazio tra 0 e 35 gradi di declinazione nord.
Il "campo di vista" del telescopio è largo circa 1/10 di grado e nei 107 secondi durante i quali
sono stati raccolti i dati che rappresentano una "work-unit", scorre su circa 0,6 gradi di cielo.
I dati che state trattando provengono da una porzione rettangolare di cielo alta 1/10 di grado
e larga 6/10 di grado.

Quando?
La seconda riga della sezione "Data Info" indica quando i dati sono stati registrati.
Da notare che l'ora è riferita al GMT (Greenwich Mean Time).
Si tratta dell'ora segnata dall'orologio del Royal Greenwich Observatory in Inghilterra
ad una longitudine di 0 gradi.

Quale telescopio ho usato?
La riga successiva mostra la fonte dei dati (Radio Osservatorio di Arecibo).
Escludendo una catastrofe naturale è improbabile che questo dato possa cambiare.

Quale frequenza sto analizzando?
L'ultima riga contiene la frequenza-base dei dati che state analizzando.
SETI@home osserva una banda dello spettro radio ampia 2,5 MHz.
SETI@home divide questa banda in frazioni di 9.765 Hz ciasuna.
Questo significa che da ogni 107 secondi di registrazione SETI@home
ricava 256 blocchi di dati!
La cifra relativa alla "base frequency" vi dice in che punto, della banda totale di 2,5 MHz,
i vostri 10 kHz sono piazzati.
Tutte queste informazioni vi permettono di identificare in modo univoco la vostra work-unit.

Data Analysis = analisi dei dati
Durante l'analisi dei dati le altre due zone di testo restano fisse mentre questa sezione
è aggiornata dinamicamente da informazioni che saranno di seguito illustrate.
Osservare questo pannello vi aiuterà a capire cosa sta facendo SETI@home.

Cosa sta facendo ORA il salvaschermo?

La prima linea in alto descrive le attività del programma.
Eccone un elenco con una breve spiegazione.

Scanning Result Header File
(Analizzando i risultati precedenti)

Quando il salvaschermo di SETI@home parte (o quando lo lanciate voi manualmente)
recupera i risultati delle precedenti elaborazioni da un file così da riprendere i calcoli
dal punto in cui era stato interrotto.

Connecting To Server (Mi sto connettendo al server)

Il salvaschermo cerca di contattare il server SETI@home.

Receiving Data (Ricevendo dati)

Il server di SETI@home vi sta inviando una work-unit cioè circa 350 KB di dati grezzi
registrati dal telescopio di Arecibo preceduti da una breve intestazione (1 KB) contenente
data ed ora in cui i dati sono stati registrati, la posizione nel cielo, la frequenza base, ecc....
Questo non dovrebbe tenere la vostra connessione a internet aperta per molto tempo
(meno di 4 minuti per un modem 28,8 Kbaud)

Doing Baseline Smoothing (Spianatura della linea di base)

Le work-unit ricevute contengono segnali di vario genere mescolati tra loro.
A noi interessano solo segnali a banda stretta perchè pensiamo che questo tipo di segnali
potrebbero essere usati da una civiltà aliena per comunicare.
D'altro canto segnali a banda larga sono generati perlopiù da eventi astronomici naturali.
Per scartare il noise (rumore di fondo a banda larga) il salvaschermo effettua una sorta
di "media" tra i dati che elimina restituendoci tutti gli altri segnali di banda stretta sopra
(o sotto) a una linea di rilevamento. Inoltre, sopra i 107 secondi il segnale spesso diventa
lentamente più rumoroso e/o più tenue. Baseline smoothing porta tutto allo stesso livello.
Questa è la prima operazione eseguita dopo che avete ricevuto la work-unit ed è eseguita
una volta sola di solito. Certi clients (come quello per Mac) non memorizzano i dati ottenuti
dopo il baseline smoothing nella RAM e devono rieseguirlo ogni volta che il salvaschermo parte.
Una barra indicante il progresso dell'elaborazione mostra a che punto siete.

Computing Fast Fourier Transform (Elaborando la Trasformata rapida di Fourier)

Qui è dove si completa tutto il lavoro.
Un’onda radio non elaborata varia col tempo come una linea su un oscilloscopio
che si muove rapidamente su e giù in risposta alla vostra voce proveniente da un microfono
connesso. In questo caso, il tempo si muove lungo l’asse orizzontale X e l’intensità del segnale
(in questo caso la pressione dell’aria) lungo l’asse verticale Y. Il segnale non elaborato (grezzo)
di un radiotelescopio non ci è particolarmente utile. Ciò che vogliamo scoprire è la presenza
di qualche “tono” costante (e alto) all’interno del segnale.
Preferiamo osservare il grafico con la frequenza lungo l’asse orizzontale X,
e l’intensità lungo l’asse verticale Y.
Ciascun picco in questo grafico rappresenta un segnale forte su una singola frequenza.
Per trasformare un set di dati in funzione del tempo in un set di dati in funzione della frequenza,
applichiamo una relativamente complessa operazione matematica definita
FFT, Fast Fourier Transform, trasformata rapida di Fourier.
Il grande grafico nella parte bassa dello screensaver mostra il risultato dell'elaborazione
dei dati attraverso la FFT. All’inizio della work-unit (unità di lavoro) calcoliamo 15 differenti FFT,
ciascuna delle quali esamina i dati con risoluzione variabile.
Si inizia osservando dettagli della larghezza di 0,07 Hz. Sono necessarie delle compensazioni
con questo tipo di analisi. Se volete essere particolarmente accurati nella frequenza,
è necessario osservare i dati per un tempo maggiore. Per esempio, alla risoluzione della frequenza
di 0,075 Hz, dobbiamo osservare porzioni di dati della lunghezza di 13,42 secondi.
Per analizzare completamente il nostro campione di 107 secondi, dobbiamo
operare 8 di queste FFT. Quando si riduce la risoluzione della frequenza a 0,14 Hz
dobbiamo osservare un campione di dati di soli 6,7 secondi.
Ora abbiamo una minore risoluzione della frequenza ma una maggiore risoluzione del tempo.
Dobbiamo perciò osservarne il doppio (16) (di FFT) per coprire i 107 secondi di dati!
Osserviamo 15 diverse risoluzioni della frequenza
(0,075 - 0,15 - 0,3 - 0,6 - 1,2 - 2,5 - 5 - 10 - 20 - 40 - 75 - 150 - 300 - 600 e 1200 Hz)
nelle nostre analisi. Per ciascun dimezzamento della risoluzione di frequenza
dobbiamo operare il doppio del numero di FFT per coprire i 107 secondi di dati della work-unit.
Il numero di suddivisioni necessarie è impressionante.
Ancora, la barra di progresso che appare a destra mostra a che punto è il vostro computer
nel calcolo della FFT corrente.

Chirping Data (De-accelerazione dei dati)

E' improbabile che un pianeta alieno sia fermo rispetto alla Terra.
Ricorderete che il genere umano vive su un pianeta che ruota su se stesso e che ruota
attorno al Sole, il quale a sua volta sta orbitando attorno al centro della Via Lattea.
Possiamo pensare che i nostri amici extra terrestri siano in una situazione simile alla nostra.
C'è un effetto interessante che questi movimenti causano su un segnale emesso
da una fonte mobile e/o ricevuto da un pianeta mobile. Questo è l'effetto Doppler.
Siete indubbiamente familiari con questo effetto se avete sentito una macchina suonare
il clacson mentre vi passava accanto. La frequenza, o il tono, del suono cambia mentre passa.
Potete uscire e provarlo voi stessi.
Mettetevi ai lati della strada e ascoltate mentre un vostro amico passa suonando il clacson.
E' la velocità relativa che è importante.
Sebbene i nostri remoti amici non suonano il clacson, inviano delle onde (onde elettromagnetiche).
I loro segnali saranno distorti dal moto dei due sistemi allo stesso modo in cui è distorto il suono
del clacson. Per raddrizzare l'onda il salvaschermo di SETI@home analizza i dati molte volte
provando man mano possibili accelerazioni Doppler.
A dire il vero il salvaschermo prima prende i dati grezzi e con un processo matematico
annulla una specifica accelerazione Doppler ("chirp").
Allora alimenta i dati "de-accelerati" risultanti alle procedure di FFT (trasformata rapida di Fourier).
Questo è chiamato "de-chirping" dei dati.
SETI@home cerca di farlo in vari punti tra -50 Hz/sec e +50 Hz/sec. Alla più fine risoluzione
di 0,075 Hz noi controlliamo 5.409 differenti valori di chirp tra -10 Hz/sec e +10 Hz/sec!

Searching for Gaussians (Cercando gaussiane)

Come spiegato nella sezione della FFT, quando la risoluzione della frequenza è più
grossolana la risoluzione del tempo è più fine. Quando la risoluzione del tempo è
abbastanza alta noi possiamo vedere nei dati se i segnali si indeboliscono o se diventano
più forti nei 12 secondi che impiegano a passare nel campo visivo del telescopio.
Questo è un test eccellente per valutare se il segnale è originato da RFI oppure è
qualcosa di più interessante. Un segnale terrestre non diventerebbe più forte e poi
più debole nell'arco di 12 secondi. Con questo controllo di curva si vede se il segnale
diventa più forte e poi più debole in 12 secondi di tempo.
Questo test è applicato solo a risoluzioni di frequenza maggiori o uguali a 0,59 Hz
Poiché stiamo cercando queste gaussiane di 12 secondi i vostri 107 secondi di dati
si sovrappongono al precedente e al seguente blocco di dati di 15 secondi.
In questo modo noi ci assicuriamo di non perdere un segnale importante spaccandolo a metà

Searching for Pulses/Triplets (Cercando impulsi/triplette)

Una nuova caratteristica del client di SETI@home cerca ripetuti impulsi nei segnali radio.
I nostri vicini alieni potrebbero non inviarci un tono uniforme e piacevole per farcelo
riconoscere. Potrebbero trasmettere una serie di ravvicinati o ampi gruppi di impulsi.
Questo è più economico a livello di potenza per il loro trasmettitore se lo stanno facendo
intenzionalmente (e chi lo sa se quello che stanno inviando è non intenzionale!).
Per tutte le risoluzioni di frequenza maggiori o uguali a 0,59 Hz il salvaschermo
effettuerà una ricerca di impulsi ripetuti e una ricerca di triplette di impulsi.

Questo finisce la spiegazione della prima riga del pannello dell'Analisi Dati.
Fiuuu!

Doppler Drift Rate (Tasso di spostamento Doppler)
La seconda linea del pannello dell'Analisi Dati contiene il corrente "Doppler drift rate"
("tasso di spostamento Doppler"), cioè il valore corrente di accelerazione Doppler
usato per l'analisi. I primi test che sono fatti sui dati hanno un tasso di direzione pari
a 0 Hz/sec. Questi segnali non accelerati sono perlopiù generati da RFI.
Tra i -10 Hz/sec e i +10 Hz/sec proviamo tutte le 15 risoluzioni di frequenza e
incrementiamo il tasso della direzione di Doppler di 0,002 Hz/sec tra ogni FFT
e la successiva. Tra +-10 e +-50 noi incrementiamo di 0,296 Hz/sec.

Frequency Resolution (Risoluzione di frequenza)

La seconda linea ci dice inoltre l'attuale risoluzione di frequenza (larghezza di banda,
"bandwidth") che stiamo usando per i nostri calcoli.
Avrete notato che la maggior parte del tempo la passiamo a calcolare le FFT
con una risoluzione di 0,075 Hz. Ogni 4 FFT ne facciamo una con una risoluzione
di 0,14 Hz. Ogni 16 FFT ne facciamo una con risoluzione 0,29 Hz.
Ogni 64 FFT..., beh vi sarete già fatti un'idea.
Ricordate che ci sono 15 diverse risoluzioni di frequenza
(0,075 - 0,15 - 0,3 - 0,6 - 1,2 - 2,5 - 5 - 10 - 20 - 40 - 75 - 150 - 300 - 600 e 1200 Hz).
Noi scartiamo le due più piccole risoluzioni (0,075 Hz e 0,15 Hz) quando il doppler drift rate
è più grande di 10 Hz/sec o più piccolo di -10 Hz/sec.

Analysis Results (Analisi dei risultati)

La prossima parte del pannello dell'Analisi Dati mostra i risultati parziali sulla migliore
gaussiana, sul migliore impulso, sulla migliore tripletta e così via.
Questa parte del pannello si alterna tra i tre, ma solo quando un risultato significativo
è stato trovato. Per esempio se non sono state trovate significative triplette non vedrete le triplette

Best Gaussian (Miglior gaussiana)

Se un segnale è sopra a un livello medio di rumore e inoltre si rinforza e poi si indebolisce
seguendo l'andamento di una curva gaussiana quando l'oggetto passa davanti al telescopio,
noi siamo interessati!
"Power" ci dice quanto è potente il segnale relativamente alla potenza base calcolata
precedentemente. "Fit" ci dice quanto il segnale si avvicina a una gaussiana
(curva a campana) perfetta. "Fit" basso rappresenta un migliore avvicinamento
alla curva ideale (è realmente una misura del chi-quadrato, quanto si allontanano i dati
da una gaussiana ideale). Se vedete un picco potente e un numero "fit" basso non chiamate
i giornalisti, non annunciate al mondo che avete scoperto gli alieni.
Ogni segnale forte, prima che diventi "ufficiale", deve essere verificato (in molti modi)
per eliminare la possibilità che sia dovuto all'interferenza di segnali radio terrestri ((RFI).
Poiché il rumore può simulare a volte una gaussiana abbiamo impostato una soglia
per non essere inondati di risultati ingannevoli.
Se i segnali sono più forti di 3,2 volte il livello medio del rumore (noise) e hanno il miglior
"fit" (inferiore a) 10, il salvaschermo li restituisce al nostro server a Berkeley.
Nel grafico sotto la potenza e il numero di "fit" mostrano l'analisi di comparazione
della curva in tempo reale e inoltre mostra la migliore gaussiana trovata finora nell'analisi
di questa unità di lavoro.
Nota: se il telescopio si sta muovendo nel cielo troppo velocemente o troppo lentamente
durante le osservazioni nessun grafico sarà disegnato.

La linea rossa mostra i dati attuali - la potenza a una data frequenza, visti nel tempo.
Questo aspetto del grafico cambia ogni volta che il processo di ricerca della gaussiana
passa a una nuova frequenza. La linea bianca mostra la gaussiana che si avvicina di più
al nostro segnale, cioè quello che il nostro client sta calcolando in quel momento.
A ogni punto dei dati noi cerchiamo una nuova comparazione.
Voi vedete questo nel cambiamento rapido della linea bianca.
Se l'analisi non avvenisse così rapidamente voi vedreste il picco della gaussiana muoversi
da sinistra a destra mentre cerchiamo di farla combaciare coi vostri dati.

Best Pulse (Miglior impulso)

Per cercare una serie di potenti impulsi ripetuti, il salvaschermo di SETI@home applica
uno speciale test chiamato "fast folding algorithm."
Se il processo trova una serie di impulsi ripetuti, vengono mostrati con le statistiche
che descrivono cosa si è trovato.

"Power" ci dice quanto sono potenti gli impulsi relativamente alla potenza base calcolata
precedentemente. "Period" è la misura di quanto si distanziano nel tempo gli impulsi
in secondi. Poichè le interferenze radio terrestri e il rumore casuale possono simulare
un impulso abbiamo anche qui impostato un valore di soglia per accettare l'impulso.
Questo valore è calcolato dinamicamente e dipende dal periodo e dal numero di volte
che i dati sono stati elaborati.
"Score" è il valore dell'ampiezza rispetto a questo valore soglia.
Un' impulso con score maggiore di uno sarà riportato al server di Berkeley.
Il grafico sotto la potenza, il periodo e lo score visualizza l'analisi degli impulsi mentre
accade e mostra anche il miglior impulso trovato fino a quel momento.
Nota: se non ci sono impulsi significativi il grafico non sarà visualizzato.
Come per le gaussiane sopra, la linea rossa mostra i dati attuali - la potenza a una
data frequenza, visti nel tempo. Diversamente dalle gaussiane questo grafico
probabilmente non coprirà gli interi 107 secondi di dati, ma probabilmente
coprirà due periodi dell'impulso ((due volte "il periodo nella linea sopra il grafico...).
Dovreste vedere due impulsi venir fuori dal rumore.
La parte destra e la parte sinistra del grafico sono le stesse.
Visualizzando due periodi rendiamo più facile la visione degli impulsi.
Per una descrizione più tecnica dell'analisi dei dati fatta da SETI@home
leggete L'indagine del cielo di SETI@home (The SETI@home Sky Survey)

Best Triplet (Miglior tripletta)

Il client di SETI@home esegue un altro test per gli impulsi.
Questo controlla la presenza di tre impulsi alla stessa distanza l'uno dall'altro.
Per far questo il client controlla ogni coppia di impulsi che sono sopra un valore soglia.
Il client poi cerca un impulso nel mezzo degli altri due.
Se viene trovato, viene memorizzato e mandato al server di Berkeley 

Se viene trovata una tripletta, viene visualizzata una linea che mostra la potenza
degli impulsi (relativamente al rumore base) e il tempo tra gli impulsi (periodo) in secondi.
Nota: se non ci sono impulsi significativi il grafico non sarà visualizzato.

Grafica
Nel settore grafico puoi osservare la rappresentazione grafica del calcolo della FFT.
La frequenza è lungo l'asse orizzontale x, la potenza lungo l'asse verticale y
e il tempo lungo l'asse z. Qui puoi notare la differenza tra le fiverse risoluzioni in frequenza
della FFT. Per una risoluzione di 0,075 Hz vedrai che facciamo solamente 8 FFT per coprire
i nostri 107 secondi di dati. Questo è diverso dalla risoluzione di 0,14 Hz dove noi facciamo
16 FFT. Alla risoluzione finale di 1200 Hz, noi troviamo una risoluzione temporale di 0,008192
secondi che anche vogliono dire che noi facciamo un totale di 131.072 FFT solo per questo
singolo grafico!
I colori del grafico non significano niente. Si usano solamente per scopi estetici.
Un significativo segnale extraterrestre non può essere visibile in questo grafico perchè
può essere mascherato da tutto il noise (rumore) naturale.
Quindi, se vedi qualche cosa di strano, non eccitarti eccessivamente,
probabilmente è solo una forte fonte locale, o un satellite che passa su Arecibo.

Torna ad Articoli scientifici

Torna alla home



Copyright © 2009 University of California
Versione Italiana 
Copyright © 2009 Bruno Moretti Turri
I documenti, i grafici e le immagini pubblicati su questo sito sono copyrighted.
Collegamenti (links) a questi documenti sono permessi e incoraggiati.
Nessuna copia può essere fatta senza permesso del webmaster