Nuovo algoritmo per BlogBabel
24 Luglio 2007
Ieri pomeriggio si è verificato un piccolo terremoto nella classifica di BlogBabel: la spiegazione dei sobbalzi è in questa discussione su Google Groups (entrambe le citazioni sono di Ludo, via Elena):
Che finalmente si è accesa una lampadina, e abbiamo capito che potevamo
escludere i link interni ai network di nanopublishing dal calcolo dei
punteggi.
E abbiamo abbassato il valore di Google Blog Search, che da un mesetto
circa restituisce risultati poco attendibili.
In realtà Google Blog Search e Yahoo sono proprio spariti dai criteri:
Si, li abbiamo tolti. GBS è diventato totalmente inaffidabile, per vari
motivi. E Yahoo! lo è sempre stato. Abbiamo deciso che privilegiavano
troppo i blog commerciali, in maniera anomala, a discapito di tutti gli
altri.
Peraltro sull’affidabilità di Google Blog Search avevo già espresso i miei dubbi in tempi non sospetti 😛
Detto questo, stavo pensando: perché non modificare il valore relativo a FeedBurner e utilizzare, ad esempio, la media in sostituzione del numero giornaliero di lettori?
Da una rapidissima occhiata alle API di FeedBurner mi è parso di capire che la media dei lettori non sia un dato rilevabile. Ammesso che sia così (l’occhiata è stata mooolto rapida), è troppo complesso pensare di calcolare questo valore direttamente su BlogBabel? Invece di aggiornare il numero dei lettori con quello rilevato ogni giorno, in fase di update basterebbe fare la media tra il valore già presente e quello appena recuperato da FeedBurner (senza la necessità di memorizzare ulteriori dati): in questo modo il valore visualizzato in classifica sarebbe meno soggetto a fluttuazioni.
Ad esempio il numero di lettori cala sensibilmente durante il fine settimana e il valore domenicale viene rilevato sulla classifica del lunedì: utilizzando la media dei lettori si riuscirebbe a diminuire l’effetto sulla classifica di questi sbalzi, che nel caso di questo blog sono di circa il 20%.
Come sempre non bisogna essere avari di complimenti verso tutto lo staff di BlogBabel, che si smazza un lavoro mica da ridere 😉
13 commenti/trackback a “Nuovo algoritmo per BlogBabel”
Trackback e pingback
- Quasi.dot » Blogbabel, Feedburner e Google.
[...] leggo dei cambiamenti che sono in corso sulle classifiche di Blogbabel, penso a quanto pesi feedburner, penso al fatto…
Non è possibile inserire nuovi commenti. I commenti vengono disattivati automaticamente dopo 60 giorni.
24 Luglio 2007 alle 10:45
Per quanto riguarda Feedburner hai centrato in pieno: infatti per capire il numero effettivo di lettori sarebbe utile fare quasi una media tra i lettori di oggi e quelli di ieri
Qualcuno scrisse qualcosa in tal merito tempo fa,lo riportai qui trovandomi d’accordo.
24 Luglio 2007 alle 10:56
ho delle perplessità matematiche sulla “media di medie”. Sento che c’è qualche grosso inghippo che mi sfugge al momento. Da un paio di prove su Excel, molto veloci, così facendo i dati sono più “shpalmati” ( 🙂 ) ma non è detto che siano per forza migliori…
24 Luglio 2007 alle 11:10
La media così calcolata non è sicuramente la media corretta: per quella sarebbe necessario memorizzare il numero di giorni per cui il valore viene letto e tutti i valori precedenti (o la somma).
Detto questo, si tratterebbe comunque di un valore molto più stabile e non troppo distante dalla media esatta 😉
24 Luglio 2007 alle 11:47
Basterebbe fare una media degli ultimi 30 valori + media precedente. Sarebbe molto piú accurato della media delle medie.
Peró il problema sta nel fatto che ora ci sono solo piú la metá dei criteri per la classifica, quindi questi criteri hanno una influenza fin troppo varia. Se qualcuno p.es. non usa FeedBurner, questo cambiamento riduce i criteri di classifica a due. Il che rende la classifica molto meno ogettiva, secondo me.
24 Luglio 2007 alle 12:09
strano perchè in realtà feedburner la fa di suo la media…
24 Luglio 2007 alle 12:16
@ramsesoriginal: non sei fortissimo in matematica 😛
I criteri sono 5: Pagerank, Google, Technorati, FeedBurner, Link in ingresso. Se togli FeedBurner, ne restano 4 😉
@capemaster: appunto, ma sembra che non fornisca questo dato tramite API (o quantomeno io non l’ho visto)
24 Luglio 2007 alle 13:09
Si, la media di FB ha senso. Basta (credo, da verificare) chiedere a FB il valore di un periodo invece che di un giorno, e dividere per i giorni. Ad esempio degli ultimi 7 giorni.
La faremo, anche se ho idea che non sposterà di molto la classifica.
24 Luglio 2007 alle 13:20
Se tutti i blog hanno lo stesso tipo di andamento (es. calo nel week-end) effettivamente la classifica non cambia: dal mio punto di vista l’idea è comunque quella di aver un valore più significativo nel numero di lettori di FeedBurner, non stravolgere le posizioni in classifica 😉
24 Luglio 2007 alle 20:27
Ho dato un’occhiata veloce alle API di FeedBurner e ho fatto un paio di prove.
Se hai le statistiche PRO (gratis da quando c’è Google) puoi vedere tramite API le View e i click per ogni item. sono possibili diverse operazioni come richiedere i dati di un determinato giorno o i totali di un determinato elemento.
Questi dati dovrebbero dare un’effettiva immagine degli iscritti al feed che effettivamente leggono il blog.
Il problema è come trattare equamente questi dati…
24 Luglio 2007 alle 20:44
Usando anche quei dati si creerebbe una mole di informazioni difficilmente gestibile (per quanto interessante) 😛
25 Luglio 2007 alle 17:45
Per la media di feedburner basterebbe memorizzare nel database due dati, il totale delle medie giornaliere feedburner (somma di quanto feedburner restituisce ogni giorno) e il numero di rilevazioni. La media poi te la calcoli direttamente sulla pagina o nella query sql.
Per esempio cinque giorni: 12 23 27 12 30 10, avresti sui due campi i valori 114 (12+23+27+12+30+10) e 5, e la media sarebbe 114/5
Niente di rigoroso, ma meglio di quello che c’è ora, e tutto sommato non dovrebbe costare un gran che farlo.
7 Agosto 2007 alle 02:21
Media o no, grazie all’abbandono di GBS (che per ragioni a me ignote mi schifava) ho guadagnato una ventina di posizioni… evvai!
(scusate il commento molto poco serio e professionale) 🙂