Il feed RSS di Google News / il mashup di Google Reader

Il mio attuale datore di lavoro è una società di ricerca esecutiva che recluta candidati per i settori dello sviluppo immobiliare e delle costruzioni. Conduco i loro sforzi di marketing su Internet; Mi occupo anche di ricerche di mercato. Se posso fornire informazioni sul settore competitivo ai reclutatori nel nostro ufficio, possono utilizzarle per abbinare i candidati al lavoro dirigenziale con i datori di lavoro che ne hanno bisogno ma non riescono a trovarli da soli.

La sfida

Ci sono un gran numero di aziende degne di essere monitorate dalla mia azienda. ENR (Engineering News & Record) crea diversi autorevoli elenchi tematici contenenti i nomi delle più grandi imprese di costruzioni commerciali. Builder Online elenca le più grandi imprese di costruzione di case residenziali. Tra queste due fonti, ho identificato circa 1.700 aziende in cui sarebbe prezioso tenere traccia di ogni notizia su di loro. Fortunatamente, in un dato giorno, solo una piccola percentuale di queste aziende farà notizia degna di nota… tuttavia, per essere sicuro di catturare tutte le informazioni preziose, devo monitorarle tutte.

Più logicamente, dovrei implementare una sorta di soluzione RSS per tracciare 1.700 aziende. L’inserimento manuale di 1.700 feed in un feedreader non è un’opzione; Non ho alcuna capacità di programmazione; e non ho un budget per trovare qualcuno che programmi una soluzione.

Allora cosa ho fatto?

La soluzione: parte 1

Quando ho esaminato un tipico URL RSS di Google News, posso determinare che l’unica informazione variabile all’interno di ciascun URL lungo è il termine cercato:

http://news.google.com/news?sourceid=navclient&ie=UTF-8&rls=GGLJ,GGLJ:2006-37,GGLJ:it&oe=UTF-8&tab=wn&q=builder+magazine&output=rss

Da queste informazioni, posso riprodurre in modo rapido e semplice un URL RSS di Google News per ogni elemento del mio elenco in modo rapido e semplice in Excel.

Quindi faccio quanto segue (che è illustrato più chiaramente nel foglio di calcolo allegato che ti consiglio vivamente di scaricare facendo clic su questo link):

1) Una volta aperto Excel, inserisco il mio intero elenco di aziende rilevanti nella colonna B.

2) Nella Colonna A, inserisco la prima parte dell’URL RSS di Google (da http:// fino alla parte variabile).

3) Nella colonna C, inserisco la parte finale dell’URL (&output=rss).

4) So anche per esperienza che per rendere il mio feed il più pertinente possibile, voglio utilizzare la corrispondenza esatta ovunque sia possibile. “%22” è il simbolo utilizzato per “virgolette”. Aggiungo “%22” come ultimi caratteri nella colonna A e i primi caratteri nella colonna C.

5) Mi assicuro che il codice nelle colonne A e C sia copiato su ogni riga contenente un’azienda rilevante nella colonna B.

Devo anche eseguire i seguenti passaggi globali nella colonna B:

1) Sostituisci “spazio” e “&” con “+”

2) Sostituisci “++” con “+”

3) Elimina tutte le istanze di “apostrofo”.

Ecco la parte divertente:

1) Allargo le colonne in modo che ci sia molto spazio bianco a destra del testo in ogni colonna.

2) Salvo il documento come documento delimitato da spazio di testo formattato (.prn).

3) Apro il documento, scelgo “Delimitato”, faccio clic su “Avanti”, quindi clic su “Fine”.

4) Quindi sostituisco globalmente “spazio” con nulla, generando l’elenco di URL RSS lunghi.

La soluzione: parte 2

(…prende fiato…)

In ciascuno dei lettori di feed che ho utilizzato, ho notato che è possibile importare in blocco i feed se sono in OPML, cosa che ammetto di non capire troppo bene. Mi sono reso conto che se potessi convertire i miei URL in OPML, potrei quindi ottenere il mio intero elenco di feed RSS di notizie aziendali in un lettore di feed. Ho trovato Feedshow Goodies (http://www.feedshow.com/goodies/opml/OPMLBuilder-create-opml-from-rss-list.php) tramite Google, ho inserito i miei URL nel modulo che si trova in questa pagina e ho fatto clic su “Crea OPML” (tieni presente che elaborerà fino a circa 200 URL contemporaneamente). Ho quindi salvato ogni file OPML sul mio disco rigido.

Ho quindi commesso l’errore di pensare che il mio fidato Feedreader 3.07 avrebbe accettato in modo pulito 1.700 nuovi feed. La prima importazione OPML di 200 feed ha consumato tutta la mia larghezza di banda Internet e ha rallentato il mio computer. Google Reader era l’unico altro lettore di feed che ho usato, quindi ho effettuato l’accesso e ho caricato 9 file OPML di grandi dimensioni.

Ha funzionato. Google Reader mi ha permesso di importare senza problemi (anche se un po’ lentamente) 1.700 feed e leggerli tutti insieme, permettendomi di ottenere un aggiornamento delle notizie in tempo reale di tutte le società di costruzioni commerciali e residenziali che desideravo monitorare.

Il mio feed pubblico (http://www.google.com/reader/shared/user/14537180468496839026/label/cartella-principale) (Nota che l’ho configurato in modo leggermente diverso rispetto all’esempio sopra).

Suggerimenti

1) Anche se Google Reader sta facendo tutto il “sollevamento pesante”, averlo aperto per monitorare 1.700 feed ti occuperà la memoria, specialmente in IE. Ho scoperto che l’apertura di Google Reader in Firefox o Opera ha invece ridotto significativamente la quantità di memoria utilizzata.

2) L’unico inconveniente di questo processo è che il “titolo” di ogni feed è il lungo e brutto URL RSS di Google invece di qualcosa di più descrittivo.

3) Se hai molte storie nel tuo Google Reader, vai su Preferenze e seleziona “Nella vista espansa, contrassegna gli elementi come letti mentre li scorri”. Questa funzione è di grande aiuto per guadare enormi quantità di dati.

4) Ho scoperto che la creazione di feed di Google News per tutte le notizie create “nell’ultima settimana” mi ha dato i risultati migliori. Un feed di Google News per tutte le notizie aziendali per ciascuna azienda ha portato a troppe informazioni e il feed di notizie che copre solo le notizie del giorno passato sembrava perdere le notizie. In questo esempio, ho utilizzato gli URL RSS di News per tutte le notizie aziendali perché sono i più facili da usare. Per utilizzare questo mashup con Google News “a tempo limitato”, dovrai fare clic su “Ricerca avanzata di notizie”, eseguire una ricerca di esempio con un periodo di tempo definito, generare l’URL RSS delle notizie e copiarne la prima parte nella colonna A del tuo foglio di lavoro prima di seguire la procedura vietata.

Ora posso tenere traccia delle notizie da tutte le 1.700 aziende nel mio Google Reader. Complimenti a quelle brave persone al ´Plex.

Leave a Comment

Your email address will not be published.