Beeseek, il motore di ricerca open source

10-06-2007

Due giorni fa vi avevo scritto di una mia idea, riguardante un motore di ricerca open source.
Oggi, grazie ai vostri commenti, a questo libro e alle mie riflessioni, ho le idee più chiare, e vorrei condividerle con voi.
Il nome è frutto di un brainstorming (termine tecnico che indica “due chiacchiere tra un morso di piadina e una bevuta di birra” all’Oasy di Michela) tra me e Serena.
Ripeterò alcune cose già dette nel precedente post.

NASCITA DELL’IDEA

Scobleizer (Robert Scoble), un famoso blogger, rispondeva alla domanda “userai Ask.com?” (Ask nei giorni scorsi ha subìto un restyling vigoroso) sottolineando come i Data Center siano il cuore di una eventuale “offensiva” nei confronti dei tre colossi della ricerca online: Google, Yahoo, MSN (di Microsoft).

Google, ad esempio, possiede una enorme quantità di PC che utilizza per fornire i risultati delle ricerche degli utenti (non ho trovato un riferimento chiaro, ma penso che stiamo parlando di qualcosa intorno al milione di PC). Chi voglia entrare nel campo dei motori di ricerca dovrebbe partire da una potenza di calcolo almeno paragonabile.
Sono d’accordo con Robert.

La sera del 6 giugno, riflettendo su questo, mi è venuta in mente la forza del peer-to-peer, e di come milioni di utenti potrebbero surclassare la potenza di calcolo di Google, se solo volessero.
Vi tralascio i particolari filosofici sottostanti, conservandoli per un momento migliore :-)

Ho anche pensato a come i motori di ricerca siano un potere forte, molto più forte della stampa. I motori di ricerca determinano a quali informazioni si possa avere accesso, non a caso in Cina il regime comunista censura i motori di ricerca con più vigore dei giornali cartacei.

Ho quindi pensato: Perchè non creare un motore di ricerca Open Source, basato su un modello peer-to-peer, in grado di fornire ricerche più precise, più veloci, e di convogliare l’enorme ricchezza generata da Internet verso cose “etiche“?

Questa cosa ha ora un nome: Beeseek.
Bee come ape, perchè si tratterebbe di migliaia di api che lavorano insieme per un risultato.
Seek perchè “cercano” informazioni in rete e le raccolgono.

DETTAGLI

Bisognerebbe creare un software (plugin per Firefox? Programmino in Java? Altro?) che si installa nel PC di un utente e permette di registrare IN MANIERA DEL TUTTO ANONIMA:
-
le sue ricerche (query) effettuate nei motori;
- i risultati delle query;
- quali pagine vengono poi effettivamente cliccate;
- quanto tempo l’utente passa su quelle pagine.
Questo software può essere considerato il “client” di Beeseek.

In questa maniera si creerebbe in poco tempo un repository (archivio centrale) di “stringhe di ricerca” e di “risultati di ricerca“, potendo organizzare questi ultimi sia in base a come vengono già presentati dai motori di ricerca, sia in base a quali vengono cliccati, e quanto tempo dura la visita degli stessi da parte degli utenti.
Mano a mano che il numero di utilizzatori aumenta, la precisione dei risultati aumenta di pari passo.

Questo repository, che può essere considerato il “server” di Beeseek, dovrebbe essere replicato in diverse copie “principali”, e propagato a TUTTI i “client” installati, suddividendolo ovviamente in frazioni del totale.
Attraverso un meccanismo di autenticazione, i client potrebbero fornire risultati di ricerca ad altri client, facendosi carico di TUTTO il calcolo necessario per fornire agli utenti il servizio.

L’unico compito dei “server” è di raccogliere i risultati, organizzarli, e replicarli ai vari client.

Beeseek trarrebbe profitto in due modi:
Il primo è utilizzando Google o altri come motori di ricerca quando i risultati di Beeseek non siano sufficientemente utili;
Il secondo è utilizzando un meccanismo in stile “adwords” e facendo quindi pagare agli utenti le inserzioni pubblicitarie nelle pagine dei risultati.
Il meccanismo di Adwords, tuttavia, si presta alla cosiddetta “click fraud“, ovvero “frode sui click”, che potrebbe essere evitata utilizzando un meccanismo di addebito “ad ore”, invece che a click, con un costo per l’inserzionista dipendente dal numero medio di click negli orari stabiliti.

AZIENDA O NON-PROFIT?

Credo che la maniera migliore per sviluppare Beeseek e renderlo un reale concorrente di Google, Yahoo e MSN (GYM), sia quello di creare una azienda.
Questa azienda potrebbe tenere per sè il 10% degli utili (per innovare il prodotto, pubblicizzarlo, eccetera), dedicando il restante 90% degli utili ad iniziative “etiche” (salvaguardia dell’ambiente, diffusione di Linux, aiuti ai paesi poveri), possibilmente coinvolgendo gli utenti nella scelta delle iniziative da finanziare.

Un altro modo potrebbe essere quello di creare una NON-PROFIT.
Personalmente credo che questa soluzione rischi di non riuscire mai a decollare per mancanza di fondi iniziali.

Terza soluzione: dato che ho intenzione di partecipare al Rolex Award for Enterprise (scadenza per l’Italia: 30 settembre 2007), potrei creare un progetto su Beeseek e farlo partecipare; in caso di vittoria, Rolex metterebbe a disposizione 100.000 dollari, che non sono tanti, ma nemmeno pochi. Questa cifra potrebbe essere utilizzata sia per creare una azienda, sia per creare una non-profit.

Il grande dilemma è: posso farcela a creare Beeseek dedicandogli poche ore a settimana, con l’aiuto di volontari? O forse è il caso di prevedere una struttura aziendale, che sia comunque APERTA e ETICAMENTE SENSIBILE?

Penso a Mark Shuttleworth, e a Canonical. Canonical è l’azienda che detiene i diritti di Ubuntu, è una azienda FOR-PROFIT, che dedica il 100% dei suoi utili a se stessa.
Eppure, tutti noi “ubuntisti” vogliamo bene a Canonical perchè produce un software Open Source e Gratuito, EVENTUALMENTE guadagnandoci sopra.
Penso quindi che una azienda non è necessariamente un male, se si comporta in maniera aperta, etica e corretta nei confronti di chi usa i suoi prodotti e i suoi servizi.

SUGGERIMENTI

(raccolgo i vostri suggerimenti e li elaboro, eventualmente modificandoli. Questo significa che indico il nome di chi ha fornito il suggerimento, ma la descrizione del suggerimento potrebbe essere stata modificata da me)

(hronir)
I risultati forniti da Beeseek partirebbero da quelli forniti da GYM, e mano a mano che il repository si popola, comincierebbero ad essere “mischiati” con quelli di Beeseek.
In questa maniera l’utente che utilizza Beeseek nella prima fase NON trova svantaggi particolari rispetto a GYM.

(MarcoPoloni)
Parlarne con Jimbo Wales, il creatore di Wikipedia.
Google comincia a ricordare la Microsoft degli inizi.

(JeKo)
Importante rassicurare gli utenti circa la loro privacy

(Kjow)
Più che un plugin di Firefox, sarebbe meglio creare un programma vero e proprio, con eventuali plugin di interfacciamento ai vari browser.
Inserendolo in SourceForge, la stessa comunità potrebbe sponsorizzarlo.

(Pix)
Per promuovere un sito basterebbe scrivere un software che “bara”?
Risposta di Simone: Problema interessante, da non sottovalutare.
Sottolineo che lo stesso problema lo subiscono i motori di ricerca.

(Andrea Colangelo)
Sono in una fase di avversione e paura per Grande Fratello Google, quindi ogni idea che mi permetta di liberarmene, anche parzialmente, mi entusiasma.

(Pikappa)
L’estensione per Firefox potrebbe essere la cosa migliore, almeno all’inizio, per non spaventare gli utenti.

(blood)
E’ osceno che le ricerche mondiali debbano ancora appellarsi a tre grossi colossi closed e censori.

(Rillo)
Risposta di Simone: Spiacente, nella mia idea non si parla PER NIENTE di Crawling. E’ troppo costoso.

(jak)
Risposta di Simone: Ho raccolto tutte le idee dai commenti e le ho messe in questo nuovo post, come tu suggerivi!

(Francesco)
Sei scettico su cosa si può fare col Grid computing (calcolo distribuito)?
Pensa a Google stesso, o al CERN di Ginevra, o a eMule!

COME PROCEDERE

L’idea sembra concretizzarsi.
Ditemi cosa ne pensate!

About these ads

67 Responses to “Beeseek, il motore di ricerca open source”


  1. Il nome BeeSeek è strepitosamente indovinato. Google riporta 24 citazioni, credo sia una parola usata solo in qualche oscura lingua straniera. Questo vuol dire che non si rischiano confondimenti con altri progetti.

    Ho visto che hai affittato i domini .com .org e .eu: ottimissimo. Ho visto che li hai affittati con aruba: malino. :-)

    Voto con convinzione per la creazione di un’impresa. Se non hai la possibilità di accumulare profitti e di dare dividendi non ha senso cominciare. Sulle percentuali di investimento degli utili possiamo discutere, ma forse conservare il 10% per gli asset aziendali potrebbe essere un pò poco, almeno all’inizio. Inoltre, una “partita iva” che fa affari con l’open source è una cosa incredibilmente goduriosa ed è una lezione a quelli che “con l’open source non si fanno soldi”.

    Come dici tu, azienda != male assoluto. Quindi suggerisco di dare a BeeSeek una impostazione quanto più aziendale possibile. Se BeeSeek cerca di affrontare GYM presentandosi come “divertissement amatoriale da poche ore a settimane”, allora è morto in partenza. Viviamo in un sistema sfrenatamente capitalistico, e IMHO bisogna dotarsi delle medesime armi per entrare a giocare sul serio con colossi da 1 milione di PC. Sempre come dici tu, Canonical docet.

    Secondo me meritano ulteriori riflessioni la questione della distribuzione dei risultati sui computer degli utenti (intravedo qualche debolezza) e la questione “adWords”: il meccanismo a tempo non mi sembra del tutto convincente.

    Ultimo problema: i soldi. Secondo me sarebbe bene cominciare a definire un piano industriale con un preventivo dei costi necessari a mettere in piedi un minimo di infrastruttura per cominciare a lavorare sul serio. Quale banca o azienda potrebbe eventualmente finanziarci? Quali garanzie forniamo? Penso sia il caso di concentrarci molto su questi aspetti.

  2. Michele C.S. Says:

    Indipendentemente dal profit si potrebbe installare un servizio o demone sui computer degli utenti e retribuirli come se si trattasse di una macchina in affitto, con delle tariffe in base all’utilizzo (es. tempo macchina, numero di query, etc.).

  3. diegor Says:

    Quando si inizia?!? :)

  4. ubuntista Says:

    @ Andrea: :-D

    @ Michele: ottima idea, ma forse prematura x il momento. complimenti per il tuo blog, mi piace un sacco ;-)

    @ diegor: preparati! :-D


  5. Questo è un progetto decisamente da non sottovalutare. Dal mio piccolo mi sembra L’IDEA.
    Come utente comune mi sorge un dubbio: ma l’eventuale software, magari integrato con firefox, sarà disponibile sin dall’inizio per Linux? Non vorrei che passasse in secondo piano, dopotutto suppongo siano soprattutto coloro che si interessano di Open Source ad aderire prontamente al progetto…
    Non mi resta che quotare diegor: non vedo davvero l’ora che questo gioiellino prenda vita…

  6. ubuntista Says:

    Daewen: la domanda è: sarà disponibile anche per Windows, o solo gli utenti Linux potranno goderne inizialmente? :-)

  7. ubuntista Says:

    @ Daewen: visto che ti intendi di grafica, sappi che a breve lancerò un “logo contest”… mi farebbe piacere se mi dai una mano a diffondere l’iniziativa!

  8. Giacomo Says:

    Per non appensantire il browser io ritengo che la cosa migliore sia creare un sw che gira in background sulla macchina e scruti lo scorrere infinito dei pacchetti, restando in ascolto particolarmente sulla porta 80 e guardando quali sono le richieste dei client e le risposte dei server. Questa tecnica però troverebbe difficoltà qualora si volesse studiare il tempo di permanenza degli utenti su una pagina, o un loro eventuale feedback sul risultato offerto dal motore di ricerca. Riguardo questo ultimo punto, credo che sia da pensare non solo come poter scandagliare il web, ma anche come catalogare le pagina in base a stringhe di ricerca, e il feedback di persone umane penso sia la cosa più efficiente che si possa avere fino a che qualcuno non inventa un web semantico. Sono stato spiegato? senno provo a cambiare parole :P

  9. MarcoPoloni Says:

    Simone,
    come gia’ scritto l’idea mi piace.
    Anche se vivo in Germania sono disposto a supportare
    la nascita dell’azienda o di una sorta di fondazione
    (che opera nella stesso modo descritto da te – non accumula €€, ma investe tutto nelle proprie attivita’).
    Sono disposto non solo a lavorare ma anche a essere d’aiuto (€€+Networking) nella fase di partenza.

    Mettiamoci in contatto per valutare le possibilita’

    Ciao

  10. Elias Says:

    Complimenti per l’idea, è grandiosa! Mi ha fatto venire in mente tre riflessioni:
    1) penso che all’inizio di potrebbe partire solo con un plugin per browser, il che mi sembra la soluzione più “leggera” dal punto di vista “emotivo” per l’utente, e solo successivamente sviluppare la versione standalone in modo da dare la possibilità di scelta a chi non vuole appesantire il browser. Ammesso che ce ne sia bisogno… chi ha detto che il browser debba risultarne *sensibilmente* appesantito? :-)
    2) per quanto riguarda il plugin: purtroppo non c’è solo firefox. IE è installato sull’80% dei computer, se non vado errato: forse occorre pensare a un’estensione anche per lui, anche per non far sembrare Beeseek il solito progetto elitario di ‘sti snob di hackers che vogliono pure il loro searcher privato…
    3) una riflessione “politica”: ma siamo sicuri che per il movimento open source questa iniziativa sia una buona cosa? Google supporta un sacco di progetti FLOOS… è il caso di farli inc*? Non voglio sembrare servile… e magari è un dubbio del tutto infondato, ma mi è venuto in mente e ho pensato di comunicarvelo.

    Buona fortuna! Il nome è proprio azzeccato secondo me… let it b seek!! :-D

  11. ubuntista Says:

    @ Giacomo: secondo me il plugin Firefox è la scelta migliore per iniziare; la porta 80 poi non ha nessun significato per un client, ma solo per un web server; forse intendevi il traffico VERSO porte 80.

    @ MarcoPoloni: grazie, rimaniamo in contatto qui sul blog… se si concretizza qualcosa terrò presente la tua gentile offerta.

  12. ubuntista Says:

    @ Elias: 1 e 2 ok.
    3: Google è una delle aziende meno “evil” in circolazione, e non vedo come BeeSeek, almeno all’inizio, possa farli arrabbiare.
    Se poi BeeSeek risulta un progetto vincente, vedrai che si adegueranno anche loro, e il vero beneficiario finale sarà soprattutto l’utente.

  13. MarcoPoloni Says:

    Un’altro aspetto che nessuno ha ancora preso in considerazione, ma che ritengo MOLTO importante visto che GYM sono 3 aziende americane:
    L’accumulo nel “repository” delle richieste e dei risultati diretti ad altri motori di ricerca e’ “pulito” dal punto di vista legale??
    Averci al collo tutti gli avvocati di Google, Yahoo e Microsoft insieme non deve essere troppo divertente…

  14. jollyr0ger Says:

    l’idea mi sembra buona.
    a mio parere pero’ sono necessari per il successo del progetto alcuni particolari:
    -deve essere sorretta da una azienza che abbia del profitto, seppur poco, ma deve averlo, poichè deve tutelarsi dagli investimenti
    -il modello di sviluppo deve essere in stile ubuntu, i ruoli e gli strumenti sono da studiare attentamente
    -e bisogna motivare con incentivi economici, premi o meriti particolari gli utenti che utilizzano tale servizio, per poter condividere la loro potenza di calcolo.

    INOLTRE mi pare essenziale che un posto dove discutere di questo progetto in modo + comodo e chiaro.
    sopratutto per le fasi di brainstorming…

    cmq se serve poi mando il curriculum ;)

  15. Kjow Says:

    Per il linguaggio di programmazione… ho un debole per l’object pascal… NON Delphi :D

    Lazarus: Open Source, Multi piattaforma (basta RICOMPILARE e il programma gira ovunque [win, linux, mac, ecc... e volendo anche sul NINTENDO DS :D]) e da uno schiaffo al progetto closed di Borland :D

    Io però farei (almeno proverei) senza un server centrale, una specie della rete Kademlia (serverless). Ogni client si elabora i propri dati ed accetta le richieste dei nodi limitrofi. Inizialmente un po’ lento e incompleto, ma dopo essersi diffuso decentemente dannatamente efficiente. Ogni client può inviare agli altri i risultati più frequenti (diciamo 1000/2000 o più… tanto alla fine ogni ricerca si concentrerebbe su pochi campi per ogni riga limitandosi a pochi KB di database per pc -> anche i 56Kb ne beneficerebbero [volendo si possono usare policies differenti in base alla connessione, principalmente in base all'upload]) ed il resto (fino a qualche MB) in locale.

    L’ideale (un po’ utopico in effetti) sarebbe una specie di p2p universale, quindi sempre connesso alle rete p2p dove ci si possa fare di tutto, dal beeseeking ad emule passando per il voip; così si stresserebbero meno le connessioni, la rete e tutto cio’ che ne consegue. Una specie di MPLS del p2p :p

    Ciao dal mondo fantastico di Kjow :D

  16. paolo Says:

    Anche io trovo l’idea molto buona.
    Aggiungo due informazioni un pochino di fretta, ma mi piacerebbe poter collaborare alla cosa se non altro perche’ e’ da un po’ che leggo ricerche al riguardo.

    1)
    Quanto le idee qua esposte sono in sovrapposizione con i seguenti?
    Building An Open Source, Distributed Google Clone
    http://www.readwriteweb.com/archives/how_to_build_an_open_source_google.php
    e con
    Building a Bigger Search Engine
    http://www.wired.com/techbiz/it/news/2003/04/58497
    e con wikia (il search engine promosso da Jimbo Wales)
    http://www.newscientisttech.com/channel/tech/mg19426066.500-opensource-search-engine-gangs-up-on-google.html
    “Wikia Search is already considering one solution. Rather than investing in data centres, it might store its index on a distributed computing “grid” made up of thousands of volunteers’ home PCs and servers connected via the internet. The model for this is the SETI@home screen saver, which divvies up data from a radio telescope among volunteers’ home PCs. Each computer would hold a small part of Wikia Search’s index and handle search requests relevant to that part.”

    1.1.)
    quanto la tua idea e’ in sovrapposizione con
    Distributed hash table
    http://en.wikipedia.org/wiki/Distributed_hash_table
    in particolare in quella pagina ci sono link a due search engine che usano DHT
    * FAROO: Peer-to-peer web search engine
    http://en.wikipedia.org/wiki/FAROO
    * YaCy: distributed search engine
    http://en.wikipedia.org/wiki/YaCy
    Io avevo anche letto qualche paper che proponeva qualcosa di simile,
    ad esempio questo
    http://iowl.berlios.de/
    ma non credo che abbiamo mai raggiunto la massa critica (ad ogni modo il software e’ libero)
    Controlla anche
    https://www.tribler.org/TriblerResearchSubjects
    Softwarelibero anch’esso

    2) Immagino che anche questo sia molto relevante:
    Open source search engines
    http://en.wikipedia.org/wiki/List_of_search_engines#Open_source_search_engines

    Mi e’ anche venuto in mente che alla conferenza Web intelligence 2005 c’era stato un invited talk dal titolo “Opportunities from Open Source Search” di Wray Buntine dell’Helsinki Institute for Information Technology che mantiene il wiki a http://www.opensourcesearch.org/
    Le slides sono a http://wi-consortium.org/pdf/buntineWI05Slides.pdf (niente di stratosferico) pero’ magari il wiki contiene informazioni utili.

    3) Passando invece al livello filosofico vi consiglio di leggere
    “Sharing Nicely”: On shareable goods and the emergence of sharing as a modality of economic production”
    http://www.benkler.org/SharingNicely.html
    66 pagine di puro oro che parlano anche delle motivazioni dietro allo sharing, nel nostro caso per produrre il bene economico “motore di ricerca”.

    4)
    C’e’ una questione che e’ cruciale e va affrontata prima di iniziare
    Se il software e’ open source, chiunque puo’ leggerlo e modificarlo. In particolare chiunque puo’ modificare il software in modo che memorizzi risultati “non reali”. In particolare io potrei modificare il software in modo da simulare visite e grande attenzione al sito xxxxx e potrei far girare il programma modificato su un certo numero di macchine sotto il mio controllo. In sostanza potrei inquinare il repository collettivo a piacere. Come si pone un freno a questo? E’ chiaro che tutti cominceranno a farlo poiche’ essere in testa ai risultati del motore di ricerca ha un valore economico enorme (la cosidetta search engine optimization no?).

  17. ubuntista Says:

    Ottimi spunti da parte di tutti.
    Ora studio cosa fare per un “posto in cui discutere” più decente.
    Per il momento procedete nei commenti qui. :-)

  18. Broggia. Says:

    Non è facile trovare le parole per definire quest’idea!

    Geniale? Coraggiosa?? Pazzesca??
    Semplicemente stimolante? :-)

    Direi che ci sono i semi per progettare qualcosa di veramente interessante! Soprattutto una sfida
    per chiunque voglia parteciparvi!

    Se ci sarà la possibilità di collaborare,
    penso che le richieste non mancheranno!

    Facci sapere!

    P.s. Il plugin va fatto anche per IE!

    Ciao ciao.

  19. ubuntista Says:

    @ Paolo: ottimo commento, e tantissimi spunti interessanti!

  20. paolo Says:

    Forse non era molto chiaro nel mio commento, ma una delle difficolta’ piu’ grandi che vedo e’ sociologica: come ottenere la massa critica? Per quale motivo una persona dovrebbe scaricare il plugin? E’ chiaro che se il sistema e’ usato solo da 100 persone non puo’ scalare.
    Il suggerimento di “Sharing Nicely”: On shareable goods and the emergence of sharing as a modality of economic production” andava in quella direzione.

  21. residenthell Says:

    ciao ha tutti ragazzi ho scoperto da poco questo blog e devo fare i complimenti a ubuntista ottimo spunti su tutte le questioni che tratti.

    riguardo al progetto l’idea è a dir poco ottima e se posso aiutare sono qui ciao a tutti ed a presto

  22. Jak Says:

    ora la situazione è più chiara e complimenti per l’impegno!! ;)

    concordo con chi ha detto della necessità di un posto più utile e comodo in cui portersi scambiare opinioni anche se sono più che sicuro che se non lo hai ancora fatto lo stai già facendo!

    mie riflessioni:

    1- non conosco programmazione, ma da quel che ho capito java in particolare è un linguaggio multiOS e mi chiedevo se era fattibile creare una applicazione anche per phone, ovviamente anche solo come raccolta di dati che poi vengono inviate su qualche mirror….insomma il commento è: io che sono utilizzatore di mobile internet mi farebbe piacere avere un servizio anche in versione mobile! proprio recentemente google ha migliorato notevolmente la sua pagina mobile inglese http://www.google.com/m totalmente personalizzabile! è fantastica! ora senza arrivare a questi livelli l’idea è di non dimenticarsi dei mobilephone…

    2-sempre a proposito di mobile phone si potrebbe contattare il team di openmoko il recente pda totalmente open source che uscirà a settembre in competizione con iphone e LG prada…

    3- di browser ce ne sono tanti, quindi per non tagliare fuori nessuno bisognerebbe anche guardare a quelli minori:

    IE
    Firefox
    Opera
    ——
    Epiphany
    Konqueror
    Camino
    Safari
    …. sicuramente tanti altri ma se questi li conosco io vuol dire che sono abbanstanza famosi!:D

    senza contare quelli per PDA:

    IE mobile( non so se si chiama così..)
    firefox mobile (ci stanno ufficialmente lavorando su)
    opera mobile
    safari mobile (uscirà con l’iphone)
    epiphany mobile (o magari ci sarà firefox, cmq con il nuovo ubuntu mobile!!!!!!)

    per ora basta…se ho tempo stasera ci rifletto ancora un po’, ovviamente non assicuro nessuna correttezza delle mie riflessioni!:D

    ps 5- la fortuna di GYM è il valore aggiunto dei serviz, che immagino però necessitino di server!!!:D però esistono tanti servizi online opensource nonchè programmi simili a quelli di GYM opensource come quel programma come google earth però fatto con le fotografie della NASA mi pare….ci sono anche numerosi programmi GPS (vedi google maps) opensource!!

    ciao

  23. ubuntista Says:

    @ Jak: il settore mobile è importante, come anche, per esempio, i mondi virtuali come Second Life (in cui GYM non ha ancora attecchito).

  24. iLLusion Says:

    Ti appoggio pienamente. Purtroppo non ho le conoscenze adatte, tranne una, ossia quella del web design. Ti posso aiutare con l’impaginazione e la struttura del sito, eventuali loghi e banner pubblicitari :) .

  25. Jak Says:

    secondo me partendo fin da subito su diversi settori (dal mobile,ai pc, alle console fisse e portatili) si ha nno grossisimi vantaggi!!

    per gli aspetti economici, guardando il sito di iLLusion, mi sono ricordato di Ripple il motore di ricerca basato su google che serve a fare beneficienza!!! Concorrente o fratello???

  26. iLLusion Says:

    # Il grande dilemma è: posso farcela a creare Beeseek dedicandogli poche ore a settimana, con l’aiuto di volontari? O forse è il caso di prevedere una struttura aziendale, che sia comunque APERTA e ETICAMENTE SENSIBILE?

    L’importante è come hai detto tu successivamente, ossia farsi “amare” dall’utenza, far capire che si sta lavorando per una cosa giusta.


  27. @ Simone: Second Life può fornire grandi opportunità per la diffusione di BeeSeek. Pensiamoci.

  28. lele85 Says:

    Ti consiglio di dare un occhiata alla pagina del progetto Netsukuku. Il progetto se non ricordo male è quello di una “rete pura” e decentralizzata con l’abbattimento delle tipiche gerarchie del web. Mi sembra che tra le altre cose il progetto sia nato in Italia. Penso che loro potrebbero darti parecchie dritte sulla fattibilità “tecnica” della tua fantastica idea. Ti faccio da subito un grande in bocca al lupo.

    P.S.
    Il discorso della massa critica è fondamentale in un progetto del genere. Forse bisogna strutturare un piano abbastanza lungo che preveda un periodo iniziale di perdite economiche. Bisogna avere un impatto forte sin da subito.

    vabbè me la faccio finita con i consigli! Tienici aggiornati!

  29. Daniele DM Says:

    Complimenti, devo ammettere che l’idea era venuta anche a me qualche tempo fa, ma non mi sono interessato più a studiarla, comunque due spunti:

    # usare qualche sistema di crittografia e di riconoscimento per evitare dati falsati (openid?)

    # possibilità di taggare le paggine visitate nel caso di plugin(vedi del.icio.us, technorati, etc)

    # a scelta dell’utente, possibilità di immagazzinare dati quali età, sesso, istruzione, etc per aggiungere qualità alle ricerche e dare nuovi spunti alla pubblicità

    # nel caso di plugin, va da se che bisogna sfruttare le api di firefox, nel caso di daemon, propenderei per python

  30. namez Says:

    Sono ignorante in materia, ma vi seguo da tempo. Ho Ubuntu sulla seconda macchina, non riesco, per motivi professionali, ancora a liberarmi di windows.

    Do il mio appoggio per eventuale installazione e diffusione di tutto ciò che può servire per il progetto.

  31. Fabrizio Balliano Says:

    mi sembrava che parlassero proprio di un progetto simile su techcrunch ma vai a ripescare l’articolo quando ti serve…

    in ogni caso prova a vedere se questi due sono simili alla tua idea:
    http://www.yacy.net/yacy/index.html
    http://www.majestic12.co.uk/

  32. Gio Says:

    idem come namez, aspetto il logo contest, forse unico ambito in cui potrei essere utile!

  33. phoebius Says:

    Utilizzare un software tipo SETI ?
    Nei ‘buchi’ liberi il pc scandaglia internet costruendosi un database proprio ecc. ecc.

    La butto li, magari a qualcuno piace ….

  34. hronir Says:

    un w-e offline e guarda cosa ti ritrovo quando torno! Non ho letto che il post, per i commenti e il seguito devo prima rifarmi una dose di sonno…
    In bocca al lupo, mi terro’ aggiornato! :)


  35. [...] l’idea continua… e mi piace sempre di [...]

  36. Lazza Says:

    Bella idea… Però non capisco cosa non ti vada in Google. E considera anche che la pubblicità AdSense permette a molti siti web di sopravvivere. Secondo me questo BeeSeek dovrebbe almeno fornire le stesse opportunità…

  37. JeKo Says:

    L’idea è buona… però oltre ad un plugin per firex si potrebbe integrarne uno anche per gli attuali software p2p (penso ad emule e mldonkey principalmente… i due principi del p2p secondo me). La diffusione sarebbe enorme a questo punto. In più avere la collaborazione di esperti di p2p semplificherebbe il tuo lavoro e apporterebbe una ventata d’aria fresca ai vari progetti già esistenti (si potrebbe studiare una versione parallela di emule apposta per BeeSeek).
    Google è il numero uno perchè è presente in tutti gli ambiti (onnipresenza digitale?) internettiani… BeeSeek dovrebbe seguire la stessa filosofia…
    E circa il dilemma azienda-ProProfit o NoProfit… forse regge di più la prima… ma che sia Open almeno quanto Canonical :)

  38. ubuntuz Says:

    Sarei daccordo con te se si decidesse di aprire un’azienda vera e propria dove una percentuale rimane in casa per finanziare lo sviluppo e la restante parte utilizzata per finanziare altri progetti OpenSource.
    In questo modo credo che molti progetti open riescano ad avere un salto di qualità notevole.
    Sarebbe bello se gli utenti possono decidere in base a sondaggi o cose varie chi o quale progetto finanziare.
    L’idea è ottima in attesa delle news confermo il mio totale appoggio verso questo progetto. :)

  39. residenthell Says:

    Secondo mè aprire un’azienda sulla falsa riga di canonical è l’ideale. il dilemma che credo fara diventare famoso o no il progetto è: Gli utenti che decideranno di fornire banda e spazio saranno ricompensati o sara solo per la causa?

    Perche in quest’ultimo caso non vorrei essere una voce fuori dal coro ma non si va da nessuna parte!(a parte gente come noi che credo cederebbero volentieri banda e hd, la maggioranza degli utenti non aiuterebbero senza una qualche specie di ritorno)soprattutto se si crea un’azienda.
    voi cosa ne pensate?

  40. ubuntista Says:

    @ residenthell: hmm… il modello “Canonical” non prevede alcun compenso per gli utenti, eppure Ubuntu è diventata in un attimo la distribuzione Linux più diffusa!
    Cmq la tua considerazione non è nè stupida nè banale, e va presa in considerazione.

  41. j0sh Says:

    scusate l’ingenuità ma un progetto del genere si basa comunque sul fatto che gli utenti utilizzino altri motori di ricerca. Il concetto presuppone dei grossi limiti:

    - per far funzionare beeseek gli utenti dovranno comunque continuare a utilizzare gli altri motori… beeseek non sarà quindi mai un competitor di google…
    - google potrebbe decidere di bloccare chi utilizza i client di bs (beeseek) e in questo caso il progetto fallirebbe immediatamente
    - un’azienda dovrebbe avere dei finanziatori per lanciare il progetto che almeno nei primi mesi produrrà solo perdite… è cmq una scommessa


  42. [...] del motore. Il resto delle informazioni ve le lascio leggere direttamente dall’articolo originale e inoltre vi segnalo il forum creato oggi stesso. Come ho già citato nei post dell’articolo [...]

  43. trollhouse Says:

    minchiia che progetto …bellliussimissimissimo


  44. [...] Giugno 11th, 2007 in Uncategorized Nel post di ieri in cui parlavo di Google ho fatto cenno a BeeSeek, il progetto di motore open source che Simone Brunozzi ha presentato ieri sul suo [...]

  45. final Says:

    Sul fatto che google non possa essere insidiato solo con
    grossi capitali, abbiamo l’esempio lampante di Micro$oft
    che nonostante grandi risorse economiche non riesce a
    fronteggiare google, l’idea di un sistema p2p per questo
    motivo può essere un ottima idea!!!

    Questo sistema di ricerca deve offrire un qualcosa
    che una “multinazionale” non può offrire e non può
    comprare.. prima di tutto la fiducia degli utenti!!

    Per questo è fondamentale…

    1. un sistema che minimizzi la possibilità di frodi
    o ranking fasulli.
    2. un sistema che almeno all’inizio, non si ponga come
    alternativa a google ma solo come aggiunta/verifica.

    @Lazza google acquista sempre più “potere”, io farò
    minimo 50 ricerche al giorno se non 100…e nessuno
    mi garantisce che google mi restituisca tutti i dati
    di cui è in possesso senza effettuare nessuna “modifica”
    / “censura”… per questo un sistema basato sul p2p
    e su statistiche reali di popolarità/attinenza(1)
    fornirebbe se non altro una buona verifica dei risultati proposti da google.

    (1) il tempo passato su una pagina è già un buon
    inizio…

    In definitiva… per quel poco che posso fare…
    se serve una mano .. io ci sono! :)

  46. swarzy Says:

    Caro Ubuntista,

    mi fa’ estremamente piacere che anche tu abbia avuto la mia stessa idea… anche se con un’ annetto di ritardo ;-)

    Io ci ho gia’ lavorato la scorsa estate ed ho individuato quello che, secondo me, e’ il giusto algoritmo da utilizzare:

    http://www.blorigo.net/axil-ed-exil

    ho anche creato una primissima implementazione di tale algoritmo:

    http://www.blorigo.org/projects/Axil

    che, nella versione attuale, e’ tanto lento nella fase di indicizzazione, quanto veloce nella fase di ricerca.

    Insomma ci devo ancora lavorare un bel po’ per migliorarne l’implementazione… ma sono sicuro che l’idea di base e funzionante.

    Ad Agosto conto di riprenderne attivamente lo sviluppo:
    se nel frattempo non avrai cambiato sull’ utilita’ della cosa, fammi pure un fischio; saro’ lieto di collaborare con ogni persona interessata.

  47. ubuntista Says:

    @ final: concordo! E… grazie per la disponibilità!

    @ swartzy: bene! Ti va di partecipare al forum e segnalare le tue esperienze?

  48. riva.dani Says:

    Apprendo solo ora e con colpevole ritardo di questa lodevole iniziativa. Tecnicamente dovrebbe essere possibile metterla in pratica: quando con eMule si lancia una ricerca si sfrutta lo stesso meccanismo descritto in questo post, cercando i file nei dischi rigidi di migliaia di PC connessi in rete…
    Speriamo ne venga fuori qualcosa di buono! In bocca al lupo e facci sapere in che modo possiamo aiutarti. :)

  49. swarzy Says:

    Sicuramente si’… appena ho un attimo di tempo libero:
    mi sono gia’ registrato ieri sera, ma morivo dal sonno quindi ho preferito evitare di scriverci :-)

  50. ubuntista Says:

    @ riva.dani: puoi intanto iniziare iscrivendoti al forum e contribuendo con le tue idee!

    @ swarzy: grazie!


  51. [...] che si occupa prevalentemente di Ubuntu, ma ha idee dal respiro molto ampio e oggi ha pubblicato un post in cui annunciava un’idea, ancora allo stato embroniale, ma che potrebbe essere uno strumento utile per spuntare le armi di [...]


  52. [...] a raccogliere un sacco di volontari che vogliono contribuire a formare BeeSeek. Esso si tratta (come spiegato nel blog di Simone “Ubuntista” Brunozzi) di un motore di ricerca opensource in cui [...]

  53. wolf Says:

    Guardate FAROO ( http://www.faroo.com ), un motore di ricerca peer-to-peer:
    http://forum.html.it/forum/showthread.php?s=&threadid=1131038

  54. ubuntista Says:

    @ wolf: ottima segnalazione, grazie!

  55. Roby Says:

    Io la sparo: male che vada si fa un po’ di sano brainstorming.

    Innanzitutto lo scenario che mi piace di più è il plug-in per Firefox (ed IE, qualcuno lo dovrà fare quello sporco lavoro…). Per convincere una massa ad utilizzare questo plug-in, però, bisogna trovare un valore aggiunto, che sia valido per tutti (le questioni filosofiche potrebbero non bastare per raggiungere la massa critica).

    Mettiamola così: si fornisce un plug-in che consente di indicizzare e (soprattutto) taggare le pagine web visitate, in modo da ricercarle velocemente e, nel secondo caso, con keywords che l’utente stesso ha scelto come più rappresentative della pagina. Per il singolo utente, la ricerca sarà molto più calzante di quella fatta con Google o chi per esso.

    Diciamo che sarebbe una via di mezzo con una desktop search, con in più la questione del tagging, squisitamente Web 2.0.

    Noi possiamo raccogliere questi dati, dare più importanza alle pagine taggate, sempre che per la stessa pagina ci sia un congruo numero di tags. Il meccanismo del social tagging è, a mio parere, meno influenzabile dei canonici algoritmi dei motori di ricerca. I risultati forniti con la ricerca p2p sarebbero anche in buona parte “umanizzati”, raggiungendo una precisione superiore.

    Riassumendo quello che è il valore aggiunto che si prospetta in questo scenario, l’utente potrebbe:
    1) ricercare tra le pagine che ha visitato e taggato, ottenendo risultati estremamente calzanti, dato che le ha taggate lui
    2) utilizzare la ricerca p2p, affidandosi, quindi,ai tag della community, invece che ad uno spider.

    L’indicizzazione automatica servirebbe, in buona parte, per censire un maggior numero di pagine e nulla più.

    Spero di essere stato utile: se ho scritto un mucchio di ca***te, smontatemi a piacere, magari ho occasione d’imparare qualcosa!! :-)

  56. ubuntista Says:

    Roby: le tue riflessioni sono molto interessanti, e in parte si accavallano con alcune altre su cui sto ragionando in questi giorni.

    Ti invito a parlare di ciò nel forum, è ormai diventato molto più appropriato che qui!
    http://www.brunozzi.it/forum/

    Grazie!

  57. aniceweb Says:

    Appoggio pienamente il progetto :D
    Tienici informati :D
    Se serve un beta tester sono qui :D

    Hai pensato ad un sistema di voti per i siti?
    In questa maniera magari si puo’ utilizzare una sorta di cache con i siti piu’ votati in relazione alle stesse chiavi di ricerca per velocizzare i risultati e magari risparmiare un po di banda…

  58. paolo Says:

    Forse rilevante
    http://acko.net/blog/authenticated-distributed-search-opensearch-openid
    Authenticated Distributed Search (OpenSearch, OpenID)

  59. ubuntista Says:

    Sembra interessante, Paolo… grazie!


  60. [...] conosciuto grazie a BeeSeek, il progetto ideato da Simone Brunozzi a cui partecipo anch’io. Andrea è a capo del team degli sviluppatori. A dispetto della sua [...]


  61. [...] l’alveare non si è placato nemmeno un attimo. Il progetto è andato avanti dal quel lontano 10 giugno quando ubuntista propose l’idea, la quale piacque, e subito la blogosfera rispose con [...]


  62. [...] which our “hive” didn’t sleep a day! The project went on since that distant 10th of june. When Ubuntista proposed the idea it was immediately accepted, and some bloggers and enthusiasts [...]

  63. Miles Velain Says:

    Ciao simone,

    ti scrivo venuto in visita dal buon vecchio pollycoke, beeseek mi sembra interessante come progetto, se hai una “lista di volontari / interessati” o una mailing list infilamici pure :-)

    Premetto che non ho letto tutti i commenti (mi scusino gli altri lettori), però vorrei riflettere sul ruolo nel 2007 di un motore di ricerca. All’inizio ricerca = directory, ma poi c’è stato Google che ha vinto proprio perché ha rotto questo scomodo paradigma.

    L’utilizzo “normale” del motore di ricerca rimane comunque pur sempre: aprire la pagina, digitare le chiavi (spesso non le migliori possibili, ovviamente) e “cercare” tra i risultati.

    Penso che chi vuole far concorrenza a Google & C. deve innovare ancora di più e “eliminare” le noiosità/inutilità dei motori di ricerca normali.

    Penso ai tentativi di presentare i risultati come mappa concettuale o per area semantica (scusami non mi ricordo ora i nomi dei motori che ci han provato ma ci sono :-), ma non solo…

    E’ proprio l’azione di “apri firefox, scrivi, cerca…” che secondo me può essere innovata… una voce nel menù contestuale (so che si può fare già con i normali motori, se smanetti un po’, ma so anche che non si fa) o una barra sul desktop (per quanto odi le barre sul desktop)…

    boh, magari ci pensiamo meglio, per ora è solo uno spunto da sabato pomeriggio.

    :-)

  64. ubuntista Says:

    Miles Velain: bene, ottimi spunti!
    Se ti va di partecipare come volontario, scrivimi una email a simone . brunozzi chiocc beeseek. org
    Poi ti spiego cosa fare!

  65. Bene Says:

    Sinceramente non mi sono soffermato puù di tanto sull’aspetto tecnico ma devo dire che l’idea è davvero stupenda, eccezionale, meravigliosa e anche di più…


  66. [...] a raccogliere un sacco di volontari che vogliono contribuire a formare BeeSeek. Esso si tratta (come spiegato nel blog di Simone “Ubuntista” Brunozzi) di un motore di ricerca opensource in cui tutti coloro [...]


  67. [...] a proposito: BeeSeek compie un anno oggi, 10 giugno! Posted by ubuntista Filed in Beeseek Tags: [...]


I commenti sono chiusi.

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.

%d blogger cliccano Mi Piace per questo: