Salta al contenuto
  • Delicious
  • Twitter
  • Anobii
  • Facebook
Ricerca rapida
Cerca articoli per:
tag | autore

Google indicizzerà grazie all’OCR?

google Google indicizzerà grazie allOCR?Sapete già cos’è l’OCR vero? E’ quel sistema che usate per scansionare testi stampati e interpretarli senza doverli riscrivere a manina (tranne qualche correzione). Avete presente?

Ebbene sembra che Google lo userà nei suoi spider…mmmm leggiamo meglio da Merlinox

Su Punto Informatico leggo che Google sembra aver implementato nei suoi bot la capacità di fare OCR, cioè di trasformare testi in formato immagine, in testi in formato testo. OCR è l’acronimo di Optical Character Recognition e indica tutti quei software appunto in grado di interpretare il testo dentro normali immagini bitmap / raster.

A questo punto non mi resta che fare un test. Inserisco questa immagine dentro al mio blog: nell’immagine sono contenute parole non indicizzate da google, parole inesistenti.

Continua…

Post correlati

  • Nessun post correlato

18 Commenti

  1. Merlinox (22 comments) 5 novembre 2008 alle 09:51

    Mitici, quale onore :)
    Per ora però in SERP tutto ancora tace!

  2. Lauryn (3112 comments) 5 novembre 2008 alle 09:57

    hehe tienici aggiornati se si muove qualcosa!

  3. Laura De Masi (295 comments) 5 novembre 2008 alle 10:46

    io ne ho sentito parlare per le polemiche che google avuto riguardo la sezione libri, per nulla accessibile in quanto formata da testi-immagine. Mi pare che sia partito tutto da lì…

  4. Merlinox (22 comments) 5 novembre 2008 alle 14:16

    Cmq tecnicamente non mi pare una cosa assurda. Servizi OCR online ce ne sono già molti.

  5. rgwebdesigner (57 comments) 5 novembre 2008 alle 23:13

    Ma quindi con questo sistema anche immagini contenenti testo scritto con font diverso dall’arial- Tiames new Roman o Geneva Verranno indicizzati?

  6. Lauryn (3112 comments) 6 novembre 2008 alle 08:28

    in teoria sì, e in effetti sarebbe una soluzione ai titoli con font diversi creati graficamente.

    aspettiamo di vedere l’esperimento di merlinox se da i suoi frutti :)

  7. tmille (2 comments) 6 novembre 2008 alle 16:04

    sbaglio o questa cosa renderà “fallibili” i captcha?

  8. Lauryn (3112 comments) 6 novembre 2008 alle 16:34

    è vero! così finalmente scompariranno del tutto :D (li odio)

  9. rgwebdesigner (57 comments) 6 novembre 2008 alle 19:22

    non c’avevo pensato ai captcha…meglio così!!! :D :D:D

  10. Merlinox (22 comments) 7 novembre 2008 alle 09:43

    Un amico nel blog dice che le immagini pare debbano essere PDF. Stavo scrivendo un post sul fallimento del test, ma faccio una prova allegando un PDF e si vedrà!

  11. Lauryn (3112 comments) 7 novembre 2008 alle 09:47

    mmm sì, facci sapere, sarebbe comunque un vantaggio :)

  12. rgwebdesigner (57 comments) 7 novembre 2008 alle 10:32

    mmmm…scusatemi, ma i pdf non sono gia indicizzati?…

  13. Merlinox (22 comments) 7 novembre 2008 alle 10:43

    Il PDF è un formato “prostituta”. Dentro un pdf puoi mettere immagini bitmap, vettoriali e testo. Nonchè ormai anche elementi dinamici e form.

    Google oggi sicuramente indicizza i TESTI all’interno dei PDF. Come capire se sono testi o immagini? Aprite i pdf e provate a selezionare del testo. Se ce la fate e riuscite a incollarlo e editarlo in Notepad allora è testuale :)

  14. rgwebdesigner (57 comments) 7 novembre 2008 alle 12:59

    quindi niente novità….:(
    Non ci vedo nessun vantaggio…

  15. Merlinox (22 comments) 7 novembre 2008 alle 13:28

    Ho aggiornato il post. Ho inserito pure il PDF e poi in un altro blog ho messo il testo text/plain. Forse già lo trovate :)

  16. Merlinox (22 comments) 11 novembre 2008 alle 13:07

    Esperimento fallito:
    http://www.google.it/search?q=misonfotrice&sourceid=navclient-ff&ie=UTF-8&rlz=1B3GGGL_itIT241IT241

    Google si sta aggrappando a qualsiasi altra cosa esclusa la mia immagine!

  17. Lauryn (3112 comments) 11 novembre 2008 alle 14:01

    azz

Trackback

  1. Google OCR: ancora no | MrX 14 novembre 2008 alle 09:38

    [...] Google OCR Test lo possiamo considerare finito. Il post è stato indicizzato, alcuni amici hanno contribuito a spingerlo in SERP ma nessun [...]

Lascia un commento

Iwd Award - Il sito del meseRoberto Gadotti

Vuoi occupare questo spazio gratuitamente per un mese? Partecipa all'Iwd Award!