Did the “search king” (Google) start itself as two guys in a garage?

July 2, 2007 at 8:41 am | In Linguistic flashes, Techies |

Como os dejaba caer [P-14JUN], una pequeña start-up de un suburbio de Melbourne [las relaciones de competencia entre Melbourne y Sydney son como las de Santa Cruz y Las Palmas o Madrid y Barcelona; una frase común es "vaya, vaya, aquí no hay playa, esto... Pity Melb doesn´t have any beaches" (sí tiene, pero son chungas y no como Sydney que tiene a Bondi, que es como la playa australiana por excelencia) o el chistecillo aussie :"Bad news, there is a meteor heading straight for Oz (=Australia), good news is: It´s heading straight for Melbourne", con otras cosas, que alimentan su mala fama, por ejemplo, la más alta tasa de criminalidad del país, el último lunes de mayo a las 8 de la mañana en pleno centro de la ciudad uno mató a un hombre e hirió a otras 2 personas], creada por el desarrollador de software Rob Gabriel que acaba de colgar, como versión pública beta, en internet MyLiveSearch, [me encanta que con Google puedas buscar páginas de la competencia, me recuerda, en plan comparación a lo de que los asesinos se aprovechan de las propias reglas (para otro tipo de reglas P-ayer) de la democracia, ahí radica su fuerza y el no somos como ellos, que quede claro, aunque en este caso sea recíproco) que se precia de contar con un motor de búsqueda que da mejores resultados que el "rey de las búsquedas" que os ponía arriba. Y da resultados más pertinentes que Google porque es una búsqueda verdaderamente live (en directo: ahora, en este mismísmo momento: retroalimentación inmediata).

El motor de búsqueda de Google trabaja construyendo un amplísimo índice de páginas web, con "arañas" (con los bots de [P-28JUN] a lo Minority Report, de Spielberg, en otro sentido, o sea, spider = rastreador, y su verbo, en inglés, ¡véte aprendiendo!: trawl o crawl -por lo de la araña-) automáticas que rastrean (trawl, ¿recuerdas?) a través de miles de millones de páginas al año. Sin embargo, ésto representa sólo una pequeña fracción de la enorme y desperdigada internet y el índice nunca puede estar totalmente actualizado a la milésima de segundo. Las búsquedas de Yahoo! y, a pesar de su nombre, Microsoft Live, trabajan de la misma forma. MyLiveSearch es fundamentalmente diferente. Trabaja a través de un programa auxiliar complementario (un plug-in, vamos) de un pequeño navegador. Los términos de búsqueda que se ponen en Google u otras bases de datos de búsqueda indexada producen resultados que son tratados como “puntos de arranque”  junto a los marcadores favoritos de los internautas y otras webs P2P (portales verticales) populares. Ahí, la búsqueda live (en tiempo real) se hace cargo, avanzando cuidadosamente (rastreando) a través de cientos de páginas conectadas a esos puntos de partida en busca de más información pertinente para la búsqueda. Gabriel apunta que los resultados regresan en cuestión de segundos y, casi siempre son más abundantes, detallados y útiles que una búsqueda estándar basada en índices. Su producto, dice, también busca la “web invisible” de páginas web generadas dinámicamente, con las que los motores de búsqueda tradicionales tienen problemas de indexación.

“Supone la posibilidad de cambiar la forma en que la peña busca en internet. Google no puede buscar cada página, cada día (para construir su índice), porque la web es mogollón de dinámica y cambia muy rápidamente… MyLiveSearch convierte a tu ordenata en una “superaraña” para buscar en tiempo real. Esta tecnología puede ser incorporada en cualquiera de los grandes motores de búsqueda, mejorándolos”.

Un representante de desarrollo de Google ya se ha reunido con el equipo de MyLiveSearch que se sepa, al menos 2 veces: la 1ª, cuando la tecnología estaba en un estado incipiente y, otra vez, la última semana de mayo. Hay que recordar que por ejemplo, Google Maps [P-11ABR] fue una pequeña start-up aussie antes de ser absorbida. (Gabriel tuvo la idea original hace 10 años y lleva trabajando en MyLiveSearch 2 años junto con su hermano Mark y el ingeniero de sistemas, Mende Jurukovski). Google, como sus competidores, tiene una importante historia de hacerse con tecnología que podría ayudar a sus rivales; sin ir más lejos, en abril de 2006 Google compró los derechos de un algoritmo avanzado de búsqueda de textos inventado por Ori Allon, un estudiante australiano de 26 añitos y se lo llevó a trabajar a su cuartel general de Mountain View (California).

La live search (las búsquedas en tiempo real) son una solución: a pesar de los inmensos recursos informáticos de Google, el motorcito Google (”googlebot”) no puede seguir las actualizaciones a la red en tiempo real. Las páginas web más populares son re-rastreadas más frecuentemente. Fuera de las páginas con más visibilidad (el internet mainstream), las visitas del googlebot son más raras. Incluso llegar a sitios que se promocionan activamente a sí mismos, les puede llevar semanas o meses aparecer en (o ser descubiertos por) el índice de Google. Algunos expertos calculan que Google tiene indexado incluso menos de un quinto de la red. Para solucionar eso estaría lanut.jpg indexación en tiempo real, donde las páginas son presentadas al motor de búsqueda e indexadas inmediatamente. Otra solución sería el rastreo web distribuido ad hoc. El proyecto de código abierto de Nutch espera que decenas, cientos e incluso miles de motores de búsqueda de webs especializadas propulsadas por Nutch puedan combinarse en un índice más detallado que cualquier sitio sólo (individualmente).

No Comments yet »

RSS feed for comments on this post. TrackBack URI

Leave a comment

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Blog at WordPress.com. | Theme: Pool by Borja Fernandez.
Entries and comments feeds.