Buscador

De Wikipedia, la enciclopedia libre.
Saltar a navegación Saltar a búsqueda

Como parte de la tecnología de Internet , un motor de búsqueda (en inglés, motor de búsqueda) es un sistema automatizado que, a pedido, analiza un conjunto de datos (a menudo recopilados por sí mismo) y devuelve un índice de contenido disponible [1] clasificando automáticamente en base sobre fórmulas estadístico-matemáticas que indican el grado de relevancia dada a una determinada clave de búsqueda . Uno de los campos en los que los buscadores encuentran mayor uso es el de la recuperación de información y en la web . Los buscadores más utilizados en 2017 fueron: Google , Bing , Baidu , Qwant , Yandex , Ecosia , DuckDuckGo .

Descripción

Logotipo de Google , el motor de búsqueda más utilizado del mundo

Conceptualmente un motor de búsqueda es un sistema muy similar a una aplicación web o un sistema cliente - servidor , a través de Internet , donde el cliente es representado por el navegador web del usuario que, a petición del mismo, se conecta a un servidor que a su vez realiza una consulta de búsqueda, utilizando algoritmos de búsqueda adecuados, en bases de datos ( bases de datos distribuidas ). En el análisis de los resultados aportados, un componente fundamental es el denominado crawler o spider. Un buen buscador es aquel que consigue encontrar la mayor cantidad de contenidos en función del tipo de solicitud, ordenándolos por importancia y relevancia según la especificación de búsqueda.

Fases operativas

El trabajo de los buscadores se divide principalmente en tres fases:

  • análisis del campo de acción (mediante el uso de rastreadores específicos);
  • catalogación del material obtenido;
  • respuesta a las solicitudes de los usuarios.

Catalogación

Tras el análisis de las páginas, según criterios que varían de un motor a otro, algunas de ellas se insertan en la base de datos y en el índice del buscador.

La parte textual almacenada durante la fase de análisis se analizará para proporcionar respuestas a las búsquedas de los usuarios. Muchos motores de búsqueda web también hacen una copia de los datos textuales de cada página almacenada disponible para cuando el recurso original es inaccesible: esta función se llama almacenamiento en caché .

Respuesta

Responder a las solicitudes de los usuarios implica la necesidad de enumerar los sitios en orden de relevancia con respecto a la solicitud recibida.

Para establecer la relevancia de un sitio, se buscan en la base de datos los documentos que contienen la palabra clave ingresada por el usuario, luego de lo cual cada motor de búsqueda utiliza sus propios algoritmos para clasificar las páginas, verificando, por ejemplo, cuántas veces se repiten las palabras clave, cómo Muchos enlaces reciben ese documento, en qué puntos de la página se colocan las palabras clave, cuántos sitios en la base de datos contienen enlaces a esa página o cuántas veces un usuario ha visitado ese sitio después de una búsqueda.

Refinamiento de la investigación

La capacidad de refinar la búsqueda varía de un motor a otro, pero la mayoría de ellos le permiten utilizar operadores booleanos : por ejemplo, puede buscar " Ganímedes Y satélite NO copero " para buscar información sobre Ganímedes concebida como un planeta y no como una figura mitológica .

En Google y en los motores más modernos es posible afinar la búsqueda según el idioma del documento, las palabras o frases presentes o ausentes, el formato del archivo ( Microsoft Word , PDF , PostScript , etc.), según la fecha. de la última actualización y más. También puede buscar contenido en un sitio en particular, por ejemplo, " Ganímedes sitio: nasa.gov " buscará información sobre Ganímedes en el sitio de la NASA .

En Exalead hay una parte especial para refinar la búsqueda de manera más intuitiva.

Indexación

Icono de lupa mgx2.svg Mismo tema en detalle: Indexación (motores de búsqueda) .

La indexación se refiere a la inserción de un sitio web en la base de datos de un motor de búsqueda. La indexación de un sitio web, en otras palabras, es la forma en que el sitio es adquirido e interpretado por los motores de búsqueda y, por tanto, aparece en sus páginas de respuesta a las consultas de los usuarios de la web.

Posicionamiento

Icono de lupa mgx2.svg Mismo tema en detalle: Posicionamiento (buscadores) .

El término posicionamiento significa la adquisición de visibilidad entre los resultados de los buscadores. Más concretamente, es la operación mediante la cual se optimiza el sitio para aparecer en los resultados en una posición lo más favorable y relevante posible.

Mejoramiento

Icono de lupa mgx2.svg Mismo tema en detalle: Optimización (motores de búsqueda) .

El término optimización de motores de búsqueda significa, en el lenguaje de Internet, todas aquellas actividades encaminadas a mejorar la visibilidad de un sitio web en los motores de búsqueda (como por ejemplo Google, Yahoo !, etc.) con el fin de mejorar (o mantener) el posicionamiento en las páginas de respuesta a las consultas de los usuarios de la web. A su vez, el buen posicionamiento de un sitio web en las páginas de respuesta de los buscadores es funcional a la visibilidad de los productos / servicios vendidos.

Resultados patrocinados

Los motores de búsqueda también proporcionan resultados patrocinados, es decir, se muestran de forma más destacada en los sitios web de las SERP ( páginas de resultados del motor de búsqueda ) de empresas que pagan para estar entre los primeros resultados al buscar términos (llamados palabras clave ) que están en relación con el área de Competencia de la propia empresa. Los resultados del motor patrocinado también pueden aparecer en los sitios que participan en su programa de afiliados. En particular, Google permite que los resultados pagados comprados con el programa AdWords aparezcan en sus páginas de resultados (claramente distintos de los resultados "naturales"). Además de esto, también ofrece un servicio de patrocinio que atiende a todos los sitios que tienen ciertos requisitos, llamado AdSense. Google AdSense (a menudo abreviado como Google AS) utiliza la capacidad del motor de búsqueda para interpretar el tema de la página donde se coloca el código apropiado para entregar anuncios temáticos. Yahoo! Search ha anunciado la llegada de un programa similar llamado Panamá.

Motores de búsqueda populares

Logotipo de Yahoo
Logotipo de Bing
Logotipo de Baidu
Logotipo de Ask.com
Logotipo de Ecosia

Los buscadores con mayor relevancia internacional en 2020 son:

  • Google , además de ser con mucho el más utilizado directamente, también es el que tiene el mayor número de sitios que utilizan la base de datos , también debido al programa de patrocinio "AdSense para búsqueda" que pertenece al programa más grande de AdSense.
  • Microsoft Bing , motor creado por Microsoft y utilizado por Microsoft Network, más conocido como MSN .
  • Baidu , un motor de búsqueda chino que recopila una base de usuarios tan vasta como creciente, dado el poder abrumador total sobre los otros motores de búsqueda utilizados en China .
  • Yandex , el motor con mayor participación de mercado en Rusia .

Estos 4 motores de búsqueda están equipados con tecnología patentada.

Otras menciones importantes son:

  • Qwant , un motor de búsqueda europeo que tiene como objetivo ofrecer al usuario una mayor privacidad.
  • DuckDuckGo , motor de búsqueda amigable con la privacidad.
  • Ecosia , un motor de búsqueda ecológico alemán, produce menos dióxido de carbono que los servidores de la competencia; El 80% de los ingresos se utilizan para plantar árboles en todo el mundo y reducir la deforestación , y se fundó en colaboración con WWF .
  • Startpage , uno de los pocos buscadores del mundo que garantiza la privacidad , ya que no almacena ni registra las IP de quienes realizan búsquedas.
  • Yahoo! , ahora totalmente basado en la tecnología Bing.
  • Ask.com

Entre estos últimos, los únicos que están parcialmente equipados con un índice propietario son Qwant y parcialmente DuckDuckGo.

En Italia

Logotipo de Qwant
Logotipo de Yandex
Logotipo de Virgilio.it
  • Google también es utilizado por Libero , Virgilio y Tiscali (que cualquier persona puede verificar inmediatamente). En Italia la brecha entre el uso de Google y los demás es tan grande que, aunque los datos son obviamente variables, el porcentaje de búsquedas realizadas en Google es igual a un múltiplo de la suma de todos los demás buscadores juntos.
  • Istella Italia es un motor de búsqueda desarrollado por Tiscali pero, aunque accesible, no se ha actualizado desde 2016

Lista

Año Motor Evento Motor Estado actual
1993 suizo W3Catalog Lanzamiento Inactivo
1993 suizo Aliweb Lanzamiento Inactivo
Escocia JumpStation Lanzamiento Inactivo
Estados Unidos Gusano WWW Lanzamiento Inactivo
1994 Estados Unidos WebCrawler Lanzamiento Bing Activo
Estados Unidos Go.com Lanzamiento Inactivo
Estados Unidos Infoseek Lanzamiento Inactivo
Estados Unidos Lycos Lanzamiento Bing Activo
Italia Spenki Fundación Inactivo
1995 Estados Unidos AltaVista Lanzamiento Inactivo, redirigido a Yahoo!
Corea del Sur Daum Lanzamiento Activo
Estados Unidos Magallanes Lanzamiento Inactivo
Estados Unidos Excitar Lanzamiento Inactivo, solo noticias
Portugal Lanzamiento Inactivo, solo noticias
Estados Unidos Yahoo! Lanzamiento Inactivo (se convirtió en Yahoo! Search)
1996 Estados Unidos Dogpile Lanzamiento Agregador Activo
Estados Unidos Inktomi Fundación Inactivo, adquirido por Yahoo!
Estados Unidos HotBot Fundación Activo
Italia Arianna Fundación Inactivo, incorporado a Libero
Italia Multisoft Fundación Inactivo
Italia Virgil Fundación Activo, resultados de Google
Estados Unidos Pregúntale a Jeeves Fundación Inactivo (rebautizado a ask.com)
1997 Estados Unidos Luz del norte Lanzamiento Inactivo
Rusia Yandex Lanzamiento Dueño Activo
1998 Estados Unidos Google Lanzamiento Dueño Activo
Europa Países Bajos Ixquick Lanzamiento Agregador También activo como página de inicio
Estados Unidos Búsqueda de MSN Lanzamiento Inactivo, conviértete en Bing
Corea del Sur empas Lanzamiento Inactivo (combinado con NATE)
1999 Noruega Alltheweb Lanzamiento Inactivo (URL redirigida a Yahoo! )
Canadá GenieKnows Lanzamiento Inactivo
Corea del Sur Naver Lanzamiento Activo
Estados Unidos Theoma Fundación Pedir Activo
Estados Unidos Vivísimo Fundación Inactivo, IMB
Italia superEva Lanzamiento Inactivo, solo análisis de tendencias
2000 porcelana Baidu Fundación Dueño Activo
Francia Exalead Lanzamiento Dueño Activo
Estados Unidos Gigablast Lanzamiento Dueño Activo
2001 Francia Kartoo Lanzamiento Inactivo
2003 Inglaterra Info.com Lanzamiento Bing Activo
Scroogle Lanzamiento Inactivo
2004 Estados Unidos Yahoo! Buscar Lanzamiento final Bing Activo
Estados Unidos A9.com Lanzamiento Inactivo
porcelana Sogou Lanzamiento Activo
2005 Estados Unidos Búsqueda en vivo de Windows Lanzamiento final Inactivo
Estados Unidos GoodSearch Lanzamiento Inactivo
Estados Unidos Búscame Lanzamiento Inactivo
2006 porcelana Regular Lanzamiento Activo
Francia unión Europea Quaero Fundación Inactivo
Estados Unidos Search.com Fundación Dueño Activo (búsqueda CBS solamente)
Estados Unidos Ask.com Lanzamiento Activo
Estados Unidos Búsqueda en vivo de Windows Lanzamiento Inactivo
Estados Unidos ChaCha Lanzamiento beta Inactivo
India Guruji.com Lanzamiento beta Inactivo
2007 Estados Unidos Wikiseek Lanzamiento Inactivo
Estados Unidos Sproose Lanzamiento Inactivo
Estados Unidos Búsqueda de Wikia Lanzamiento Inactivo
2008 Estados Unidos Cuil Lanzamiento Inactivo
Estados Unidos Set de poder Lanzamiento Inactivo
Rusia Picollator Lanzamiento Inactivo
Estados Unidos Viewzi Lanzamiento Inactivo
Inglaterra Boogami Lanzamiento Inactivo
Estados Unidos LeapFish Lanzamiento Inactivo
Alemania Forestle Lanzamiento Inactivo
Australia Ecocho Lanzamiento Inactivo
Estados Unidos Pato Pato a ganar Lanzamiento Algoritmos patentados de Bing + Activo
2009 Inglaterra Wolfram Alpha Lanzamiento Dueño Activo
Estados Unidos Bing Lanzamiento Dueño Activo
Estados Unidos Yebol Lanzamiento Inactivo
Estados Unidos Mugurdy Lanzamiento Inactivo
Estados Unidos Explorador (Gobio) Lanzamiento Inactivo
Estados Unidos Coozila! Lanzamiento Inactivo
Alemania Ecosia Lanzamiento Algoritmos patentados de Bing + Activo
Corea del Sur NATE Lanzamiento Activo
2010 Estados Unidos iAlgas Lanzamiento Activo
Estados Unidos Blekko Lanzamiento Inactivo (vendido a IBM)
Estados Unidos Cuil Lanzamiento Inactivo
Rusia Yandex (Versión

en inglés)

Lanzamiento Activo
2011 Estados Unidos YaCy Lanzamiento Inactivo (software autohospedado)
2012 Italia Volunia Lanzamiento Inactivo
Italia Idea Lanzamiento Inactivo
2013 Italia Istella Lanzamiento Dueño Accesible, inactivo
Europa Francia Q quiero Lanzamiento Algoritmos patentados de Bing + Activo
Estados Unidos Aoohe Lanzamiento Inactivo
Vietnam Coc Coc Lanzamiento Activo
Bandera de Kurdistan.svg Egerin Lanzamiento Motor de búsqueda activo, kurdo / sorani
2014 Searx Lanzamiento Agregador Activo
suizo Swisscows Lanzamiento Bing Activo
2015 Europa Alemania Cliqz Lanzamiento Dueño Inactivo
2017 Francia Xaphir Beta Dueño Inactivo, adquirido por Qwant [2]

La mayoría de los motores de búsqueda que operan en la web son administrados por empresas privadas que utilizan algoritmos patentados y bases de datos que se mantienen en secreto. Sin embargo, existen varios intentos de crear motores de búsqueda basados ​​en software libre , algunos ejemplos son:

Otros motores de búsqueda activos a partir de marzo de 2020 son: Metager (para privacidad), Serch Encrypt, SearX, Gibiru, YaCy (descentralizado), Yippi, Lukol y Boardreader.

Perspectivas de desarrollo

Las innovaciones más recientes en la producción de algoritmos y sistemas de recuperación de información se basan en el análisis semántico de términos y la consecuente creación de redes semánticas . La propia Google ha adoptado sistemas para la prevención de errores y la contextualización de los resultados.

Es razonable predecir que dentro de unos años los buscadores basarán sus tecnologías tanto en el análisis cuantitativo de los contenidos (las propias palabras), como sobre todo en el cualitativo (el sentido de las palabras). Los motores de búsqueda podrán, por ejemplo, distinguir el significado de la palabra " pesca " según el contexto en el que esté contenida (para entender si es la fruta, el deporte u otro). Para avanzar en esta dirección, Google adquirió Oingo (antes conocido como "el motor de los conceptos") y la tecnología de la empresa que lo creó, Applied Semantics.

Web 2.0 y el futuro de los motores de búsqueda

Icono de lupa mgx2.svg Mismo tema en detalle: Web 2.0 .

La nueva frontera de los motores de búsqueda es la web 2.0 . Al adoptar esta lógica, muchos motores y directorios internacionales apuntan a una mayor participación de los usuarios en la creación de contenido de motores de búsqueda, con el fin de eliminar cualquier uso de arañas o enlaces patrocinados. Con esta lógica, los usuarios pueden denunciar los enlaces ellos mismos y decidir si dar o no popularidad a los sitios informados.

La Web 2.0 también apunta a una facilidad de uso más rápida, rápida e intuitiva gracias al uso de metabuscadores (o múltiples motores de búsqueda) como:

Nota

  1. ^ Alta Vista , p. 6 .
  2. ^ ( FR ) Qwant represe Xilopix, creator du moteur Xaphir - Le Monde Informatique , en LeMondeInformatique . Consultado el 15 de enero de 2018 .
  3. ^ Winner tinooo.com un motor de búsqueda - Winner tinooo.com un motor de búsqueda que con unos pocos clics se puede personalizar para encontrar cualquier cosa en la web.

Bibliografía

  • Guía de técnicas de investigación en Internet , Milán, Loeacher, 2000.

Artículos relacionados

Otros proyectos

enlaces externos

Control de autoridad Tesauro BNCF 37517 · LCCN (EN) sh00001050 · GND (DE) 4423007-2 · BNF (FR) cb13558463d (fecha) · NDL (EN, JA) 00,964,483
Internet Portal de Internet : accede a las entradas de Wikipedia relacionadas con Internet.