Desarrollo De Motores De Busqueda Open Source Ortega Doncel

Desarrollo De Motores De Busqueda Open Source Ortega Doncel Precio: $818
Datos del Vendedor:

GUSTR3S


Comprar producto

LIBRO FÍSICO - NUEVO - ORIGINALEl desarrollo de motores de búsqueda ha crecido en los últimos años gracias al uso de herramientas y frameworks open source, pues facilitan una base sobre la cual realizar nuestras aplicaciones orientadas a la extracción y búsqueda de diferentes fuentes de datos.Si desea adquirir los conocimientos necesarios para dominar las principales herramientas open source, las librerías y los frameworks, ha llegado al libro indicado. Este manual le proporciona, desde un enfoque teórico-práctico, todos los conceptos e instrucciones que le permitirán construir desde cero motores de búsqueda utilizando los lenguajes de programación Java y Python.Gracias a los contenidos del libro:• Conocerá la estructura y naturaleza de un motor de búsqueda, así como la importancia de los sistemas de búsqueda y recuperación de la información.• Aprenderá los principales motores de búsqueda open source y su funcionamiento interno.• Dominará las diferentes herramientas para desarrollar motores de búsqueda utilizando frameworks de desarrollo dentro de los ecosistemas de programación Java y Python.Además, con el objetivo de obtener el máximo provecho de las herramientas y facilitar el seguimiento de las prácticas del libro, en la primera página se proporciona el acceso al repositorio con el código de los ejemplos desarrollados.Hágase con el libro y descubra las principales herramientas que todo desarrollador e ingeniero de software debe dominar para desarrollar sus propios motores de búsqueda.INTRODUCCIÓN………………………………………………………………………………. 1CAPÍTULO 1INTRODUCCIÓN A LOS MOTORES DE BÚSQUEDA………………………… 31.1 Definición de motores de búsqueda………………………………………….. 41.2 ¿Por qué necesito un motor de búsqueda?………………………………… 51.2.1 Extracción de texto en documentos…………………………………. 51.2.2 Operaciones de lectura……………………………………………………. 61.2.3 Esquema flexible……………………………………………………………… 61.3 Funcionamiento de un motor de búsqueda……………………………….. 71.3.1 Buscadores de directorios………………………………………………… 81.3.2 Buscadores jerárquicos…………………………………………………….. 81.3.3 Spiders (arañas o crawlers)……………………………………………… 81.4 Proceso de indexación………………………………………………………………. 101.4.1 Rendimiento en la indexación de documentos………………… 101.4.2 Stopwords……………………………………………………………………….. 111.4.3 Steamming………………………………………………………………………. 111.5 Recuperación de la información………………………………………………… 121.5.1 Extracción de información………………………………………………. 141.5.2 Sistema de búsqueda/respuesta……………………………………….. 151.6 Motores de búsqueda e indexadores…………………………………………. 151.6.1 Lucene…………………………………………………………………………….. 171.6.2 Índice invertido………………………………………………………………. 191.6.3 Apache Solr……………………………………………………………………… 191.6.4 ElasticSearch…………………………………………………………………… 191.6.5 Otros motores de búsqueda……………………………………………… 201.7 Herramientas de procesamiento de lenguaje natural (PLN)…………21 CAPÍTULO 2APACHE LUCENE……………………………………………………….. 252.1 Introducción a Apache Lucene………………………………………………….. 252.2 Módulos y funcionalidades de Apache Lucene………………………….. 282.3 Arquitectura de Apache Lucene………………………………………………… 312.3.1 Proceso de tokenización y búsqueda en Apache Lucene…… 342.4 Trabajar con Apache Lucene…………………………………. 362.4.1 Configuración del entorno………………………………………………. 362.4.2 Crear un índice………………………………………………………………… 402.4.3 Crear y escribir documentos en un índice……………………….. 432.5 Realizar búsquedas en Apache Lucene………………………………………. 472.5.1 Obtención de un IndexSearcher………………………………………. 472.5.2 Proceso de búsqueda con IndexSearcher………………………….. 482.5.3 Crear consultas con Lucene QueryParser…………………………. 492.5.4 Sintaxis de las consultas en Apache Lucene…………………….. 532.6 Búsqueda de información con Apache Lucene………………………….. 552.7 Búsqueda en múltiples índices de Lucene…………………………………. 582.8 Herramientas de administración de Lucene……………………………… 602.9 Herramientas de búsqueda que usan Apache Lucene………………… 612.9.1 Krugle……………………………………………………………………………… 612.9.2 Google Dataset Search……………………………………………………… 622.9.3 Otros repositorios y portales……………………………………………. 63CAPÍTULO 3APACHE SOLR…………………………………………………… 653.1 Introducción a Apache Solr……………………………………………………….. 653.2 Arquitectura de Apache Solr……………………………………………………… 673.3 Indexación e índice invertido en Apache Solr……………………………. 693.3.1 Relevancia y filtro en las búsquedas………………………………… 693.4 Instalación de Solr…………………………………………….. 703.5 Configurar Apache Solr…………………………………………….. 753.5.1 Ficheros de configuración y esquema………………………………. 773.5.2 Proceso de indexación……………………………………………………… 823.5.3 Indexación de datos con SimplePostTool…………………………. 84 3.5.4 Esquema administrado en Apache Solr……………………………. 883.5.5 Añadir información al índice…………………………………………… 903.6 Búsqueda de documentos…………………………………………………………. 923.6.1 Usar la API REST……………………………………………………………… 943.6.2 Consultas básicas de Solr…………………………………………………. 973.6.3 Componente stats (estadísticas)……………………………………… 1023.7 Consultas avanzadas de Solr………………………………… 1033.7.1 Paginación y clasificación………………………………………………… 1033.7.2 Navegación facetada en Solr…………………………………………….. 1053.7.3 Búsqueda de facetas en Solr…………………………………………….. 1093.8 Componentes de una petición en Solr………………………………………. 1143.8.1 Controladores Request Handler………………………………………. 1143.9 Analizadores en Apache Solr…………………………………………………….. 1163.9.1 Definir campos personalizados………………………………………… 1173.9.2 Configuración de los tipos de campos……………………………… 1203.9.3 Propiedad score……………………………………………………………….. 1233.10 Monitorización del rendimiento de Apache Solr…………….. 1243.10.1 Página de plugins/estadísticas de Apache Solr……………….. 1243.11 Ejecución en modo Cloud…………………………………….. 1273.11