IPS es Propósito y funciones de los sistemas de recuperación de información
IPS es Propósito y funciones de los sistemas de recuperación de información

Video: IPS es Propósito y funciones de los sistemas de recuperación de información

Video: IPS es Propósito y funciones de los sistemas de recuperación de información
Video: Así se hace Locomotoras 2024, Diciembre
Anonim

Es difícil para una persona moderna imaginar la vida sin Internet y sin acceso casi instantáneo a las fuentes de información. El usuario rara vez piensa en cómo se lleva a cabo la búsqueda del contenido deseado en la red. Pero esto es muy interesante.

Un sistema de recuperación de información (IPS) es un sistema complejo de software y hardware que selecciona información a pedido del usuario. La información se almacena en servidores en forma digital, como solían estar los libros en los estantes de las bibliotecas. El sistema consta de muchos subsistemas. Cada uno realiza su tarea en el proceso de procesar la solicitud del usuario y proporcionarle información en forma de texto o sonido. La multiplicidad de tareas a resolver determina la complejidad de la arquitectura de los modernos sistemas de recuperación de información (una abreviatura de sistema de recuperación de información). Una especie de "caja negra": en la entrada - el texto de la solicitud, lo que hay dentro - se desconoce, en la salida - información completa.

Archivo de tarjeta en la vida real
Archivo de tarjeta en la vida real

Flujos de entrada

Solicitudes de información que una persona forma en forma de texto en la pantalla de su dispositivo,constituyen una pequeña parte de las solicitudes procesadas por el motor de búsqueda. Los principales conjuntos de consultas de búsqueda están formados por robots que aceptan una solicitud humana y realizan una búsqueda de varios pasos y retroalimentación con el usuario. Los sistemas de recuperación de información incluyen los conocidos Google, Yandex y otros, que procesan millones de solicitudes diariamente.

Objetos de búsqueda de origen

El conjunto de objetos iniciales de interés para la búsqueda son documentos, registros, videos, imágenes y más. Se crean fuera de la IPS. El sistema general de almacenamiento y recuperación de información debe tener un sistema bibliográfico incorporado, una especie de catálogo que le permita buscar cualquier tipo de objetos.

Los objetos o sus transformaciones digitales se convierten en un "recurso de entrada" al IPS. Es entre ellos que se selecciona la información que necesita el usuario.

Buscar información
Buscar información

Fuentes externas

La vista de selección de información utiliza fuentes de conocimiento externas. Esta es la información que el usuario está buscando. El título de la película, una cita del libro y más. Para una búsqueda informática, esta información debe traducirse a una consulta en un lenguaje algorítmico. En el IPS esto se hace utilizando el bloque de creación, indexación y desarrollo de consultas.

Idealmente, estos tres procesos (representación, indexación y desarrollo de consultas) deberían basarse en fuentes de conocimiento idénticas, pero en la práctica, esto no se puede lograr.

Las fuentes de conocimiento deben revisarse y actualizarse constantemente, y la actualización debe ser idéntica ysincronizado Y una fuente externa de conocimiento siempre precede cronológicamente a su uso en motores de búsqueda para una consulta, a veces por varios años.

Sistema de recuperación de información
Sistema de recuperación de información

Actuaciones

Las representaciones de los objetos originales se componen de datos de entrada en alguna combinación o se transforman de acuerdo con las reglas y algoritmos de un sistema de recuperación de información en particular.

Las vistas son copias más o menos transformadas del objeto de búsqueda original. En la colección de textos completos inéditos, cada texto es su propia representación. En la colección de objetos de museo y artefactos, la representación puede ser una descripción transformada del objeto con su imagen. En algunos casos, la representación puede derivarse en parte del objeto original y en parte de la descripción: en los motores de búsqueda bibliográficos, las representaciones se derivan del objeto; por ejemplo, el título, el nombre del autor se combinarán con la anotación de la obra.

Encontrar lo que necesitas
Encontrar lo que necesitas

Índice de búsqueda

Dado que la información en los sistemas de recuperación de información se almacena en forma de representación, es lógico suponer que la búsqueda se realiza de acuerdo con la representación y, después de la selección, se entrega al usuario. En la práctica, este no es el caso. Por ejemplo, los catálogos de bibliotecas en línea actuales suelen restringir las búsquedas a unos pocos campos: autor, título y subtítulos dentro de una vista que contiene otros campos que no se buscan. Esta es razón suficiente para que sea necesario distinguiruna vista y un índice de búsqueda, que es la parte de búsqueda de la vista. Define todo lo que debería ser buscable. Un índice de búsqueda, como la vista y el objeto de origen, se puede dividir en subíndices independientes para proporcionar búsquedas específicas más precisas

Los motores de búsqueda suelen tener una estructura sintética interna para hacer coincidir los resultados de búsqueda válidos. Esta estructura es el segundo componente del índice de búsqueda.

Desde el punto de vista del procedimiento, el proceso de indexación se puede implementar de diferentes maneras: se puede obtener un índice de búsqueda mediante:

  • copiar literalmente una representación buscable;
  • copiando los detalles de la vista. Esto puede ser parte o la totalidad de las vistas que existen físicamente solo como fragmentos, distribuidos de acuerdo con las reglas para crear un índice para la búsqueda, que se recopilarán cuando sea necesario.
Gestión de búsqueda
Gestión de búsqueda

Reglas de diseño de solicitudes y solicitudes formales

La ingeniería de consultas es una función que media entre una consulta de usuario y una consulta formal. Transforma la consulta del usuario, comparándola con los diccionarios de comandos de recuperación, la especificación del índice y el índice antes de la recuperación. En los albores del desarrollo de IPS, esta función se asignaba tradicionalmente a especialistas en TI calificados.

El desarrollo de consultas de computadora que pueden hacer coincidir consultas de diccionario en un sistema de índice de búsqueda se conoce comúnmente como el módulo de "ingreso de diccionario". La automatización de esta función es prometedora y ofrece oportunidades para métodos de búsqueda expertos y probabilísticos.

Una solicitud formal se convierte en una solicitud formal después de que se haya convertido la solicitud del usuario. Ejemplos de tales transformaciones formales incluyen truncamiento, sustitución, normalización, vectorización y otras transformaciones de la representación "externa" en las representaciones "internas" de la computadora IPS (descifrado - sistema de recuperación de información).

Conjuntos de enlaces de documentos extraídos

El conjunto resultante de fuentes de información es lógicamente un subconjunto de las vistas creadas por las reglas de coincidencia aplicadas a la consulta formal mediante un índice de búsqueda.

Por lo general, pero no necesariamente, existe un proceso de clasificación independiente para el conjunto de información recuperada. Los catálogos de bibliotecas en línea generalmente reordenan los conjuntos recibidos alfabéticamente por autor antes de mostrarlos. En los sistemas de recuperación de información que producen clasificaciones estrictas, el orden de clasificación precede a cualquier reordenación.

Análisis de los datos
Análisis de los datos

Flujos de salida

La salida de los resultados de la búsqueda se realiza tradicionalmente en la pantalla, más a menudo en forma de un flujo de objetos que se usarán en otro lugar o para algún otro propósito, completa el bucle de búsqueda principal. Dichos flujos se pueden enviar a los dispositivos de visualización, almacenamiento para procesamiento posterior o uso como flujos de entrada para otros servicios de selección.

Los sistemas de recuperación de información permiten la retroalimentación deel resultado de cualquier proceso de selección. La salida de cualquier proceso puede ser retroalimentación a otros procesos. La retroalimentación puede proporcionar la base para el juicio de expertos en cualquier etapa.

Recomendado: