# Requisitos de software

## Sistema operativo

GBDS puede instalarse en los siguientes sistemas operativos:

* CentOS 7
* Red Hat 7
* Red Hat 8
* Oracle Linux 7
* Oracle Linux 8

## Hadoop

GBDS se basa en Apache Hadoop versión 3.1, que es una colección de software de código abierto. Hadoop proporciona herramientas multiuso para sistemas paralelos y escalables. Actualmente, GBDS está integrado con los siguientes componentes de Hadoop:

* **Ambari**: Aprovisionamiento, gestión y monitoreo de un clúster Hadoop.
* **Kafka**: Sistema de flujo distribuido para la integración de datos en tiempo real.
* **Zookeeper**: Sistema de coordinación que permite la sincronización entre un clúster.
* **HBase**: Sistema de gestión de base de datos no relacional.
* **HDFS**: Sistema de archivos distribuidos diseñado para ejecutarse en *hardware de uso general*.

## Base de datos

GBDS utiliza dos sistemas de base de datos diferentes, relacional y no relacional:

* **HBase** Para imágenes biométricas y plantillas.
* **MySQL** para metadatos, como transacciones, excepciones, casos criminales, perfiles biométricos y latentes no resueltas.

{% hint style="success" %}
Se recomienda MySQL, ya que algunos componentes de Hadoop dependen de él internamente, lo que facilita la interoperabilidad entre ellos, pero es posible adaptarlo a cualquier otro sistema de base de datos SQL.
{% endhint %}

## Balanceo local

El modelo de extracción de plantillas a partir de una imagen requiere más recursos que la comparación biométrica entre plantillas y se realiza en el *manejador de API de GBDS*. Para optimizar el uso del hardware, GBDS está altamente paralelizado y cada nodo en un clúster debe ser capaz de recibir solicitudes de la API, si está configurado para ello; por lo tanto, se recomienda el uso de un balanceador de carga para distribuir las solicitudes equitativamente entre los nodos, con el objetivo de alcanzar el mejor rendimiento. De este modo, no habrá ningún nodo sobrecargado en el clúster.

Es posible usar balanceadores de carga tanto en hardware como en software. Una solución simple de software para el balanceo de carga es HAProxy, un software de código abierto y gratuito que proporciona herramientas de balanceo de carga y proxy de servidor.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.griaule.com/gbs/es/instalacion-de-gbds/softwarerequirements.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
