Redes y Bases de Datos en el Deporte
En el presente trabajo se abordan de forma general los aspectos más relevantes de la aplicación de las tecnologías informáticas, especialmente las redes y bases de datos, a la gestión del conocimiento y la inteligencia en el deporte. Cada tema es suficientemente amplio para llenar varios libros, por tanto consideramos oportuno resaltar los aspectos fundamentales y ofrecer algunos puntos de partida e ideas para el desarrollo posterior en la actividad. Se parte de un enfoque informacional, analizando los problemas prácticos que afronta el informático que trabaja para el deporte y los fenómenos intrínsecos que generan las fuentes de información. A partir de este modelo se va evolucionando progresivamente hacia el modelo computacional correspondiente. Se muestra como, de forma muy general, la aplicación de la informática en el deporte se basa fundamentalmente en bases de datos, redes y herramientas específicas y el funcionamiento de un sistema deportivo depende en gran medida de nuestra habilidad para mover los datos específicos entre los distintos componentes. Se ofrece una panorámica de la infraestructura de redes y comunicaciones necesaria para satisfacer la demanda de los usuarios en el deporte, así como los protocolos principales utilizados. Se definen conceptos como intranet y extranet. Se analizan las diferencias, ventajas y desventajas de páginas web estáticas y dinámicas y por último se menciona el XML como lenguaje líder en la actualidad en el intercambio de datos multiplataforma.
Fuentes de información en el deporte
Para abordar los problemas de la informática en el deporte, nuestro equipo de trabajo realiza en primer lugar un análisis informacional del problema en cuestión, detectando las entidades y procesos que participan en el fenómeno. De forma general, es posible diferenciar los siguientes sucesos o eventos que generan fuentes de información en el deporte:- Las competencias deportivas.
- Las sesiones cotidianas de entrenamiento.
- La publicación de documentación deportiva.
La competencia deportiva
El modelo general de competencia deportiva multidisciplinaria incluye varios escenarios situados en puntos geográficamente distantes, donde ocurren los diferentes eventos. En cada uno de estos puntos es donde se recolectan inicialmente los resultados y detalles, y de alguna forma, que se explica posteriormente, son enviados a un punto central de recolección o centro de procesamiento principal. Si asumimos un modelo de base de datos centralizada, es en este lugar donde se conforma la base de datos de la competencia. Esta base contiene idealmente cada detalle instantáneo del desarrollo de cada deporte y modalidad. La información contenida en esta base de datos se publica generalmente en la Intranet de la competencia y parcial o totalmente en un sitio en Internet. Como se verá más adelante, existen varias alternativas para convertir los datos de la base en un sitio web. Si tenemos en cuenta un conjunto de competencias deportivas con sus bases de datos asociadas BDC1, BDC2, ..., BDCn es posible obtener algo superior: donde el símbolo de unión se interpreta como unificación lógica (Knight 1989), que es una operación mas general.El Entrenamiento
De la misma forma que en el caso anterior, el entrenamiento deportivo también tiene como punto de partida un conjunto de puntos posiblemente distantes geográficamente, correspondientes a los diferentes deportes. En cada punto se recolectan, de forma automatizada o no, los diferentes indicadores de rendimiento de los atletas. En un sistema ideal, estos sistemas se envian a un punto de recolección central, conformándose asi una base de datos central de entrenamiento, la que, después de cierto procesamiento, es posible publicar, por ejemplo, en la Intranet corporativa del ministerio de deportes. Esto permite poner a disposición de los directivos toda la información de los atletas, con vistas a la toma de decisiones. Es posible también integrar todas estas bases de entrenamiento BDE1, BDE2, ..., BDEn para obtener una gran base acumulativa.Los Centros de Información Deportiva
Siguiendo la línea de los dos casos anteriores, los centros de información deportiva también se encuentran dispersos geográficamente a nivel de país o de región. En cada uno, se procesan posiblemente las publicaciones locales, tesis de las escuelas locales e institutos de deporte, trabajos investigativos, etc. Estos centros constituyen por tanto, una red lógica, al igual que en los casos anteriores, y es posible hablar teóricamente de un punto central de recolección de la información bibliográfica de ellos, representado por la ecuación: Sin embargo, en este caso, a diferencia de los anteriores, no es evidente si utilizar un modelo de base de datos centralizada o distribuída. De cualquier forma, para el usuario no es importante pues, como veremos más adelante, uno de los principales objetivos de las bases de datos distribuídas es proporcionar al usuario una interfaz centralizada de forma transparente.Instrumentación Computacional
Los ejemplos anteriores permiten obtener un modelo bastante representativo y lo suficientemente general de los procesos informacionales que ocurren en el mundo deportivo. A partir de este modelo y teniendo en cuenta los aspectos específicos del problema en cuestión que deseamos automatizar, el próximo paso consiste en afrontar la instrumentación computacional. Para ello es necesario considerar varios factores para obtener un sistema eficiente y útil. De forma muy general, el trabajo consiste en: obtener los datos, “moverlos” y procesarlos. Podemos identificar tres elementos principales a considerar en la instrumentación:- Bases de datos (léase además almacenes de datos, o bases de conocimiento)
- Redes informáticas
- Herramientas o programas informáticos de carácter general o específico
Enfoques Computacionales a los Problemas del Deporte
Relacionados con las herramientas para el procesamiento de la información deportiva, existen dos enfoques principales:- Utilizar software de propósito general (Excel, Access, etc).
- Utilizar software hecho a la medida.
Bases de datos
El diseño de la base de datos es probablemente la clave del éxito o fracaso de la instrumentación de un sistema, pues esta constituye los cimientos del edificio que estamos construyendo. Un mal diseño puede inducir a situaciones de duplicación de los datos y falta de organicidad y coherencia de las salidas de nuestro sistema. La creación de la base de datos comienza por la creación de modelos entidad-relación, en los cuales se identifican los objetos que vamos a modelar computacionalmente, sus propiedades o atributos y las relaciones entre los objetos. Aunque existen varios modelos de bases de datos (jerárquicos, redes, orientados a objetos), el más aceptado y popular es sin duda el relacional (Ullman 1982) debido a su potente basamento lógico-teórico soportado en el álgebra relacional. En este modelo los objetos se representan a través de tablas cuyas columnas (denominadas campos) son las propiedades o atributos. Las filas o tuplas contienen toda la información relevante a un objeto. La teoría plantea que un buen diseño implica que el conjunto de relaciones cumpla con la Tercera Forma Normal (Ullman 1982). Ello evita las anomalías de inserción, actualización y eliminación, y garantiza además evitar los problemas de redundancia. En la práctica no es común la verificación de la tercera formal normal de forma estricta, pero si es importante conocer los principios básicos sobre los que se soporta con el fin de evitar en nuestros diseños los problemas que ella elimina en la teoría. Incluso en ocasiones se viola concientemente, introduciendo algún tipo de redundancia en la base de datos con el fin de ganar en eficiencia. Sin embargo es muy importante tener bien presente las posibles consecuencias que puede traer ese paso para la consistencia de la base de datos. Por otra parte el lenguaje estándar para la recuperación de información de bases de datos relacionales es el Lenguaje de Consulta Estructurado (SQL). Cada sistema de gestión de bases de datos (SGBD) incluye instrucciones propias para el trabajo con las bases, sin embargo, se recomienda siempre que sea posible utilizar el SQL previendo la portabilidad del programa que estamos creando. En el momento de decidir que SGBD escoger de los tantos disponibles en el mercado, no hay fórmula fija escrita. Es necesario analizar el problema específico que se va a instrumentar y sobre todo recordar que no hace falta un tanque de guerra para matar una hormiga. Generalmente, para pequeñas aplicaciones (tablas de hasta 10000 tuplas) es aceptable emplear un sistema de escritorio (ej. Access, FoxPro). Este es el caso de nuestras bases de datos de una competencia deportiva o del entrenamiento de un atleta. Cuando el volumen de datos comienza a crecer se hace imperativo buscar sistemas con prestaciones mucho mayores (ej. Oracle, SQL Server), que garantizan eficiencia en las transacciones y sobre todo escalabilidad (que si el desempeño del sistema comienza a decaer, para solucionarlo es suficiente aumentar recursos de hardware como memoria, disco duro o procesadores). Este es el caso de nuestras bases de datos acumulativas que con el tiempo se van convirtiendo en almacenes de datos (data warehouses).Infraestructura de Redes y Comunicaciones
De la misma forma que las bases de datos garantizan la obtención y almacenamiento de los datos, las redes telemáticas garantizan su “movimiento”, o más técnicamente, su transmisión de una computadora a otra. Sería prácticamente imposible construir y actualizar las bases acumulativas a partir de sus componentes situados geográficamente distantes sin contar con una infraestructura adecuada de interconexión. Primeramente en el centro de procesamiento principal y en los distintos escenarios deportivos deben existir redes locales con sus correspondientes servicios. Y estas redes deben estar interconectadas unas con otras. Depende del presupuesto de la institución, organismo o compañía en que se pueda conformar una red que responda a los intereses del evento. Para estos citaremos algunos de los componentes básicos en la conformación de una red. Podemos definir una red como una colección nodos capaces de comunicarse entre si. Los nodos pueden ser maquinas, terminales e impresoras. La interconexión de estos nodos puede ser a través de cables, líneas telefónicas, ondas de radio, fibra óptica, satélites, etc. De acuerdo a su alcance las redes se pueden clasificar en:- Red de Área Local / LAN (Local Área Network): Es una red que cubre una extensión reducida como una empresa, una universidad, una institución, etc.
- Red de Área Metropolitana / Man ( Metropolitan Área Network): Es una red cubre una extensión mayor como pueden ser una ciudad o un distrito.
- Red de Área Extensa / WAN (Wide Area Network): Es una red que cubre grandes regiones geográficas como un país, un continente o incluso el mundo.
- Cable coaxial fino
- Cable coaxial grueso
- Cable de par trenzado sin apantallar /UTP Unshielded twisted pair.
- Cable de par trenzado apantallado / STP Shielded twisted
- Cable de fibra óptica
- Topología de BUS / Linear Bus
- Topología de Estrella / Star
- Topología de Árbol / Tree
- permiten instrumentar la seguridad en la red.
- ofrecen servicios de alto nivel a los usuarios con escasos recursos computacionales.
- procesan consultas realizadas a las bases de datos de la red.
- contienen de forma segura los archivos de los usuarios.
- proporcionan la puerta de enlace de la Intranet con el mundo exterior.
- gestionan los servicios de correo electrónico.
- Consultas a bases de datos dinámicas.
- Navegar en la Intranet o Internet.
- Procesar documentos.
- Hacer análisis estadísticos.
Intranet
Si durante una competencia deportiva queremos:- Dar a conocer los diferentes resultados acontecidos durante una competencia,
- Hacer consultas a bases de datos dinámicas,
- Revisar el correo,
- Transferir un documento,
- Buscar las últimas noticias acontecidas en el mundo,
- sitios web,
- sitios FTP,
- correo electrónico ,
- sistemas de bases de datos soportados sobre web,
- software de comunicaciones a la medida de las necesidades como soporte para las competencias.
- Mantener la seguridad de la red.
- Reparación de los posibles fallos en el funcionamiento de la red.
- Mantener estadísticas del uso de la red.
- Configuración y puesta a punto de nuevos servicios.
- Decidir qué software se va a situar en la red.
- Entrenamiento a los usuarios sobre:
- procedimientos de conexión
- métodos de recuperación de información
- software y bases de datos disponibles
- Estudios de usuarios: ¿qué les gusta y qué no?
- Identificación y solución de los “cuellos de botella”
- Identificación de las principales fuentes de información (Base de datos SPORT, Internet, listas de discusión, etc)
- Determinación de los núcleos de revistas y autores en las disciplinas de interés por parte de los entrenadores.
Extranet
Es una red colaborativa que usa tecnología de Internet para enlazar a una compañía con sus proveedores, clientes y otros negocios que comparten objetivos comunes. Este término describe el software que facilita las relaciones entre compañías. Una extranet puede ser vista como la parte de la intranet de una compañía a la que tienen acceso otras compañías, o como una conexión a Internet para trabajo en colaboración con otras compañías; también puede ser vista como una intersección de varias intranets de diversas compañías. La información que se comparte solo es visible para las organizaciones que hacen parte del grupo de colaboración. Entre las aplicaciones de una extranet están:- grupos privados de noticias que usan algunas compañías para compartir experiencias e ideas valiosas;
- programas de entrenamiento personal, compartido compartidos entre varias entidades;
- catálogos de productos; administración y control de proyectos, etc.
Internet vs. Intranet
Internet tiene alcance mundial. Una intranet tiene un alcance corporativo, institucional. En Internet las instituciones sitúan su “cara al mundo” con la información pública que generan. Por ejemplo:- resultados científicos
- promoción y difusión de sus productos
- bases de datos estadísticas e históricas
- La estructura de dirección de un organismo.
- La agenda del consejo de dirección.
- Acuerdos del consejo de dirección
- Actas, circulares e informes
- Noticiero deportivo
- Difusión de cursos, maestrías, diplomados, doctorados
- Otras informaciones
Sitios Web Estáticos vs. Dinámicos
Imaginemos una situación en que estamos manejando el sitio web de una competencia multidisciplinaria. Tenemos páginas para medallero general por país, medallero por deporte, medallero por sexo, records, y detalles por evento. Un competidor de atletismo de 100 m planos obtiene medalla de oro y rompe el record regional. ¿Cuántas páginas tendría que actualizar un operador para que el sitio este actualizado con este único resultado? Cinco páginas. Supongamos que tenemos un programa que genera las páginas automáticamente. Por cada resultado tendríamos que subir por FTP cinco páginas al servidor web. Otro ejemplo donde se evidencian las ventajas de las páginas dinámicas es la creación de una galería de fotos de momentos importantes de una competencia. En este caso, el operador o fotógrafo solo tendría que conectarse a una página de administración y subir la última foto al servidor y en el mismo momento, la audiencia del sitio la estaria viendo. Compárese esto a que tuviera que editar una nueva página cada vez que tiene una foto nueva y subirla al servidor usando FTP. Podemos añadir un poco de complejidad si deseamos tener para cada foto una lista de comentarios de los usuarios del sitio. Este caso si sería imposible de implementar sin usar alguna variante de página dinámica. Estos problemas se resuelven utilizando páginas dinámicas en lugar de estáticas. Con una simple operación de actualización de la base de datos, la página “lee” directamente de la base de datos y por tanto siempre estará actualizada con los últimos resultados. Por su parte, la base de datos ofrece una interfaz amistosa de actualización. Sin embargo, no todo es color de rosa con las páginas dinámicas. Su utilización permite incorporar a un sitio casi todo el poder de una aplicación tradicional de escritorio. Por tanto, cada vez que un usuario solicita una página dinámica, detrás del telón se esta ejecutando un proceso, lo que implica que las páginas dinámicas imponen una carga extra a los servidores web que se traduce en una ralentización de su desempeño. En la actualidad se utilizan técnicas para evitar esto como las granjas de servidores y el balance de carga. Las nuevas versiones de los sistemas servidores web brindan cada vez más posibilidades de escalabilidad. No existe una regla infalible para decidir cuando usar páginas dinámicas o estáticas; la decisión se basa fundamentalmente en la experiencia y en algunos principios elementales: si la información a mostrar varía constantemente, entonces es recomendable usar páginas dinámicas, si varía mensualmente entonces quizá sea mejor la opción estática. Si el espacio en disco utilizado por la versión estática es demasiado grande comparado con el de la dinámica, escogemos la segunda aun cuando la información no cambie frecuentemente. Existen varias opciones para hacer páginas dinámicas, entre ellas las más populares ASP y PHP.Enfoques nuevos y alternativos
En esta sección presentamos dos tecnologías bastante nuevas que según nuestra opinión muestran el próximo paso en el desarrollo de sistemas computacionales para el deporte: las bases de datos distribuídas y XML. Internet se puede considerar una gran base de datos distribuída, entre sus principales ventajas se encuentra el hecho de que el fallo de uno de sus puntos o nodos no implica el fallo del sistema en su conjunto.Bases de datos centralizadas vs. Bases de datos distribuídas
A pesar que actualmente el modelo de base de datos que domina la informática, es el centralizado, en los últimos años ha tomado gran auge la investigación en el tema de las bases de datos distribuídas. Definición: una base de datos distribuída es una colección de bases de datos que están interconectadas a través de una red, ya sea local o de área amplia, y que puede incluir diferentes formatos y sistemas de gestión de bases de datos, ejecutándose en arquitecturas diferentes y que distribuye la ejecución de transacciones. En gran parte, la popularidad de este modelo se debe precisamente a la naturaleza distribuída de muchas actividades, una de las cuales es, por supuesto, el deporte. Basta mencionar una competencia multidisciplinaria (un Panamericano por ejemplo), donde cada deporte se desarrolla en una sede diferente, inclusive hasta en provincias diferentes. Otro aspecto que lo hace atractivo es el hecho de soportar mejor la escalabilidad, que es la capacidad de un sistema de mejorar su desempeño, al adicionar más nodos a la red, o por ej., al añadir más procesadores a un ordenador. Uno de los objetivos de las bases de datos distribuídas es soportar una interfaz que simule al usuario como si fuera una base de datos centralizada. Esto se logra a través de la instrumentación de una serie de “transparencias”:- Transparencia de ubicación geográfica
- Transparencia de desempeño
- Transparencia de copia
- Transparencia transaccional
- Transparencia de fragmento
- Transparencia de modificación de esquema
- Transparencia de sistema local de gestión de base de datos
XML como Estándar de Intecambio de Datos
Es casi imposible en los últimos tiempos hablar de aplicaciones que intercambian datos en la red sin hablar de XML. XML son las siglas de Extensible Markup Language, es un lenguage de marcado como HTML. XML fue diseñado para describir los datos. Las etiquetas (tags) de XML no son predefinidas, debemos definir las nuestras propias. Utiliza un Document Type Definition (DTD) o un Esquema XML para describir los datos. Un documento XML con un DTD o con un esquema está diseñado para ser autodocumentado. Una de las principales diferencias entre XML y HTML es que el primero fue diseñado para describir la información, mientras que el segundo es para mostrar la información. La mayor bondad de XML radica en su sencillez, es simplemente un archivo texto con etiquetas. Esto le confiere una elevada potencia al punto que se ha convertido en el estandar en la transferencia de datos entre múltiples plataformas y sistemas de gestión. Existe un lenguaje basado en XML llamado SportsML para el intercambio de información deportiva. Sus especificaciones se encuentran en http://www.sportsml.com/ Permite a los desarrolladores de servicios de datos deportivos lograr un mayor nivel de estandarización. Algunas de las características de SportsML:- Soporte para scores, calendarios, estadísticas.
- Global en alcance y diseño.
- Un marco de trabajo comun para todos los deportes.
- Módulos acoplables para deportes específicos.
- Bien documentado y fácil de utilizar.
- Filosofía abierta y extensible.
Conclusiones
En este trabajo hemos presentado un modelo general de aplicación de la informática a una amplia clase de fenómenos de la actividad deportiva, como son, las competencias de un solo deporte y multidisciplinarias, el entrenamiento deportivo y los sistemas de documentación deportiva. Sin embargo, de ninguna manera es este un modelo universal para dar solución a todos los problemas de la informática deportiva, de hecho existen infinidad de ellos cuyas herramientas de solución están muy lejos de las presentadas aquí. Se mostró como a partir de dos herramientas básicas de la Ciencia de la Computación, las redes telemáticas y las bases de datos, es posible instrumentar sistemas que satisfagan las demandas informativo-computacionales de los usuarios del deporte, atletas, entrenadores, directivos y aficionados. Se comentó sobre posibles líneas de ampliación de estos trabajos con tecnologías muy jóvenes aún dentro de la computación pero con grandes promesas: las bases de datos distribuídas como modelo descentralizado de procesamiento y el lenguaje XML que promete dar solución al clásico problema de la estandarización y el acceso universal a los datos. Se plantearon los conceptos de intranet, extranet e internet y sus características principales y se mostró el papel que juega cada uno dentro de un sistema de información deportiva. El elemento común entre ellos, el lenguaje HTML, y las páginas web creadas a través de este, han elevado la red de redes a la cima de popularidad en la última década, y por tanto se ha convertido en la interfaz estandar para los sistemas de información actuales. Es de nuestro conocimiento el amplio trabajo que realizan varios colegas en el área de la informática deportiva, pero desgraciadamente la literatura sobre ello es bastante escasa, a pesar de que es un tema realmente amplio y que cuenta con problemas muy propios y específicos derivados de la sinergia entre estas dos ramas tan importantes de la actividad humana. Esperamos pues, que este trabajo sirva de motivación a otros colegas para continuar la investigación relativa a estos tópicos y como consecuencia de ello surjan nuevas publicaciones con el propósito de crear una verdadera comunidad informático-deportiva que contribuya a elevar cualitativamente nuestra actividad.
- Baartse, Mark et al. (2000): Professional ASP XML. Wrox Press Ltd.
- Barquín, Pedro; Morales-Morejón, Melvyn; Carrodeguas, María Elena; Pla, Juan Andrés (2002): Perfeccionamiento y desarrollo de la web-intranet del sistema de cultura física y deporte. Informe interno.
- Frisch, Aeleen (1991): Essential System Administration. O’Relly & Associates.
- Homer, Alex (2000): Professional ASP 3.0 Web Techniques. Wrox Press Ltd.
- Kirch, Olaf y Dawson, Terry (2000): Guía de administración de Redes con Linux. O’Relly & Associates.
- Knight, Kevin (1989): Unification: A Multidisciplinary Survey. En: ACM Computing Surveys, Vol. 21, No. 1.
- Linden, Rob van der (1994): ANSAwise - Distributed Databases and Distributed Systems
- Muhlberger, Ralf M and Orlowska, Maria E (1996): A Business Process Driven Multidatabase Integration Methodology, en Cheung, To-yat and Siu, Brian and Fong, Joseph, Eds. Database Reengineering & Interoperability, capítulo 21, páginas 283-295. Kluwer Academic Publishers.
- Newell, Sue (1999): Intranets and Knowledge Management: Complex Processes and Ironic Outcomes. En: Proceedings of the 32nd Hawaii International Conference on System Sciences – 1999
- SportsML: The Sports Markup Language, http://www.sportsml.com
- Stenmark, Dick (2002): Designing the new intranet. En: Gothenburg Studies in Informatics, Report 21, March 2002, ISSN 1400-741X
- Tamer Özsu, M. (1998): Distributed databases. En: http://db.uwaterloo.ca/~ddbms/publications/ozsu/
- Ullman, Jeffrey D. (1982): Principles of Database Systems, 2nd Edition. Computer Science Press, ISBN 0-914894-36-6
- Yang, Jun (2001): Centralized vs. Distributed DBMS. En: CPS 216: Advanced Databases Systems (Fall 2001)
0 comentarios