UNIVERSIDAD DE MÁLAGA ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA TESIS DOCTORAL REDES NEURONALES ARTIFICIALES PARA LA GESTIÓN DE SISTEMAS DE ENERGÍA ELÉCTRICA AUTOR: Francisco García Lagos Licenciado en Informática 2003 D. GONZALO JOYA CAPARRÓS, TITULAR DE UNIVERSIDAD DEL DEPARTAMENTO DE TECNOLOGÍA ELECTRÓNICA DE LA UNIVERSIDAD DE MÁLAGA CERTIFICO: Que D. Francisco García Lagos, Licenciado en Informática, ha realizado en el Departamento de Tecnología Electrónica de una Universidad de Málaga, bajo mi dirección el trabajo de investigación correspondiente a su Tesis Doctoral titulada: “REDES NEURONALES ARTIFICIALES PARA LA GESTIÓN DE SISTEMAS DE ENERGÍA ELÉCTRICA”. Revisado el presente trabajo, estimo que puede ser presentado al Tribunal que ha de juzgarlo. Y para que conste a efectos de lo establecido en el Real Decreto 778/98 regulador de los estudios de Tercer Ciclo-Doctorado, AUTORIZO la presentación de esta Tesis en la Universidad de Málaga Málaga, a 29 de mayo de 2003 Fdo. Gonzalo Joya Caparrós Titular de Universidad Departamento de Tecnología Electrónica Universidad de Málaga TESIS DOCTORAL REDES NEURONALES ARTIFICIALES PARA LA GESTIÓN DE SISTEMAS DE ENERGÍA ELÉCTRICA AUTOR: Francisco García Lagos Licenciado en Informática DIRECTOR: Gonzalo Joya Caparrós Licenciado en Ciencias Físicas Dr. en Informática UNIVERSIDAD DE MÁLAGA ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA Reunido el tribunal compuesto por: Presidente: Dr. D. Secretario: Dr. D. Vocales: Dr. D. Dr. D. Dr. D. para juzgar la tesis doctoral titulada “REDES NEURONALES ARTIFICIALES PARA LA GESTIÓN DE SISTEMAS DE ENERGÍA ELÉCTRICA”, presentada por D. Francisco García Lagos y dirigida por Dr. D. Gonzalo Joya Caparrós, acordó por ___________________________________ otorgar la calificación de ____________________________________. Málaga, _____________ de ________________ de 2003 El Presidente El Secretario Fdo. Fdo. Vocal 1 Vocal 2 Vocal 3 Fdo. Fdo. Fdo. A mi madre. Agradecimientos Muchos han sido los que han colaborado en este trabajo. Gracias a todos ellos. En particular, quiero manifestar mi gratitud a: Gonzalo Joya Caparrós, mi director de tesis, por su tiempo, dedicación y apoyo en la realización de este trabajo, pero sobre todo, por transmitirme su filosofía de trabajo. A Javier Marín, con quién comencé mis trabajos de investigación cuando aún era estudiante, por su apoyo y ayuda a lo largo de todos estos años. A Francisco Sandoval, por iniciar en el Departamento de Tecnología Electrónica la línea de investigación en la que se encuadra este trabajo, así como por la confianza depositada en mí para formar parte del grupo de investigación. A la empresa ELIOP S.A., por la financiación de proyectos de investigación y desarrollo que han contribuido a este trabajo, por su colaboración y confianza, así como por su ayuda en su ejecución. A Red Eléctrica de España y, en especial a José Luis Mata y Guillermo Juberías, por su colaboración técnica imprescindible a lo largo del desarrollo de varios proyectos de investigación, así como por sus comentarios e ideas en la prueba de varias de las aplicaciones que han sido desarrolladas. Y en último lugar, reconocer a todos aquellos compañeros que me han prestado ayuda cuando la he necesitado. A todos y cada uno, mi agradecimiento. Resumen Esta tesis tiene dos objetivos generales principales: por un lado, estudiar las Redes Neuronales Artificiales (RNAs), tanto en sus aspectos teóricos como de aplicación a problemas reales. Por otro, la propuesta de soluciones realistas, basadas en las RNAs, a diversos problemas relacionados con la gestión de un sistema de energía eléctrica. Ante un problema particular, el primer objetivo general se ha concretado en los siguientes objetivos específicos: a) establecer las características que ese problema debe presentar para que sea recomendable su resolución mediante RNAs; b) establecer el paradigma neuronal más adecuado para su resolución; c) una vez elegido un paradigma, determinar su estructura topológica adecuada; d) conocer las peculiaridades de cada una de las funciones de activación que pueden ser incorporadas a una neurona, así como su efecto en el funcionamiento general del sistema, y e) conocer los distintos algoritmos de entrenamiento o de evolución dinámica de los diferentes paradigmas y su incidencia en el tiempo de convergencia y en la precisión de la solución alcanzada. En cuanto al segundo objetivo general, se han analizado y propuesto diversas soluciones neuronales a las siguientes operaciones implicadas en un sistema de gestión de energía eléctrica: predicción de la demanda eléctrica, análisis de contingencias y estimación de estado, la cual incluye las subtareas de estimación topológica y observabilidad. Todos estos problemas reales presentan características que hacen recomendable la utilización de técnicas neuronales para su solución. Para cada uno de ellos se realiza un estudio exhaustivo de sus condiciones, se proponen y justifican diversos paradigmas neuronales o estructuras mixtas y se obtienen y analizan los resultados. En este último aspecto, las aportaciones principales pueden resumirse como sigue. Predicción de Demanda de Energía Eléctrica Se propone una arquitectura neuronal compleja constituida por la secuenciación de dos paradigmas diferentes. En una primera etapa, se utiliza un paradigma de aprendizaje no supervisado (Mapas Auto-Organizativos de Kohonen) para la clasificación de patrones. En una segunda etapa, un paradigma de topología realimentada y aprendizaje supervisado (Red de Elman) realiza la predicción de la demanda de manera independiente para los días de cada una de las clases obtenidas. Las ventajas de este modelo de predicción frente a otros existentes son las siguientes: 1) el usuario dispone de un perfil de 24 horas en cada momento que se actualiza hora a hora. Esto le permite llevar un control exhaustivo para participar en las ofertas de generación en cada uno de los mercados diarios e intradiarios del sistema actual; 2) el módulo implementado de entrenamiento periódico (on-line) activado a petición del usuario, hace que la influencia de la no-estacionariedad de la curva de la demanda sea menor que en el caso de realizar la predicción con paquetes estadísticos, menos flexibles y con un mayor tiempo de actualización en la búsqueda de la estimación de los parámetros de predicción; 3) la adaptabilidad a otras zonas de regulación es altamente facilitada por el módulo de clasificación no supervisada, lo que reduce la intervención de un experto respecto a los paquetes estadísticos existentes. Estimación de Estado. El problema de la estimación de estado ha sido planteado como un proceso de optimización utilizando redes recurrentes de Hopfield, convirtiendo la expresión de la suma ponderada de residuos al cuadrado utilizada en los algoritmos clásicos, en una función de energía de Hopfield. Las aportaciones principales de este trabajo son las siguientes: a) se han simulado diferentes métodos de activación de neuronas y su influencia en la solución final obtenida; b) se propone e implementa un método de adaptación automática del parámetro de simulación de la ecuación diferencial del modelo independiente del problema considerado y c) se realiza una implementación de la red utilizando técnicas de almacenamiento y manipulación de matrices dispersas que optimiza los recursos necesarios para la simulación de la red. Estimación de Topología Para esta tarea se propone un sistema neuronal compuesto por dos fases: fase de preprocesamiento y fase de clasificación. La fase de preprocesamiento convierte las medidas disponibles en vectores que serán fácilmente clasificables por la segunda de potencial gaussiana basada en la distancia de Mahalonobis. En esta capa hay una unidad por cada posible topología del bus, de manera que para cada patrón producido por la etapa de preprocesado, la unidad con valor de activación alto indicará la topología asociada con el vector de medidas original. Las ventajas de este nuevo módulo de estimación topológica son las siguientes: los parámetros implicados en el modelo son obtenidos de manera simple y directa a partir de un conjunto histórico de medidas, siendo innecesario un proceso de aprendizaje; el proceso de estimación es local y la topología de cada bus se obtiene de manera independiente y paralela; para buses con todas sus medidas conocidas u obtenidas mediante pseudomedidas, la topología correcta es obtenida en todos los casos, incluso cuando se cuenta con medidas altamente erróneas; la estimación puede realizarse incluso cuando no se dispone de una medida de flujo o de inyección; el sistema es altamente inmune a grandes cambio en la curva de carga de potencia; la complejidad del sistema crece de manera lineal con el tamaño de la red eléctrica, ya que cada nuevo bus sólo necesita un nuevo módulo de preprocesado y clasificación. Análisis de seguridad Los Mapas Autoorganizativos de Kohonen han sido aplicados a la monitorización visual de la evolución del sistema con respecto al nivel de peligrosidad de cada contingencia particular, y las redes alimentadas hacia delante como el Perceptrn Multicapa o las redes de funciones de base radial han sido aplicadas a la ordenación de contingencias por medio de la evaluación numérica de algún índice de prestación. En este trabajo se muestra la alta aplicabilidad de las redes de Kohonen a este problema, debido a que facilita una rápida visualización de la severidad de una contingencia y a que posibilita la predicción de la tendencia del sistema hacia un punto de operación posiblemente peligroso respecto a una contingencia particular. Respecto a la ordenación de contingencias por su nivel de peligrosidad, se han estudiado y comparado las soluciones que aportan dos paradigmas supervisados clásicos como son el perceptron multicapa y las redes de función de base radial. Abstract This work has two main general objectives: in one hand, the study of Artificial Neural Networks (ANNs) in its theoretical aspects, and its application to the resolution of real problems. In the other hand, the proposal of neural network based realistic solutions to problems related with energy power management systems. For each particular problem, the first general objective has been split in other specific ones: a) to establish the characteristics that the problem should present to be solved by means of RNAs; b) to establish the more appropriate neuronal paradigm for its resolution; c) once a paradigm has been selected, to determine their structure and appropriate topology; d) to know the peculiarities of each activation and their effects in the general operation of the system; and e) to know the different algorithms and dynamics for different paradigms, and their effect in the solution obtained. For the second general objective, we analyse and propose several complex neural network solutions for the following energy management system tasks: power demand forecasting, contingency analysis, and state estimation, including topology estimation. All these real problems present characteristic that make advisable the application of neural network techniques for their solution. For each one of these problems, it is carried out an exhaustive study of their conditions, and the neural paradigm applied and the results obtained are justified. In this sense, the main contributions of this work can be summarized as follow: Power Demand Forecasting The proposed solution for this task is composed by a complex neural network architecture constituted by two different paradigms. In a first stage, a Self-Organizing Map of Kohonen is used for patterns classification. In a second stage, a supervised feedback paradigm (Elman neural network) carries out the forecasting in an independent way for each cluster obtained in the first stage. The advantages of this model are the following ones: 1) the user has a profile of 24 hours in each moment that hour is upgraded. This allows to take exhaustive control to participate in the generation offers in each one of the daily markets of the current system; 2) the implemented periodic retraining process speed up the adaptation of the model to new consumption trend; 3) robustness and adaptability of our system to other regulation areas is based on the capability of Kohonen maps to extract non evident environmental, cultural and economic factors, and the special ability of recurrent ANNs to model time series. State Estimation The problem of the state estimate has been outlined as a optimization process using Hopfield’s recurrent network, converting the expression from the weighted squared sum of residuals used in the classic algorithms, in an energy function of the Hopfield network. The main contributions of this work are the following ones: to) different methods of neuron activation functions and their influence have been simulated in the obtained final solution; b) it implements a method for automatic the parameter for equation discretization, and c) the simulation of the neural network is implemented by mean of sparse techniques, that reduces significantly the amount of required memory and convergence time to the solution. Topology Estimation For this task we propose a system architecture comprises two stages: the first one, the Preprocessing stage, transforms each current measurement set available from SCADA to produce a vector in the [0,1]n space. This stage produces clusters of very similar preprocessing output vectors for each grid topology. The second stage, the Classification stage, consists in a layer of Gaussian potential units with Mahalanobis distance, and classifies the preprocessing output vectors to identify the actual topology. This model presents the following advantages: a) the estimation process is local, and the topology of each bus is obtained by an independent and parallel module; b) the system complexity grows linearly with the size of the power network; c) the parameters involved in the model are obtained through a straightforward method from a previously generated measurement database and training process is not needed; d) for buses with all their power flow measurements known or obtained as pseudomeasurements, the correct topology is obtained in all cases, even for very bad measurements; e) the topology assessment can be used when a flow or injection measurement is not available; in this situation the correct topology is obtained even with very bad measurements; f) the system performance is highly immune to large changes in the power load curve. Contingency Analysis The Contingency Analysis is a classification problem, oriented to provide an estimation of the security level of the current system state regarding the occurrence of a possible contingency. This task may be approached by both functional methods, characterizing the severity of each contingency by a numerical value, and graphical methods, permitting the contingency evaluation in a visual way. In this work, both approaches have been studied. Supervised feed-forward neural networks have been applied to the functional contingency analysis. These paradigms generate the numerical function that evaluates the security level of each contingency for each current state, permitting the construction of a contingency ranking. In particular, we analyse and compare the performance of Multilayer Perceptron (MLP) with Backpropagation learning algorithm and Radial Basis Function (RBF) Networks. For the second task, bi-dimensional and linear Seft-Organaizing Maps (SOM) of Kohonen have been applied to the visual classification and monitoring of the evolution of the system concerning of the security level of the current system state regarding the occurrence of a possible contingency. The main advantages of SOM are the following ones: a) for the linear SOM, each contingency is represented by a segment in the SOM, and this is divided in successive subsegments representing an increasing severity scale. Thus, a very high number of contingencies may be presented simultaneously in only one screen, and the analysis of the complete contingency set may be done in a very reduced time by an human operator; b) the representation by a SOM of the successive power system operation points permits to follow the system tendency with respect to each particular contingency, and to predict its approaching to a dangerous zone with enough advance; c) each contingency produces a different distribution of the severity intervals in the original SOM, but the training process is unique for all the contingencies. Thus, the complexity of the off-line training process does not significantly increase with the power system size. Of course, the process in the operation model is carried out in real time. Acrónimos AR Modelo autoregresivo ARX Modelo autorregresivo con variables de entrada exógenas ARMA Modelo autorregresivo de media móvil ARMAX Modelo autorregresivo de media móvil de entradas exógenas ARIMA Modelo autorregresivo integrado de media móvil ARIMAX Modelo autorregresivo integrado de media móvil de entradas exógenas Ci(t) Función que determina la clase a la que pertenece el patrón t para la predicción del consumo de energía eléctrica. EMS Sistema Gestión de Energía Eléctrica (Energy Management System) h() Función no lineal que relación el vector de estado con las medidas disponibles en el proceso de estimación de estado de un sistema de potencia. H() Matriz jacobiano. J() Vector de residuos al cuadrado ponderados. Función a minimizar en la estimación de estado. LVQ Learning Vector Quantization MA Modelo de media móvil MAPE Error relativo medio (Mean Absolute Percentage Error) MLP Perceptrón Multicapa (del inglés Multilayer Perception) PI Ïndice de prestación (performance index). R Matriz de covarianzas de errores en las medidas en la estimación de estado. RBF Red de funciones base radiales (Radial Basic Function network) RNA Red Neuronal Artificial SCADA Sistema de supervisión, control y adquisición de datos (Supervisory Control And Data Acquisition) SOM Mapas auto-organizativos (Seft-Organaizing Map) v Vector de errores de las medidas en la estimación de estado. W Matriz inversa de la matriz de covarianzas de errores en las medidas R. WLS (Estimador WLS) Estimador de mínimos cuadrados ponderados (Weighted Least Squares). x Vector de estado para la estimación de estado. YH Función que determina el consumo eléctrico de la hora H. z Vector de medidas disponibles para la estimación de estado. Índice general 1. Introducción 1 1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2. Predicción de la demanda de energía eléctrica 9 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2. Predicción de series temporales . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2.1. Predicción de la demanda de energía eléctrica . . . . . . . . . . . . . . 12 2.3. Redes neuronales para procesamiento de series temporales . . . . . . . . . . . 16 2.3.1. Redes neuronales alimentadas hacia delante . . . . . . . . . . . . . . . 17 2.3.2. Aplicación de las redes alimentadas hacia delante a la predicción de la demanda de energía eléctrica . . . . . . . . . . . . . . . . . . . . . . 20 2.3.3. Redes neuronales recurrentes . . . . . . . . . . . . . . . . . . . . . . . 22 2.3.4. Aplicación de las redes recurrentes a la predicción de la demanda . . . 26 2.4. Problemas en la predicción de la demanda eléctrica con RNAs . . . . . . . . . 28 2.5. Un nuevo modelo de predicción de carga eléctrica . . . . . . . . . . . . . . . . 29 2.5.1. Preprocesamiento de los datos . . . . . . . . . . . . . . . . . . . . . . . 30 2.5.2. Clasicación mediante mapas auto-organizados de Kohonen . . . . . . 31 2.5.3. Aproximación de la función de consumo mediante redes de Elman . . . 35 2.5.4. Resultados de funcionamiento y discusión . . . . . . . . . . . . . . . . 41 2.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 i ÍNDICE GENERAL 3. Estimación de estado 49 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.2. La estimación de estado como problema matemático . . . . . . . . . . . . . . 50 3.3. Estimación de estado con redes de Hopeld . . . . . . . . . . . . . . . . . . . 52 3.3.1. Adaptación de los pesos de la red de Hopeld para la estimación de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.2. Implementación del modelo neuronal de Hopeld . . . . . . . . . . . . 58 3.3.3. Utilización de matrices dispersas con redes de Hopeld . . . . . . . . . 62 3.3.4. Resultados de la estimación de estado utilizando el modelo neuronal de Hopeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4. Estimación topológica 71 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.2. Métodos de estimación topológica . . . . . . . . . . . . . . . . . . . . . . . . . 73 4.3. Estimación topológica con Perceptrones multicapa . . . . . . . . . . . . . . . 80 4.3.1. Estimación de topología local . . . . . . . . . . . . . . . . . . . . . . . 81 4.3.2. Estimación de topología global . . . . . . . . . . . . . . . . . . . . . . 89 4.3.3. Proceso de Estimación Topológica . . . . . . . . . . . . . . . . . . . . 90 4.3.4. Resultados de la estimación de topología . . . . . . . . . . . . . . . . . 91 4.3.5. Conclusiones sobre los resultados del estimador topológico basado en MLP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.4. Asistente topológico basado en funciones base radiales con distancia de Ma- halanobis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.4.1. Etapa de preproceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.4.2. Etapa de clasicación . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 4.4.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . 105 ii ÍNDICE GENERAL 4.4.4. Conclusiones sobre los resultados del asistente topológico basado en unidades de funciones base radiales con distancia de Mahalanobis . . . 109 5. Análisis de seguridad 113 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.2. Principales métodos de análisis de contingencias . . . . . . . . . . . . . . . . . 116 5.3. Generación de patrones e índices de prestación . . . . . . . . . . . . . . . . . 125 5.3.1. Selección de características . . . . . . . . . . . . . . . . . . . . . . . . 126 5.4. Evaluación numérica y ordenación de contingencias con redes neuronales ali- mentadas hacia delante y aprendizaje supervisado . . . . . . . . . . . . . . . . 129 5.4.1. Evaluación numérica de contingencias con Perceptrón Multicapa y Backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 5.4.2. Evaluación numérica de contingencias con redes de funciones base ra- diales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 5.5. Visualización de contingencias con mapas Auto-Organizativos de Kohonen . . 136 5.5.1. SOM bidimensional para la visualización de contingencias . . . . . . . 138 5.5.2. SOM lineal para la visualización de contingencias . . . . . . . . . . . . 142 5.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 6. Conclusiones y líneas futuras 151 6.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 6.2. Líneas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 A. Descripción de los paradigmas neuronales empleados 157 A.1. Perceptrón Multicapa (MLP) . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 A.1.1. Simulación o ejecución de la red neuronal . . . . . . . . . . . . . . . . 158 A.1.2. Entrenamiento de un MLP . . . . . . . . . . . . . . . . . . . . . . . . 159 A.2. Redes de funciones base radiales (RBF) . . . . . . . . . . . . . . . . . . . . . 164 A.2.1. Entrenamiento de RBF . . . . . . . . . . . . . . . . . . . . . . . . . . 165 iii ÍNDICE GENERAL A.3. Red recurrente de Elman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 A.4. Redes de Kohonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 A.4.1. Entrenamiento de un SOM . . . . . . . . . . . . . . . . . . . . . . . . 170 A.5. Red de Hopeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 A.5.1. Modelo discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 A.5.2. Modelo continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 B. Descripción básica de un sistema de gestión de energía eléctrica 177 B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 B.2. Predicción de carga eléctrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 B.3. Estimación de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 B.3.1. Análisis de observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 182 B.3.2. Estimación de topología . . . . . . . . . . . . . . . . . . . . . . . . . . 182 B.3.3. Detección de medidas erróneas . . . . . . . . . . . . . . . . . . . . . . 182 B.4. Análisis de seguridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 B.5. Planicación operacional del sistema de energía eléctrica . . . . . . . . . . . . 183 C. Diagramas de las redes IEEE estándares utilizadas en esta tesis 185 iv Índice de tablas 2.1. Detalle de la clasicación de los datos de consumo eléctrico obtenidos por la red de Kohonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.2. Número de épocas de entrenamiento para cada red de Elman. . . . . . . . . . 40 2.3. Errores medios de predicción para cada clase para el módulo de predicción diaria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.1. Ejemplos de tiempos de cómputo (en segundos) para la estimación de estado utilizando una implementación no dispersa y utilizando la versión propuesta en este trabajo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.2. Residuos nales y tiempo requerido por los estimadores de estado neuronal y clásico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 4.1. Resultados de la estimación topológica local para la red neuronal del bus 2. . 95 4.2. Resultados representativos de la interacción del estimador de estado y del estimador de topología. E. signica Erróneo y C. signica Correcto. . . . . . . 97 5.1. Porcentaje total de explicación de la variación del conjunto de patrones orig- inales de la red IEEE-14, tomando diferentes componentes principales . . . . 129 5.2. Errores relativos medios en tanto por ciento (MAPE) para los índices de prestación de las contingencias problemáticas de la red estándar IEEE-14. . . 132 v ÍNDICE DE TABLAS 5.3. Ordenación de las contingencias según el valor de su índice de prestación. Las columnas con título OR representan la ordenación real de la contingencia, OO la ordenación obtenida por las redes MLP, OR-OO la diferencia (en número de posiciones) entre la ordenación real y obtenida, PIR representa el índice de prestación real, PIO el índice de prestación obtenido. La última colum- na (PIR - PIO) muestra la diferencia entre los índices de prestación real y obtenido para cada contingencia. Las contingencias mostradas corresponden a diferentes estados de la red eléctrica. . . . . . . . . . . . . . . . . . . . . . . 133 5.4. Errores relativos medios en tanto por ciento (MAPE) para los índices de prestación de las contingencias problemáticas de la red estándar IEEE-14. . . 136 5.5. Ordenación de las contingencias según el valor de su índice de prestación. Las columnas con título OR representan la ordenación real de la contingencia, OO la ordenación obtenida por las redes RBF, OR-OO la diferencia (en número de posiciones) entre la ordenación real y obtenida, PIR representa el índice de prestación real, PIO el índice de prestación obtenido y la última columna la diferencia entre estos dos últimos índices. . . . . . . . . . . . . . . . . . . . 137 5.6. Identicación de las neuronas activadas y el valor correspondiente PI corre- spondientes a la gura 5.8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 vi Índice de guras 1.1. Esquema de las operaciones implicadas en la gestión de un sistema eléctrico estudiadas en esta tesis y la solución neuronal correspondiente. . . . . . . . . 7 2.1. Diagrama de un modelo de predicción general. . . . . . . . . . . . . . . . . . . 14 2.2. Diagrama de las redes realimentadas tipo Jordan (a), Elman (b) y Residual (c). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.3. Red neuronal con la salida realimentada para implementar un modelo ARMA no lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4. Arquitectura del sistema de predicción de carga basado en RNAs . . . . . . . 30 2.5. Valor del radio de vecindad durante el entrenamiento de la red de Kohonen. El eje x representa el porcentaje de iteraciones. . . . . . . . . . . . . . . . . . 33 2.6. Distribución nal de los perles de consumo diario usados en el entrenamiento de la red de Kohonen para la Zona Centro de España. S.C. indica superclase. 34 2.7. Esquema del funcionamiento on-line del predictor de carga. . . . . . . . . . . 41 2.8. MAPE para todos los patrones de la clase 14. . . . . . . . . . . . . . . . . . . 44 2.9. Resultados de predicción y curva real para los días laborables de la segunda semana de julio de 1997 (clase 14). . . . . . . . . . . . . . . . . . . . . . . . . 44 2.10. Resultados de predicción y curva real para el periodo de Semana Santa de 1998. 45 3.1. Representación de una red de Hopeld. . . . . . . . . . . . . . . . . . . . . . . 54 3.2. Diagrama de ujo con las tareas principales implicadas en la estimación de estado con una red de Hopeld. . . . . . . . . . . . . . . . . . . . . . . . . . . 57 vii ÍNDICE DE FIGURAS 3.3. Evolución de la energía de una red de Hopeld aplicada a problemas de es- timación de estado para diferentes métodos de activación de sus neuronas: activación secuencial (S), activación aleatoria restringida (RR) y activación aleatoria (R). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.4. Valores óptimos obtenidos para el parámetroα en la estimación de estado. . . 61 3.5. Representación de la dispersidad de la matriz de pesos para la red de Hopeld aplicada al problema de la estimación de estado. Los elementos diferentes de cero se representan con un rectángulo no blanco. . . . . . . . . . . . . . . . . 63 3.6. Estructuras de datos utilizadas en la implementación de la red de Hopeld aplicada a problemas de estimación de estado. . . . . . . . . . . . . . . . . . . 64 3.7. Evolución del residuo en cada iteración de los algoritmos de estimación neu- ronal y clásico. (a) Red IEEE-14. (b) Red IEEE-30. (c) Red IEEE-57. (d) Red IEEE-118. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4.1. Estructura general del estimador topológico. . . . . . . . . . . . . . . . . . . . 80 4.2. Representación de un bus de una red, con un generador, una carga y dos líneas. 82 4.3. Función de transferencia de base radial para diferentes valores deσ. . . . . . . 84 4.4. Representación esquemática de la etapa de preprocesamiento de base radial para un patrón con 3 medidas de potencia activa y 3 de reactiva. . . . . . . . 84 4.5. Representación de las salidas de la etapa de preprocesamiento para patrones típicos de dos topologías diferentes. . . . . . . . . . . . . . . . . . . . . . . . . 86 4.6. Arquitectura del estimador topológico neuronal local. . . . . . . . . . . . . . . 87 4.7. Márgenes asignados a las salidas de la red neuronal para determinar el estado abierto, cerrado o de indecisión. . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.8. Evolución de la suma del error cuadrático y de la tasa de aprendizaje durante el entrenamiento de la red neuronal. . . . . . . . . . . . . . . . . . . . . . . . 89 4.9. Representación esquemática del bus 2 y sus vecinos en la red IEEE-14.. . . . . 96 viii ÍNDICE DE FIGURAS 4.10. Representación de la etapa de preproceso y la salida del asistente topológico basado en funciones potenciales de Gauss. (a) Etapa de preproceso. (b) salida de la etapa de preproceso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.11. Esquema de la etapa de clasicación del asistente topológico basado en fun- ciones potenciales de Gauss. (a) Representación de las neuronas de base radial con distancia de Mahalanobis, que constituyen la etapa de clasicación del asistente topológico. (b) Salida. . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.12. Patrón para la variación de la carga diaria de los buses. . . . . . . . . . . . . 106 4.13. Salidas de la etapa de clasicación para patrones pertenecientes a diferentes topologías, cuando todas las medidas del bus están disponibles. . . . . . . . . 108 4.14. Salidas de la etapa de clasicación para patrones pertenecientes a diferentes topologías, cuando una de las medidas del bus no está disponible. . . . . . . . 110 5.1. Coecientes aplicados al patrón base de cada red para obtener patrones con diferentes cargas del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 5.2. Representación esquemática de la selección de características mediante Análi- sis por Componentes Principales para RNAs.. . . . . . . . . . . . . . . . . . . 127 5.3. Representación gráca de los valores real y calculado del índice de prestación PIp, 1 para el conjunto de los patrones de prueba. . . . . . . . . . . . . . . . 131 5.4. Representación gráca de los valores real y calculado del índice de prestación PIp, 1 para el conjunto de los patrones de prueba. . . . . . . . . . . . . . . . 135 5.5. Representación esquemática de la distribución de un espacio n-dimensional de entrada en un espacio bidimensional mediante un Mapa Auto-Organizativo de Kohonen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 ix ÍNDICE DE FIGURAS 5.6. Representación de la clasicación de los patrones obtenida por la red de Ko- honen para la contingencia 1. Los símbolos de la gura se han seleccionado en función del índice de prestación de cada patrón. Cada subgráco o rectán- gulo representa una neurona del mapa. El rectángulo de la esquina superior izquierda es la neurona 1, el rectángulo de la esquina superior derecha es la neurona 10 y el rectángulo de la esquina inferior derecha corresponde a la neu- rona 100. Los huecos de la gura representan neuronas a la que no pertenece ningún patrón. El mapa de Kohonen representado es de dimensión 10x10. . . 140 5.7. Representación de la clasicación de los patrones obtenida por la red de Ko- honen para la contingencia 13. . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 5.8. Mapa de Kohonen para la contingencia 10 y las neuronas activadas para patrones con diferentes PI no utilizados durante el entrenamiento. . . . . . . . 143 5.9. Representación de los índices de prestación de la contingencia 10 para varios patrones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 5.10. Visualización de varios Mapas de Kohonen lineales en una misma gura. Se han representado 10 Mapas de Kohonen lineales de 1 x 30 neuronas cada uno. Cada la de la gura representa el Mapa de Kohonen visualizado para cada contingencia particular. Las contingencias visualizadas son la 3, 4, 7, 8, 9, 11, 14, 17, 26 y 33 de la red IEEE-118. . . . . . . . . . . . . . . . . . . . . . . . . 145 5.11. Representación del nivel de peligrosidad que ha producido un determinado patrón presentado a la red de Kohonen Lineal. La neurona ganadora es la neurona 7, pero su nivel de peligrosidad es distinto para cada contingencia, como muestra el correspondiente atributo de la neurona 7 en cada la de la gura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5.12. PI, para la contingencia 3, de 26 patrones no usados durante el entrenamiento del SOM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 5.13. Respuesta del SOM lineal de la contingencia 3 a cada uno de los patrones de la gura 5.12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 x ÍNDICE DE FIGURAS A.1. Red neuronal alimentada hacia delante tipo MLP, con dos capas de neuronas ocultas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 A.2. Dirección del ujo de información durante la ejecución (orecall) de un MLP. 159 A.3. Dirección del ujo de información durante la fase propagación hacia atrás del error. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 A.4. Estructura de una red de funciones base radiales. . . . . . . . . . . . . . . . . 164 A.5. Representación de una red de Elman. . . . . . . . . . . . . . . . . . . . . . . . 167 A.6. Disposición bidimensional de las neuronas de una red de Kohonen. . . . . . . 169 A.7. Representación esquemática de la distribución de un espacio n-dimensional de entrada en un espacio bidimensional mediante un Mapa Auto-Organizativo de Kohonen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 A.8. Vecindad topológica cuadrada para una red de Kohonen bidimensional. Las neuronas vecinas de n para varios valores de la función A son todas las inclu- idas en el cuadrado correspondiente.. . . . . . . . . . . . . . . . . . . . . . . . 171 A.9. Arquitectura de una red de Hopeld. . . . . . . . . . . . . . . . . . . . . . . . 172 B.1. Componentes principales de un análisis de seguridad on-line ([Balu et al., 1992]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 C.1. Diagrama de la red IEEE 14. . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 C.2. Diagrama de la red IEEE 30. . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 C.3. Diagrama de la red IEEE 57. . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 C.4. Diagrama de la red IEEE 118. . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 xi ÍNDICE DE FIGURAS xii Capítulo 1 Introducción 1.1. Introducción Las Redes Neuronales Articiales (RNAs) constituyen una herramienta de computación fácilmente aplicable -incluso como caja negra mediante programas de ordenador especícos- a problemas generales como predicción de series temporales, clasicación, optimización y aproximación funcional. Esto permite su aplicación de manera unicada a una amplia gama de problemas reales en diversos campos de la ciencia y la ingeniería. Así, problemas como la predicción de la demanda de energía eléctrica, la predicción del consumo de una materia prima o la predicción del comportamiento de un determinado índice económico pueden ser modelados como un problema de predicción de series temporales y resueltos por un mismo paradigma neuronal de aprendizaje supervisado como el Perceptrón Multicapa o las Redes de Funciones Base Radiales; el análisis de contingencias o de fallos en un sistema o la división de una determinada población según determinados factores socioeconómicos puede ser entendido como un problema de clasicación y resuelto mediante paradigmas neuronales no supervisados como los mapas de Kohonen; la identicación de sistemas, esto es, la estimación de los parámetros que intervienen en un modelo basado en Ecuaciones Diferenciales Ordinarias, puede ser descrito como un problema de optimización y resuelto mediante redes neuronales de Hopeld, etc. [Joya et al., 2002b]. Por otro lado, estas técnicas están basadas en paradigmas que presentan un compor- tamiento interno altamente complejo y muy difícil de describir de manera sistemática. Estas dos características, facilidad para ser implementadas y dicultad para comprender 1 Introducción en profundidad cómo trabajan, han favorecido, por una parte, su rápida extensión en prácti- camente todos los campos de la ciencia y la técnica pero, por otra parte, un alto porcentaje de uso espurio y de resultados engañosos. Este uso espurio que con frecuencia podemos encontrar publicado en congresos y re- vistas, incluso avalado por grupos de investigación con una larga historia en el campo, con- tribuye sin duda a minar la reputación de las Redes Neuronales Articiales, de las que suele decirse de manera irónica que "son la segunda mejor herramienta para resolver cualquier problema". Consideramos, por tanto, que se hace necesario, por parte de quienes usan ha- bitualmente estas herramientas, un esfuerzo por conocer con la mayor profundidad posible las características teóricas de cada paradigma neuronal, sus restricciones y su campo de aplicación. En este contexto se enmarca el primer objetivo general de esta tesis: el estudio de las Redes Neuronales Articiales, tanto en sus aspectos teóricos como en sus aspectos de aplicación a la resolución de problemas reales. Este objetivo general puede descomponerse en otros especícos entre los que destacaríamos los siguientes: Establecer las características que debe presentar un determinado problema para que sea recomendable su resolución mediante RNAs. En este sentido, podría proponerse como regla básica la siguiente: Si un problema puede resolverse utilizando métodos analíticos, numéricos o al menos algorítmicos satisfaciendo las condiciones establecidas en cuanto a tiempo de cálculo y carga computacional, entonces, no intentar resolverlo con métodos neuronales. Para un problema dado, establecer el paradigma neuronal más adecuado para su res- olución. Cada paradigma neuronal tiene características que lo hacen adecuado para problemas de un tipo particular. Así, para problemas de clasicación, los paradigmas más utilizados son el Perceptrón Multicapa (MLP), los Mapas Auto-Organizativos (SOM) o el Learning Vector Quantization (LVQ). Por otro lado, para problemas de aproximación funcional, la red de funciones base radiales (RBF) es comúnmente elegido como mejor candidato, debido a que permite dividir el espacio de entrada en subre- giones, cada una de las cuales es aproximada por una o más neuronas. En otros muchos 2 1.1 Introducción casos, el problema sólo podrá ser resuelto mediante la construcción de otras estructuras neuronales más complejas. Una vez elegido un paradigma, determinar su estructura topológica adecuada. Esto supone disponer de criterios para seleccionar las variables que deben intervenir como entradas a la red, su número de neuronas ocultas y la forma en que se producirá la información de salida. Conocer las peculiaridades de cada una de las funciones de activación que pueden ser incorporadas a una neurona, así como su efecto en el funcionamiento general del sistema. Conocer los distintos algoritmos de entrenamiento o de evolución dinámica de los diferentes paradigmas y su incidencia en el tiempo de convergencia y en la precisión de la solución alcanzada. Pero, para avanzar en la consecución de estos objetivos, se hace necesario disponer de un conjunto de problemas que sirvan de entorno de utilización de los distintos paradigmas estudiados. Estos problemas deben presentar unas características que no sólo hagan posible sino justicable, recomendable y útil su ataque mediante Redes Neuronales Articiales. En este trabajo, se han elegido como casos de estudio los problemas reales relacionados con la Gestión de un Sistema de Energía Eléctrica (EMS, Energy Management System en su versión inglesa), en particular, los relacionados con la predicción de la demanda eléctrica, el análisis de contingencias y la estimación de estado, la cual incluye las subtareas de estimación topológica y observabilidad. Entendemos que estos problemas se adaptan de manera óptima a los intereses de este trabajo por tres razones fundamentalmente: 1.- Cada uno de ellos puede ser descrito de manera genérica como alguna de las tareas recomendadas para el uso de redes neuronales. Así, la predicción de la demanda eléctrica puede denirse como un problema de predicción de series temporales y nos permitirá analizar la aplicabilidad y limitaciones de los paradigmas basados en el aprendizajeBackpropagation (Perceptrón Multicapa y Redes de Elman); el análisis de contingencias puede plantearse como un problema de aproximación funcional o de monitorización gráca, lo que permitirá analizar el comportamiento de redes alimentadas hacia delante con aprendizaje supervisado 3 Introducción en el primer caso (Perceptrón Multicapa y Redes de Funciones Base Radiales) y el de redes de tipo Auto-Organizativo en el segundo (Mapas Auto-Organizativos de Kohonen); nalmente, la estimación de estado puede ser enfocada como un problema de optimización, por lo que será utilizada para estudiar el margen de aplicabilidad de redes cuya dinámica sigue la evolución de una función de energía (redes recurrentes de Hopeld). 2.- Estas tareas presentan muchas de las características que dicultan una solución basada en métodos numéricos o algorítmicos, y que por tanto, hacen más justicable el uso de redes neuronales. Estas características son: a) existencia de un gran número de datos tales como medidas de fasores de tensión y corriente, ujos de potencia activa y reactiva medidos en ambos extremos de la línea, estados de interruptores, posición de tomas de transformadores, etc.; b) las relaciones entre las distintas variables son excesivamente complejas y, en muchos casos, desconocidas; c) estos datos son difícilmente interpretables y manejables en tiempo real por un operador humano, y la adquisición de una experiencia completa por parte de éste requiere un tiempo muy largo; d) los métodos numéricos que pueden ser aplicados impiden en un gran número de casos encontrar soluciones en tiempo real; e) la solución no puede ser descrita por medio de un conjunto simple de reglas basado en el conocimiento experto. 3.- Los problemas elegidos, no son sólo ejercicios académicos, sino que siguen siendo proble- mas abiertos en el sentido de que las soluciones actualmente en funcionamiento son mani- estamente mejorables. Como resultado de la elección de estos casos de estudio, podemos hablar de un segundo objetivo general para nuestra tesis, el cual contiene la parte práctica y de aplicación de la misma: la resolución de diversos problemas relacionados con la gestión de un sistema de energía eléctrica mediante técnicas neuronales articiales. En denitiva, y como resumen, podemos decir que el objeto de esta tesis es el estudio de aplicabilidad y limitaciones de los paradigmas más representativos de las Redes Neuronales Articiales y su aplicación a tareas relacionadas con la Gestión de un Sistema de Energía Eléctrica. 4 1.2 Estructura de la tesis 1.2. Estructura de la tesis El resto de este trabajo se distribuye del siguiente modo. El capítulo 2 está dedicado a la predicción de la demanda de energía eléctrica mediante redes neuronales articiales. Tras un repaso bibliográco del estado del arte, se presenta un modelo neuronal compuesto de dos etapas. En la primera fase se realiza una clasicación no supervisada mediante redes Auto-Organizativas de tipo SOM, que permite dividir la serie temporal original en subseries atendiendo a criterios de estacionalidad y laboralidad. La segunda etapa consiste en la predic- ción de la función de consumo. Esta etapa se ha implementado mediante redes neuronales recurrentes de Elman. Este modelo neuronal contiene las ventajas de los modelos recurrentes frente a los alimentados hacia delante, mientras que permite el aprovechamiento de la gran variedad de algoritmos de entrenamiento desarrollados para el Perceptrón Multicapa. El capítulo 3 describe la aplicación de las RNAs al problema de la estimación de estado. Se estudia el paradigma de Hopeld y se proponen modicaciones en la evolución temporal de la red y de otros parámetros para su aplicación a este problema particular. El capítulo 4 se dedica al problema de la estimación de la topología de una red eléctrica a partir de medidas disponibles para la estimación de estado. Se proponen dos modelos neuronales complejos para abordar este problema, siendo el segundo una mejora sustancial del primero. En primer lugar, se propone un modelo neuronal compuesto por dos etapas. Una etapa de preproceso, cuya función es la de convertir las medidas asociadas a un bus en patrones característicos de la topología real del bus. En la segunda etapa, se realiza una clasicación de los patrones preprocesados mediante un MLP. En segundo lugar, se propone un asistente topológico que reemplaza al MLP por una red neuronal de funciones base radiales con distancia de Mahalanobis, más eciente que el MLP y que no necesita de un entrenamiento supervisado previo. El capítulo 5 se dedica a la aplicación de las RNAs a problemas de seguridad en un sistema de Energía Eléctrica, concretamente al análisis de contingencias. El problema se aborda tanto desde el punto de vista de la ordenación de contingencias según su gravedad, como desde su monitorización. En el primer caso, se utilizan tanto MLP como RBF para encontrar los índices de prestación asociados a las posibles contingencias, y se realiza un estudio de las soluciones aportadas por los dos modelos. En el segundo, se utilizan redes 5 Introducción tipo SOM para la visualización y monitorización del estado actual del sistema frente a contingencias. Se presentan dos modelos diferentes, el primero un SOM bidimensional y el segundo un SOM lineal que mejora en gran medida la aplicabilidad de este paradigma al problema de la visualización y monitorización de contingencias. El capítulo 6 presenta las conclusiones y líneas futuras. La gura 1.1 muestra, a modo de resumen, las diferentes operaciones implicadas en un EMS que han sido estudiadas en este trabajo, y la correspondiente solución neuronal que se ha aportado. Puesto que esta tesis unica dos campos de trabajo bastante distantes en principio: las redes neuronales articiales y los sistemas de gestión de energía eléctrica, se han añadido dos apéndices (apéndices A y B) describiendo las características básicas de cada uno de ellos. El apéndice C presenta los diagramas de las redes estándares IEEE utilizadas como banco de pruebas a lo largo de este trabajo. 6 1.2 Estructura de la tesis Figura 1.1: Esquema de las operaciones implicadas en la gestión de un sistema eléctrico estudiadas en esta tesis y la solución neuronal correspondiente. 7 Introducción 8 Capítulo 2 Predicción de la demanda de energía eléctrica 2.1. Introducción El objetivo de la predicción de la demanda de energía eléctrica es obtener los val- ores futuros del consumo eléctrico en función de los valores del consumo pasado. Los valores predichos de demanda se utilizan para la planicación del sistema eléctrico de potencia, prin- cipalmente para la elección de las plantas de generación que producirán la energía requerida. Debido a que existen diferentes tipos de plantas de generación, cada una con restricciones de funcionamiento y con costes de producción diferentes, es esencial conocer con suciente an- telación y precisión el consumo de energía futuro con diferentes horizontes. Por otro lado, se debe garantizar el suministro seguro y, dado que la energía eléctrica no se puede almacenar ecientemente, es necesario que en todo momento se genere exactamente la energía necesaria para mantener el sistema en un estado seguro. Sin embargo, la tarea se presenta como un problema complejo debido a que la demanda exhibe grandes variaciones diarias, semanales y estacionales, que dependen de muchas variables y que son difíciles o imposibles de modelar con exactitud. Por estas razones, la investigación en campos relacionados con la predicción de la demanda de energía eléctrica ha tenido en los últimos años un auge muy importante, sobre todo debido a las condiciones de deregularización a la que se están sometiendo muchos países, entre ellos el nuestro. Esta deregularización del mercado ha condicionado el perio- do de predicción para ajustarlo a los periodos de operación del mercado y exige disponer de predicciones con una exactitud cada vez mayor. Esto está impulsando la utilización de 9 Predicción de la demanda de energía eléctrica nuevas técnicas de computación inteligente como son las redes neuronales articiales. En este capítulo se presenta una revisión de las propuestas más signicativas que abor- dan el problema de la predicción de carga utilizando redes neuronales articiales, y se pro- pone un modelo neuronal de predicción del perl diario de demanda eléctrica basado en la secuenciación de dos paradigmas: en un primer nivel se realiza una clasicación de la serie temporal mediante mapas Auto-Organizados de Kohonen [Kohonen, 1990], que ha permitido dividir la serie temporal en subseries más regulares, que son mejor procesadas por las redes neuronales. Además, esta clasicación nos ha permitido eliminar la necesidad de utilizar como entradas al modelo variables exógenas cuyo efecto en la serie no es fácilmente pon- derable y cuya codicación adecuada para ser utilizada en un modelo neuronal se presenta difícil. En un segundo nivel, el modelo de predicción propuesto utiliza redes recurrentes de Elman [Elman, 1990] para encontrar los valores futuros de cada subserie disponible. Como complemento al predictor del perl diario de carga se propone un predictor de demanda con un horizonte de una hora (predictor horario), que se adapta mejor a cambios en la curva de consumo dentro de las 24 horas, debidos a condiciones imprevistas como factores meteorológicos. El capítulo se estructura de la siguiente forma. En primer lugar, se formaliza el problema de la predicción de series temporales en general y el de la demanda de energía eléctrica en particular (sección 2.2). En la sección 2.3 se presentan los modelos neuronales más utilizados para abordar este problema y se realiza un repaso bibliográco de los modelos más signica- tivos. En la sección 2.4 se analizan los problemas que se encuentran en la aplicación de RNAs a los problemas de predicción, y que intentamos resolver con nuestro modelo. En la sección 2.5 se presenta en detalle el modelo de predicción propuesto en este trabajo y se analizan los resultados de funcionamiento. Por último, la sección 2.6 presenta las conclusiones del capítulo. 2.2. Predicción de series temporales Una serie temporal T = {~x1, ~x2, ..., ~xn−1, ~xn} es un conjunto de datos discretos cap- turados o medidos desde algún proceso o fenómeno. Cada variable~x representa un vector, que si tiene un único componente se denomina serie univariante, mientras que si tiene más 10 2.2 Predicción de series temporales de un componente se denomina multivariante. Se dice que la serie temporal es de ordenp si es posible encontrar un valor futuro de la misma utilizando únicamente p valores pasados. Formalmente, el problema de la predicción de series temporales se puede formular como el proceso de encontrar una función F : 2n−1), la estimación de estado consiste en la resolución del sistema redundante de ecuaciones (3.2.1): z = h(x) + υ (3.2.1) 50 3.2 La estimación de estado como problema matemático donde z representa el vector de medidas disponibles, x es el vector de estado verdadero desconocido (módulo y fase de las tensiones de los nodos de la red),h representa el vector de ecuaciones no lineales que relacionan las medidas con las variables de estado yυ es el vector de errores de las medidas. En una estimación clásica, las medidas del vectorz están constituidas por ujos de potencia activa y reactiva (Pij , Qij), inyecciones de potencia activa y reactiva (Pi, Qi), y módulos de tensión de nudo (Vi); y el vector x corresponde a n módulos de tensión de nodo yn−1 fases (Vi, θi), utilizándose una de las fases como fase de referencia. Se supone que los errores υi son variables aleatorias independientes que siguen una distribución gaussiana de media cero y varianzaσ2i conocida. El método de estimación de estado más extendido es el denominado estimador de mín- imos cuadrados ponderados o WLS (Weighted Least Squares). Éste tiene como objetivo minimizar la ecuación (3.2.2): ∑ (zmi − h 2(x) = i(x))J 2 = [z− h(x)]tW [z− h(x)] (3.2.2)σ i i donde W es la inversa de la matriz de covarianzas de errores de las medidasR = E[υυt] = diag(σ2σ2, ..., σ21 2 m). Para encontrar el mínimo de la función (3.2.2), debe satisfacerse que ∂J(x)∂x = 0, o G(x̂) = H(x̂)T W [z− h(x̂)] = 0 (3.2.3) donde H(x) = ∂h(x)∂x es la matriz jacobiano y x̂ es el vector de estado estimado. La solución de esta ecuación se puede obtener por el método iterativo que resuelve en cada iteración la ecuación (3.2.4) ([Zarco Periñán and Gómez Espósito, 1999]): [ ] A(xk)∆xk = −HT (xk)W z− h(xk) (3.2.4) obteniéndose la corrección del vector de estadoxk+1 = xk +∆xk, donde A(xk) es una matriz no singular que depende del método utilizado. El método de Newton utilizaA(x) = Ht(x)W [z−h(x)], con lo que el sistema a resolver viene dado por la ecuación (3.2.5): G(x)∆x = HT (x)W [z− h(x)] (3.2.5) 51 Estimación de estado donde G(x) se denomina matriz de ganancia. Esta matriz es dispersa, denida positiva y simétrica. La ecuación (3.2.5) se resuelve generalmente mediante la factorización triangular de la matriz de ganancia G = U tU , donde U es una matriz triangular superior. Aunque éste método de estimación de estado es el más extendido, se han formulado diversas alternativas que buscan optimizar la estabilidad numérica y la eciencia computa- cional del método WLS. Entre las alternativas más notables cabe destacar las que utilizan transformaciones ortogonales, el método deHachtel [Gjelsvik et al., 1985] o el método de mínimos valores absolutos. Estos estimadores parten de una información topológica que es considerada como ver- dadera en todo momento, produciendo una estimación que debe ser coherente con dicha topología. Si el estado de alguno de los elementos que denen la topología es erróneo, esto es, se considera el estado de un interruptor abierto cuando realmente esta cerrado o vicever- sa, el estimador puede dar una respuesta errónea, sin que sea detectable de forma automática la causa del error. El modelado explícito del estado de interruptores o seccionadores como variables de estado se realiza en los denominados estimadores de estado generalizados ([Mon- ticelli, 2000], [de la Villa Jaén and Expósito, 2001]), donde una parte de la red se modela en el nivel de buses y ramas (estimación de estado normal) y otra parte, más reducida, se modela en el nivel físico o de nodos para realizar la estimación del estado de los elementos topológicos a partir del uso de medidas tomadas en ramas o dispositivos de conmutación con impedancia nula. La principal ventaja de este tipo de estimación de estado es que facilita el análisis de las medidas erróneas producidas por errores en la topología de la red, aunque su aplicación queda limitada por el aumento computacional que requiere la modelización de toda la red en el nivel de nodo, siendo sólo aplicable a un reducido número de buses en cada estimación de estado. 3.3. Estimación de estado con redes de Hopeld Varios son los autores que han aplicado el paradigma de Hopeld [Hopeld, 1982; Hop- eld and Tank, 1985] a problemas relacionados con la gestión de sistemas eléctricos de potencia. Así, en [Mori, 1991] se utiliza esta red para determinar la observabilidad topológ- ica de un sistema de potencia. En [King et al., 1995] se aborda el problema del despacho 52 3.3 Estimación de estado con redes de Hopeld económico y medioambiental óptimo con redes de Hopeld. En [Zivanovic and Petroianu, 1994] se aplica el principio de desacoplamiento y se obtiene un modelo neuronal para la estimación de estado con dos redes de Hopeld funcionando en paralelo. En [Vinod Kumar et al., 1996] se aplica a la estimación de estado y a la determinación de la topología. En [Nakawaga et al., 1991] utiliza este paradigma para la estimación de estado de una red de seis nodos. Nuestro estudio toma como punto de partida este último trabajo, aplicando el paradigma propuesto a la estimación de las redes estándares de 14, 30, 57, 118 y 300 buses. La red de Hopeld se caracteriza por tener una sola capa, ser realimentada y operar en tiempo continuo [Sympson, 1990]. El modelo continuo es una modicación de la red original que opera en tiempo discreto y sólo puede manejar datos binarios/bipolares. Esta transición abrió la aplicabilidad de la red de Hopeld a muchos problemas de optimización en el que las variables son continuas. La gura 3.1 muestra el esquema de una red de Hopeld. Analíticamente, la evolución de la red, en el modelo de Abe [Abe, 1989], viene dada por las ecuaciones (3.3.1), (3.3.2) y (3.3.3): du ∑i = TijVi + Ii (3.3.1) dt i Vi = fi(Ui) (3.3.2) 1 fi(Ui) = (3.3.3)1 + e−αUi donde Tij : Peso de la conexión que va desde la neurona j a la i. Ii: Entrada (también denominada polarización obías) de la neurona i. Ui: Potencial de la neurona i. fi: Función de transferencia de la neurona i. Existen diversas posibilidades para la elección de esta función, pero la más común es la función sigmoide. α: Constante que dene la pendiente de la función de transferenciafi. Vi: Salida de la neurona i. 53 Estimación de estado                    Figura 3.1: Representación de una red de Hopeld. La función de transferencia dada por la ecuación (3.3.3) produce salidas en el intervalo [0, 1]. Cuando se requiere que las salidas de las neuronas estén en el intervalo[li, hi] puede utilizarse la expresión dada por la ecuación (3.3.4): h − l Vi = i i fi(Ui) = + I (3.3.4)1 + e−αU ii Una de las características más importantes de este tipo de redes es la simetría de la matriz de pesos, es decir, Tij = Tji, y que los autopesos Tii son siempre positivos. La red tiene una función de energía que viene dada por la ecuación (3.3.5) [Abe, 1989]: 1 ∑∑ ∑ E = − TijViVj − IiVj (3.3.5)2 i j i Esta función de energía decrece monótonamente cuando la red evoluciona a lo largo del tiempo. Esta característica es la clave en la aplicación de este paradigma a la resolución de problemas de optimización [Joya et al., 2002a]. Por tanto, para la aplicación de este modelo neuronal es necesario convertir la función que se desea optimizar en una función de energía de Hopeld, a partir de la cual se derivan los parámetros (pesos y entradas) de la red. Este es el objetivo de la siguiente sección para el problema particular de la estimación de estado. 54 3.3 Estimación de estado con redes de Hopeld 3.3.1. Adaptación de los pesos de la red de Hopeld para la estimación de estado La red de Hopeld evoluciona de tal manera que la función de energía que la dene decrece en cada iteración hasta encontrar un mínimo local o global. En el problema de estimación de estado estamos interesados en minimizar el error residual de las mediciones. El objetivo es calcular los parámetros de una red de Hopeld para convertir el error residual de la estimación en una función de energía para dicha red. Sea h(x) el vector de ecuaciones no lineales que relaciona el vector de estado x, en coordenadas rectangulares, con las medidas z. La expansión de h(x) en serie de Taylor alrededor del punto de operación xe tiene la expresión exacta dada por la ecuación (3.3.6) ([Iwamoto and Tamura, 1978; Habiballah and Quintana, 1991]): h(x) = h(xe) + H(xe)∆x + h(∆x) (3.3.6) donde H(x ) = ∂h(x)e ∂x |x=xe es la matriz jacobiano, h(∆x) = h(x) |x=∆x y ∆x = x− xe. Reemplazando el valor de h(x) dado por la ecuación (3.3.6) en la ecuación (3.2.2), se obtiene la ecuación (3.3.7): 1 J(x) = [z − h(xe)−H∆x− h(∆x)]T R−1 [z − h(xe)−H∆x− h(∆x)] (3.3.7)2 Deniendo ahora ∆z según la ecuación (3.3.8): ∆z = z − h(xe)− h(∆x) (3.3.8) podemos expresar (3.3.7) según la ecuación (3.3.9): 1 J(x) = [∆z −H∆x]T R−1 [∆z −H∆x] (3.3.9) 2 Utilizando las igualdades (A − B)T = AT − BT y (A ∗ B)T = BT ∗ AT , y resolviendo los productos, la ecuación (3.3.9) queda como la ecuación (3.3.10): 1 [ ] J(x) = ∆zT R−1∆z −∆xT HT R−1∆z −∆zT R−1H∆x + ∆xT HT R−1H∆x (3.3.10) 2 Deniendo ahora T , I y K según las ecuaciónes (3.3.11), (3.3.12) y (3.3.13) : T = −HT R−1H (3.3.11) 55 Estimación de estado I = HT R−1∆z (3.3.12) 1 K = ∆zT R−1∆z (3.3.13) 2 la ecuación (3.3.10) se transforma en 1 ∑∑ ∑ J(x) = − T 2 ij ∆xi∆xj − Ii∆xi + K (3.3.14) i j i Dado que añadir una constante a una función no modica el proceso de minimización para dicha función, la ecuación anterior es una función de energía para una red de Hopeld si tomamos como pesos de la red la matriz T , como entradas (o bias) el vector I y como salidas de las neuronas el vector∆x: 1 ∑∑ ∑ E = − TijViVj − IiVj + K (3.3.15)2 i j i El proceso completo de estimación de estado utilizando la red de Hopeld se representa en el diagrama de ujo mostrado en la gura 3.2. El primer bloque, denominado Inicial- ización, consiste en determinar las islas observables de la red, el conjunto nal de medidas disponibles y determinar un vector de estado inicial (solución inicial). En el segundo bloque, se calcula el jacobiano del sistema para la solución actual, así como la diferencia entre el vector de medidas y el vector de medidas estimadas. La matriz jacobiano y el vector difer- encia se utilizan para determinar los pesos T y las entradas I de la red de Hopeld en el siguiente bloque. El siguiente paso consiste en ejecutar la red de Hopeld hasta llegar a un mínimo de su función de energía. Una vez terminada la ejecuación de la red, las salidas de la misma se toman como los incrementos de las variables de estado, que permite actualizar el vector de variables de estado estimadas xe. El proceso se repite, para el nuevo vector de estado calculado, hasta que se alcance el objetivo de convergencia (p.e. que el incremento último de las variables de estado esté por debajo de un determinado umbral). En las siguientes secciones se aborta el estudio del bloque principal del estimador de estado basado en redes de Hopeld, constituido por el bloque que realiza la ejecución de la red. El funcionamiento de este bloque determinará en última instancia la aplicabilidad y eciencia del estimador completo. 56 3.3 Estimación de estado con redes de Hopeld Inicialización: D e t e r m inar t o p o lo g í a D e t e r m inar r e d o b s e r v ab le D e t e r m inar v e ct o r d e m e d id as S o lu ción inicial: Xe = X0 CC alcuu larr JJ acoo bb ianoo yy vv ee ctt oo rr dd ee mm ee dd idd ass ee ss tt imm add ass : HH (x) = ∂h(x) ∂x x=x ∆ ZZ == ZZ – hh (( xx )) D e t e r m inar P e s o s , E nt r ad as y d e m á s P ar á m e t r o s d e la r e d : T , I Bloque E j e cu t ar la r e d d e H o p f ie ld P r i n c i p a l C alcu lar las s alid as d e la r e d V A ct u alizar v e ct o r d e e s t ad o : Xe = Xe + V N o ¿¿ CC oo nvv ee rr gg ee ncia?? Si F in Figura 3.2: Diagrama de ujo con las tareas principales implicadas en la estimación de estado con una red de Hopeld. 57 Estimación de estado 3.3.2. Implementación del modelo neuronal de Hopeld Debido a su naturaleza dinámica, la simulación por computador de una red de Hopeld requiere considerar varios factores que determinan la efectividad del modelo para abordar muestro problema. Concretamente, los factores a considerar son los siguientes: a) elección del método de activación de las neuronas; b) determinación de la pendiente de la función de transferencia; y c) resolución numérica de la ecuación (3.3.1). Estos factores suelen tener una alta dependencia con el problema particular que se trata de resolver, siendo generalemente imposible jar unos valores genéricos adecuados para cualquier problema. A continuación, se realiza el estudio de estos factores para el problema particular de la estimación de estado, y se propone un método de activación óptimo de neuronas, la elección de la pendiente de transferencia para las neuronas de la red y, nalmente, una ecuación para calcular automáticamente el paso de integración para aproximar numéricamente la ecuación (3.3.1) de forma automática y eciente ([García-Lagos et al., 1998a], [García-Lagos et al., 2000a]). 3.3.2.1. Selección del método de activación de neuronas en la red de Hopeld Para la activación de las neuronas se han considerado los siguientes métodos: Activación aleatoria. En cada iteración se elige una neurona al azar y se activa. Activación aleatoria modicada. En cada iteración se elige una neurona al azar y se activa, pero esta misma neurona no podrá volver a activarse hasta que las demás lo hayan sido por lo menos una vez. A este método de activación lo denominaremos activación aleatoria restringida. Activación por orden, o secuencial, en el que cada neurona se activa después de la que la precede y antes de la que la sucede, según una disposición inicial cualquiera. Utilizando los tres métodos de activación anteriores, la red de Hopeld ha sido utilizada para realizar la estimación de estado de varias redes eléctricas estándar. La gura 3.3 muestra la evolución de la función de energía (ecuación (3.3.15)) para cada método para varias simulaciones con conguración de medidas típicas. Los mejores resultados se obtienen con el 58 3.3 Estimación de estado con redes de Hopeld 2 10 S RR R 1 10 0 10 -1 10 0 10 20 30 40 50 60 Iteración Figura 3.3: Evolución de la energía de una red de Hopeld aplicada a problemas de estimación de estado para diferentes métodos de activación de sus neuronas: activación secuencial (S), activación aleatoria restringida (RR) y activación aleatoria (R). método de activación aleatorio, mientras que los peores resultados se producen con el método de activación secuencial. La elección nal del método de activación de las neuronas no debe considerar únicamente los resultados obtenidos en la aplicación concreta, sino también la eciencia computacional de cada caso. En la implementación que se realiza aquí, el método de activación aleatorio restringido necesita tiempo de proceso adicional para memorizar las neuronas que han sido seleccionadas y que no deben serlo de nuevo hasta que todas las neuronas de la red sean seleccionadas una vez. Los resultados de simulación muestran que los métodos de activación aleatorio y aleatorio restringido necesitan aproximadamente entre un 70% y un 80% del tiempo requerido por el método de activación secuencial para obtener una misma solución, respectivamente. 3.3.2.2. Selección de la pendiente de las funciones de transferencia Normalmente, la función sigmoide (ecuación (3.3.4)) debe adaptarse para que las salidas de las neuronas tengan un rango apropiado al problema particular. En esta ecuación,hi determina el valor máximo de salida de la neurona i, mientras que li determina el valor mínimo. Por otro lado, la constanteα determina la pendiente de la función de transferencia, 59 Energía Estimación de estado lo que a su vez determina las características de convergencia de la red. Un valor deα muy grande hace que la función de transferencia sea muy abrupta, lo que puede provocar problemas de convergencia en la red. Por otro lado, un valor muy pequeño produce una convergencia muy lenta en la evolución de la red hacia el mínimo de su función de energía. El valor óptimo de este parámetro depende en gran medida de cada problema particular y, en general, no es posible utilizar un valor predeterminado. Por tanto, es necesario realizar una búsqueda, para cada red particular, de los valores óptimos deα, en el sentido de que su valor minimice la función de energía de la red, objetivo último de la dinámica de la red de Hopeld, empleando el menor tiempo posible. Así, dada una matriz de pesosT y unas entradas I, es posible obtener un valor óptimo para el parámetroα en el sentido de minimizar la función de energía, según la ecuación (3.3.16) ([Nakawaga et al., 1991]): ∂E 1 ∑∑ ∑ = − Tijmij − Iini = 0 (3.3.16) ∂α 2 i j i donde, para li = −0,5 y hi = 0,5, U = ( i ai 1 mij 2 )( − ) (3.3.17)bj bj 0,5 U = i ai ni 2 (3.3.18)bi a = e−αUii (3.3.19) b = 1 + e−αUii (3.3.20) Aplicando el método de Newton a la minimización de la ecuación (3.3.16) para cada iteración de la red de Hopeld se obtiene el valor óptimo de α que debemos utilizar en la ejecución de la red neuronal. La gura 3.4 presenta valores típicos obtenidos por este procedimiento en diversas ejecuciones. Esta gráca muestra que en las iteraciones iniciales el valor óptimo es pequeño (0,1 aproximadamente), valor que va aumentando hasta estabilizarse en 0,11 después de las 5 primeras iteraciones. A partir de estos resultados hemos podido vericar heurísticamente que un valor de 0,11 es válido para garantizar, incluso en las primeras iteraciones, la convergencia de la red. Este estudio nos ha permitido prescindir del proceso de búsqueda de una pendiente óptima en cada iteración del algoritmo. Así, utilizando un valor α = 0,11 queda garantizada la 60 3.3 Estimación de estado con redes de Hopeld 0.1105 0.11 0.1095 0.109 0.1085 0.108 0.1075 0.107 0 10 20 30 40 50 60 tiempo Figura 3.4: Valores óptimos obtenidos para el parámetroα en la estimación de estado. convergencia en la ejecución de la red, y se elimina el computacionalmente costoso proceso de encontrar el valor óptimo. 3.3.2.3. Determinación del paso de integración La simulación mediante ordenador de la dinámica de una red de Hopeld obliga a realizar una aproximación numérica de la ecuación (3.3.1). Un método eciente y simple basado en la fórmula de integración de Euler viene dado por la ecuación (3.3.21): ∆Ui = (T ∗ V + IT )∆t (3.3.21) donde ∆t es el parámetro que denominamos paso de integración. La elección del parámetro ∆t condiciona extraordinariamente la precisión de la solución nal obtenida por la red [Aten- cia et al., 2001], ya que la asociación de una función de energía al sistema es estrictamente cierta únicamente para una dinámica continua en el tiempo. De hecho, puede comprobarse experimentalmente que una red de Hopeld con un∆t = 1 puede perder su estabilidad, de manera que no alcance un estado estable, sino que describe un ciclo en el espacio de esta- do. Se comprueba que un ∆t sucientemente pequeño garantiza la estabilidad del sistema, aunque cuanto más pequeño sea∆t más lenta será la dinámica y, por tanto, la convergencia al mínimo de la función de energía. Además, el valor óptimo de este parámetro puede ser diferente en cada iteración de la simulación de la red. 61 Estimación de estado Una solución trivial para asignar valores a este parámetro consiste en comenzar con un valor grande e ir reduciéndolo hasta comprobar que la red converge, para lo cual hay que comprobar que la energía de la red decrece. Sin embargo, este método de prueba y error presenta el inconveniente de su alto coste computacional. Para evitar este problema, en este trabajo se desarrolla un método que permite el cálculo del valor correcto para∆t de forma directa. El método se basa en la normalización de la matriz de covarianzas de los errores asociados a las medidas en un problema de estimación de estado. Usando las medidas y variables de estado en valores por unidad, y normalizando la matriz de covarianzas de los errores R, se ha podido comprobar que los valores de∆t que verican la ecuación (3.3.22) son válidos para asegurar la convergencia de la ecuación (3.3.1). ≤ C∆t ∗ (3.3.22)max T V + IT donde C es un valor constante que depende del intervalo en el que se normalize la matriz R. El parámetro C únicamente debe ser calculado en la primera iteración de la simulación de la red para un problema particular. 3.3.3. Utilización de matrices dispersas con redes de Hopeld En las secciones anteriores se han derivado los parámetros que permiten utilizar una red de Hopeld para abordar el problema de la estimación de estado. En esta conguración, la red de Hopeld resuelve un sistema de ecuaciones en cada iteración para encontrar los incrementos de las variables de estado que minimizan los residuos. Debido a que los pesos de la red de Hopeld se obtienen a partir de la matriz Jacobiano del sistema (ecuación (3.3.11)), el número y estructura de los pesos de la red será similar a la matriz de ganancia de la estimación de estado clásica. Es bien conocido que esta matriz es dispersa (sólo un pequeño porcentaje de sus elementos tiene un valor no nulo), simétrica, y tiene una estructura que depende de la topología de la red eléctrica y de las medidas disponibles. Por tanto, la matriz de pesos de la red tendrá también una estructura similar. Los métodos de estimación clásica aprovechan la dispersidad de la matriz de ganancia para reducir los requisitos de memoria y de tiempo de cómputo necesarios para la resolución del sistema de ecuaciones utilizando técnicas de almacenamiento y aritmética para matrices dispersas. La gura 3.5 muestra la estructura de pesos para una estimación de estado particular de la red IEEE-14, donde puede apreciarse la estructura dispersa y simétrica de esta matriz. 62 3.3 Estimación de estado con redes de Hopeld Figura 3.5: Representación de la dispersidad de la matriz de pesos para la red de Hop- eld aplicada al problema de la estimación de estado. Los elementos diferentes de cero se representan con un rectángulo no blanco. En el caso de la red de Hopeld, la dispersidad de la matriz de pesos implica que la mayoría de las conexiones tienen un peso de valor cero, es decir, en su conceptualización, sus conexiones asociadas no existen. Además, puesto que la matriz de pesos es simétrica, sólo es necesario almacenar la parte inferior o superior de la matriz, además de la diagonal. Con estas consideraciones, la implementación de la red que de Hopeld para estimación de estado que se propone en este trabajo se muestra en la gura 3.6. Esta implementación requiere dos estructuras de datos. En la primera, se almacenan las entradas Ii (array I)), los valores internos Ui (array U) y las salidas Vi (array V ) de cada neurona. Por otro lado, la segunda estructura se utiliza para almacenar los pesos no nulos de la red. Así, si el peso Tij es no nulo, se crea una entrada donde se almacenan tres datos: el valor de Tij en el array T , el índice de la neurona i en el array F , y el índice de la neurona j en el array C. Con esta implementación, el cálculo de las salidas de la red neuronal se puede realizar ecientemente según el pseudocódigo que se muestra a continuación: Para i desde 1 hasta n U(i) = I(i); Para i desde 1 hasta el número de pesos no nulos U( F(i) ) = U( F(i) ) + T( F(i) , C(i) ) * V( C(i) ); Si i /= j 63 Estimación de estado Entradas I I1 I2 I3 In V. Inte rno s U U1 U2 U3 Un S al i das V V1 V2 V3 Vn Val o r de l p e so T Ti ,j Tl,k Tu,n Índi c e N e u ro na 1 F i l u Índi c e N e u ro na 2 C j k n Índi c e N e u ro na 1 ≤ Índi c e N e u ro na 2 Ti,j – P e so s no nu l o s Figura 3.6: Estructuras de datos utilizadas en la implementación de la red de Hopeld aplicada a problemas de estimación de estado. U( C(i) ) = U( C(i) ) + T( F(i) , C(i) ) * V( F(i) ); Para i desde 1 hasta n V(i) = f( U(i) ) Con esta implementación se consiguen dos objetivos: ahorro considerable de memoria, al no almacenarse los pesos cuyo valor es cero, y reducción del tiempo de cómputo para el cálculo de la salida de la red, ya que no se consideran los pesos nulos (multiplicación por cero). Además, los pesos que se almacenan en las listas T, F y C (ver gura 3.6) no tienen por qué seguir un orden particular, por lo que la inserción de nuevos elementos es una operación computacionamente muy simple. Los resultados que se obtienen utilizando la implementación dispersa, comparados con los resultados normales, muestran que se consigue una reducción signicativa del tiempo de computo necesario para alcanzar un mínimo en la función de energía de la red, lo que signica a su vez que el tiempo requerido para obtener el vector de estado en una estimación se reduce considerablemente, como muestra la tabla 3.1. Para la red IEEE de 300 buses el tiempo de cómputo se reduce al 2% utilizando la implementación propuesta. 64 3.3 Estimación de estado con redes de Hopeld Tabla 3.1: Ejemplos de tiempos de cómputo (en segundos) para la estimación de estado utilizando una implementación no dispersa y utilizando la versión propuesta en este trabajo. Red Tiempo Implementación Normal Tiempo Implementación Propuesta IEEE 14 17 6 IEEE 30 137 22 IEEE 57 3602 64 IEEE 118 30780 324 IEEE 300 100800 2350 3.3.4. Resultados de la estimación de estado utilizando el modelo neu- ronal de Hopeld En esta sección se presenta un resumen de los resultados de simulación obtenidos uti- lizando el modelo neuronal continuo de Hopeld para el problema de estimación de estado. El objetivo de la red será la obtención de un vector de estado para cada patrón de en- trada disponible. Para la validación del modelo se han utilizado diversas redes eléctricas de potencia estándares, concretamente, las redes IEEE de 14, 30, 57, 118 y 300 buses. A continuación, se comparan los resultados obtenidos por la red de Hopeld con los obtenidos por un estimador clásico basado en mínimos cuadrados ponderados (ver sección 3.2), tanto desde el punto de vista de la calidad de la solución obtenida como del tiempo de cómputo requerido. La tabla 3.2 resume los resultados obtenidos usando el estimador neuronal y clásico para diferentes redes y patrones de simulación. En lo que se reere al error en la estimación (resid- uos nales), los valores nales obtenidos por el estimador neuronal son ligeramente menores y, por tanto, mejores, que los del estimador clásico. La gura 3.7 muestra la evolución de los residuos para ambos estimadores de estado para las redes IEEE de 14, 30, 57 y 118 buses. Por otra parte, en cuanto a los tiempos de convergencia, los resultados que se presentan en la tabla 3.2 muestran claramente que para la red IEEE-14 el estimador neuronal es1,5 veces más lento que el estimador clásico; para las redes IEEE-30, 57 y 118 el estimador neuronal es 4 veces más lento que el clásico y, nalmente, para la red IEEE-300 el estimador clásico es 2,8 veces más rápido que el neuronal. Estos resultados muestran que la red de Hopeld no es una buena solución para tareas de estimación de estado en línea, ya que, aunque produce buenos resultados, sus prohibitivos 65 Estimación de estado IEEE 14 IEEE 30 (Cambio topológico) 3 3 10 10                              2 10 2 10 1 10 1 0 10 10 0 2 4 6 8 10 12 0 2 4 6 8 10 12 iteración iteración (a) (b) IEEE 57 (Caso base) IEEE 118 4 5 10 10                              4 10 3 10 3 10 2 2 10 10 0 2 4 6 8 10 12 0 2 4 6 8 10 12 iteración iteración (c) (d) Figura 3.7: Evolución del residuo en cada iteración de los algoritmos de estimación neuronal y clásico. (a) Red IEEE-14. (b) Red IEEE-30. (c) Red IEEE-57. (d) Red IEEE-118. 66 3.3 Estimación de estado con redes de Hopeld Tabla 3.2: Residuos nales y tiempo requerido por los estimadores de estado neuronal y clásico. Estimador Neuronal Clásico Red IEEE Residuo J Tiempo (seg) Residuo J Tiempo 14 40.03 6 49.83 4 30 5.72 22 6.44 5 57 123.7 64 127.22 16 118 163.3 324 204.1 82 300 1287.8 2350 1727 835 tiempos de cómputo lo hacen inaceptable. Por contra, en los últimos años se han mejorado notablemente las técnicas numéricas para la resolución del problema de estimación de estado, tanto desde el punto de vista de los tiempos de respuesta como de la estabilidad numérica. A partir de estos resultados podemos concluir que la utilización de redes neuronales (y en particular de la red de Hopeld) para un problema que está perfectamente resuelto con técnicas numéricas bien establecidas, robustas y ecientes, no aporta ninguna ventaja y debería, por tanto, ser descartada. Con el objetivo de reducir los tiempos de cómputo requeridos por la red de Hopeld, se ha estudiado la posibilidad de la implementación hardware de este modelo neuronal, concretamente la implementación mediante FPGAs. En esta implementación, se diseña una red de Hopeld para resolver un problema de estimación de estado particular para una red y topología concreta. Los pesos de la red sólo cambian cuando los valores de las medidas disponibles cambian, mientras que las conexiones entre neuronas dependen del número de medidas disponibles, su disposición a lo largo de la red y la topología de la misma. El hecho de que el conjunto de medidas y su disposición cambie con frecuencia, así como el menos frecuente, pero posible cambio en la topología de la red, hacen que la implementación hardware de este modelo neuronal para resolver problemas de estimación de estado no aporte ventajas signicativas con respecto a la solución software del modelo estudiado en este trabajo. 67 Estimación de estado 3.4. Conclusiones En este capítulo se ha estudiado la aplicabilidad de la red de Hopeld al problema de estimación de estado de redes eléctricas de potencia. La red de Hopeld se utiliza para calcular, en cada iteración del estimador de estado, los incrementos de las variables de estado a partir de la matriz jacobiano, el vector de medidas disponibles y el vector de varianzas asociadas a cada medida. Estos incrementos se obtienen de las salidas de la red una vez que ésta ha alcanzado un punto estable, que por construcción es un mínimo de su función de energía. Se han estudiado los parámetros básicos necesarios para simular la red de Hopeld. Así, se han estudiado los métodos de activación aleatoria, aleatoria restringida y secuencial. Los mejores resultados en tiempo de cómputo se han obtenido con el método de activación aleatoria, que consigue en promedio reducir el tiempo en un 30% aproximadamente con respecto al método de activación secuencial. En lo que se reere a la solución nal obtenida, se ha mostrado que los tres métodos de activación conducen, nalmente, a la misma solución. Por otro lado, se ha propuesto una expresión para encontrar directamente el valor del parámetro paso de integración que permite la simulación por computador del modelo continuo de Hopeld. La expresión es válida para cualquier red y conguración de medidas una vez que se ha normalizado la matriz de pesos de covarianzas de los errores de las medidas. Esto permite utilizar un valor de∆t lo sucientemente pequeño para asegurar la convergencia de la red a una solución y lo sucientemente grande para evitar una evolución lenta. Para vericar el modelo se han utilizado cinco redes eléctricas estándares con diferentes conguraciones de medidas. Los resultados obtenidos por el estimador propuesto en este trabajo se han comparado con los obtenidos con un estimador de estado WLS. Los resulta- dos muestran, con respecto a la calidad de la solución nal obtenida, que el estimador de estado que se propone en este trabajo obtiene resultados nales ligeramente mejores que los obtenidos por el estimador clásico. Debido a que las matrices a partir de las que se determinan los pesos de la red son altamente dispersas, la matriz de pesos de la red también lo es. Con el objetivo de reducir signicativamente los requerimientos de memoria y los tiempos de cómputo implicados, se 68 3.4 Conclusiones ha diseñado una estructura de datos especial para la simulación de la red neuronal que sólo almacena los pesos no nulos de la red así como su utilización en la ejecución del modelo, lo que ha reducido considerablemente los tiempos de cómputo requeridos para que la red se estabilice en el mínimo de su función de energía. Sin embargo, aún con estas optimizaciones, los tiempos de cómputo requeridos para obtener estos resultados son mucho mayores que los requeridos por un estimador clásico. Con estas características de la solución del problema de estimación de estado con redes de Hopeld, es necesario concluir que el paradigma de Hopeld no aporta ninguna ventaja frente a los métodos clásicos, bien establecidos, robustos y ecientemente implementados. 69 Estimación de estado 70 Capítulo 4 Estimación topológica 4.1. Introducción El estimador de estado opera con medidas en tiempo real de dos tipos: medidas analóg- icas y digitales. El estado activo/no activo o cerrado/abierto de los mecanismos de interrup- ción de corriente tales como seccionadores, interruptores, derivaciones de transformadores, etc., determina la conguración de la red, que cambia cada vez que estos dispositivos ac- túan. Las medidas de tiempo real están disponibles cada pocos segundos, y proceden de las unidades remotas localizadas a lo largo de toda la red eléctrica. Periódicamente se comprue- ban las estaciones remotas para adquirir el conjunto completo de medidas disponibles que permitirán encontrar el estado de la red. Éste queda determinado si conocemos suvector de estado, que generalmente está compuesto por el módulo de tensión y la fase relativa de cada uno de los buses que componen la red. La función del estimador de estado es encontrar el vector de estado a partir de las medidas disponibles, partiendo de la conguración actual de la red (generalmente un modelo de red orientado a buses y líneas). Encontrar la congu- ración actual de la red es una función del denominadoprocesador topológico. Es, por tanto, una operación, previa a la estimación de estado en sí, que debe procesar los datos digitales para determinar la conectividad eléctrica de cada elemento de la red. Esta tarea presenta dicultades importantes debido a los siguientes hechos: Los estados de los elementos topológicos recibidos desde las remotas pueden ser erró- neos. 71 Estimación topológica Muchos dispositivos de interrupción no están monitorizados (medidos), o bien su estado no es transmitido al sistema de adquisición. Debido a problemas en la comunicación de los datos, no todos los estados de los ele- mentos de interrupción monitorizados están disponibles en un momento determinado. Para una red real de tamaño medio o grande existe una gran cantidad de medidas digitales que deben ser procesadas para determinar qué elementos están eléctricamente conectados, eliminando la posibilidad de que los estados erróneos o no conocidos sean corregidos por un operador. Debido a estos problemas la conguración de la red no siempre puede determinarse con la información disponible sobre el estado de los elementos de la red, y se hace necesario realizar una estimación topológica que, haciendo uso de información adicional a la de los estados de los elementos de interrupción, proponga una conguración de la red como base para la realización de la estimación de estado. Si la conguración de la red, en adelante topología de la red, que utiliza el estimador de estado no es correcta, tampoco serán correctos los valores estimados de las variables de estado, invalidando el proceso de estimación de estado en su conjunto en el peor de los casos. La detección de la causa de los errores se presenta difícil ya que el error en el estado de un interruptor puede producir una medida errónea en una variable físicamente alejada, de manera que la conexión entre ambos errores sólo podrá ser establecida por un operario con un profundo conocimiento del sistema. Los dos estimadores topológicos que se proponen en este trabajo producen una propuesta topológica a partir de los valores de las medidas de ujo e inyecciones, las cuales serán obtenidas, bien directamente de los aparatos de medida, bien indirectamente a través del proceso de estimación de estado. Finalmente, la topología propuesta será enfrentada a la suministrada por el sistema de adquisición y control (SCADA), resolviéndose las contradicciones entre ambas de acuerdo con un sistema de reglas preestablecido. Este capítulo se estructura de la siguiente forma: en la sección 4.2 se resumen los méto- dos de estimación topológica más relevantes presentes en la bibliografía especialilzada; en la sección 4.3 se analiza el estimador topológico basado en perceptrones multicapa. En la 72 4.2 Métodos de estimación topológica sección 4.4 se presenta un segundo estimador topológico que supone una mejora signica- tiva al basado en perceptrones multicapa, basado en funciones radiales con distancia de Mahalanobis. Las conclusiones del capítulo se han dividido en dos secciones, una para el módulo de estimación topológica basado en MLP (sección 4.3.5) y otra el el módulo basado en funciones base radiales (sección 4.4.4). 4.2. Métodos de estimación topológica En esta sección, se hace un breve estudio de los métodos analizados en la bibliografía en la tarea de estimación topológica. En primer lugar, se comentan los métodos clásicos de estimación, distinguiendo entre estimadores topológicos independientes del estimador de estado y los estimadores topológicos implementados como parte del estimador de estado. Por último, se analizan los métodos basados en redes neuronales. Dentro del grupo de procesadores topológicos independientes del estimador de estado, el primer método utilizado explícitamente para identicar errores topológicos se describe en [Harris et al., 1976]. Está basado en la utilización de las relaciones lógicas entre el estado de los elementos interruptores y las medidas analógicas existentes, de forma que cuando en una línea hay una medida de ujo de potencia mayor que cero, la línea debe estar activa (en servicio). Para cada una de las líneas del sistema se aplican 3 reglas simples para validar el estado de la misma o proponer un nuevo estado (activo o no activo) compatible con el conjunto de medidas para esa línea. Aunque es un método muy simple y rápido, tiene una aplicabilidad limitada debido principalmente a que no considera el ruido inherente a las medidas de ujo disponibles. Además, no utiliza la información de las líneas del mismo bus para comprobar si la medida de ujo es errónea. Otro método basado en el análisis de las relaciones entre las posiciones de los elementos topológicos y las medidas analógicas se fundamenta en la creación de ecuaciones del tipo Pij +bji ∗Pji = 0, donde Pij es el ujo de potencia de la línea i-j, medido en el extremo i,Pji es el ujo de potencia medido en el extremo j ybji es la posición del interruptor a la entrada del nodo j (0 cuando el interruptor está fuera de servicio y 1 cuando está en servicio). El método valida todas las ecuaciones posibles en el sistema para una conguración de medidas determinada. Cuando una de las ecuaciones no se cumple, se puede inferir que existe un error 73 Estimación topológica topológico o un error en una medida de ujo. Los inconvenientes principales de este método son dos: no permite la detección de errores múltiples y es dependiente de las características y la carga actual del sistema. El método se discute en [Wilkosz, 1995]. En [Borkowska, 1981] se presenta un método que intenta imitar a un experto, cuyo conocimiento se utiliza para denir ciertas reglas o funciones denominadasestrategias, para cada elemento del sistema. Sus ventajas principales son que es un método simple y com- putacionalmente eciente, y permite la detección de la mayoría de los errores más notables. Presenta dos grandes inconvenientes: se requiere denir, para cada elemento susceptible de ser estimado, una entrada en una tabla que dena la estrategia a seguir, en base al conocimiento de un experto, y, no todos los errores topológicos pueden ser detectados. En [Bonanomi and Gramberg, 1983] se presenta un método de estimación basado en procedimientos de búsqueda, comprobando durante el proceso que se verican las leyes de tensión y corriente de Kirchho. Aquellos elementos encontrados durante la búsqueda que no veriquen las reglas anteriores son marcados como sospechosos. En particular, cuando se encuentra que la carga de un bus no está equilibrada, se asume que hay un error topológico. Aunque simple, este método presenta la limitación de que depende de la carga y caracterís- ticas de cada bus de la red, y, por lo tanto, es poco portable. Otra alternativa utilizada es la del empleo de índicesapropiadamente denidos [Mansour and Eldin, 1987]. La idea principal es emplear índices que tengan una gran sensibilidad a errores que inuyen negativamente en otras medidas. El procesamiento topológico consiste en la comprobación de los índices para descartar errores en cada una de las medidas disponibles, ya que éstos son indicativos de la coherencia entre las medidas y la estructura de la red. El método sólo permite detectar si una línea no ha sido incluida en el modelo de la red cuando realmente está en servicio. El método presentado en [Singh and Glavitsch, 1991] utiliza un sistema basado en reglas. La reglas se denen en base a la información disponible en el sistema e intentan comprobar la coherencia entre las medidas analógicas y las digitales. El sistema dene unas 130 reglas en total. A cada elemento topológico se le puede aplicar un subconjunto de estas reglas, dependiendo tanto del tipo de elemento en sí como de los elementos a los que está conectado. Las ventajas de este método son: no depende de la carga actual del sistema ni de su estructura; utiliza información local a cada elemento y no tiene problemas de 74 4.2 Métodos de estimación topológica convergencia. Sin embargo, no es posible detectar errores topológicos en inyecciones con una medida de valor cero, y la localización de desacoplo de barras sólo puede hacerse si las medidas disponibles en el bus están bien balanceadas [Wilkosz, 1995]. Los métodos de estimación topológica dependientes del estimador de estado utilizan el vector residual de las medidas denido por la ecuación (4.2.1): r = z− h(x̂) (4.2.1) donde z es el vector de medidas analógicas disponibles y x̂ es el vector de estado estimado. El vector de medidas verica la ecuación (4.2.2): z = h(x) + e (4.2.2) donde e es un vector de errores, vericando E(e) = 0 y E(eeT ) = R, siendo R la matriz diagonal de las varianzas de los errores de las medidas enz. Estos métodos se basan en la relación entre los vectores r y e dada por por la ecuación (4.2.3): r = We (4.2.3) donde W es la matriz de sensibilidad residual. La ecuación (4.2.3) se obtiene a partir del estimador de estado WLS. El método propuesto en [Le and Outhred, 1977] comienza analizando el residuo nal J(x̂) obtenido por el estimador de estado. Cuando el valor de este índice sugiere la pres- encia de errores, comienza un proceso en el que se utilizarán los criterios denidos por las ecuaciones (4.2.4), (4.2.5) y (4.2.6) para poner las medidas sospechosas en un conjuntoθ. Test rN : ri/rN,i > γN,i (4.2.4) Test rW : ri/rW,i > γi (4.2.5) Test W −m: r ( iri/ )2 > J(x)/m (4.2.6) σi donde rN,i es el vector de residuos normalizados dado por la ecuación (4.2.7),γN,i y γi son umbrales congurables,σ2i es la varianza de la medida i-ésima del vectorz, y rW,i viene dado 75 Estimación topológica por la ecuación (4.2.8). | ri | rN,i = (4.2.7) σiwii | ri | rW,i = (4.2.8) σi Una vez que todas las medidas han pasado el test anterior, el objetivo es reducir el con- junto θ para detectar las medidas erróneas o los errores topológicos. La reducción comienza seleccionando aquellas medidas con mayor residuo para cada tipo particular de medida (p.e. ujo de potencia activa, módulo de tensión, etc) y pasando cada una de ellas una serie de test de selección de hasta tres niveles. Una vez que se han seleccionado las medidas erróneas se realiza una nueva estimación de estado ignorándolas. La principal desventaja de este método es que requiere del cálculo de las matricesW y los residuos correspondientes, lo que es computacionalmente intensivo. En [Wu and Wen-Hsiung, 1989] también se utiliza el test rN para la detección de errores topológicos. El fundamento de este método es que sin errores topológicos se verica que E(e) = 0, mientras que con errores topológicos no se verica. Una vez que el error ha sido detectado mediante el test, la localización del mismo se basa en la utilización de la matriz de sensibilidad S, cuyo elemento (i,j) es la sensibilidad del residuo rN,i con respecto al cambio en el ujo de la rama fj . En este trabajo, se verica que el vectorE(rN ) es una combinación lineal de las columnas de la matriz S que corresponden a la línea que tiene un error topológico. Sin embargo, es necesario hacer notar que el conjunto de columnas de S necesarias para hacer la combinación lineal no es único, y que encontrar la combinación lineal en función de las columnas es una tarea computacionalmente intensiva y difícil. La principal ventaja del método es que permite la identicación de múltiples errores. El método propuesto en [Lugtu et al., 1980] comienza con una lista de las medidas eliminadas de la estimación de estado actual por ser sospechosas de ser erróneas. Teniendo en cuenta esta lista y examinando el resultado de una estimación de estado nueva, junto con la posibilidad de incluir o excluir alguna línea sospechosa del modelo en una nueva estimación de estado, se puede concluir cuál es la línea que está siendo mal modelada. Así, en varias estimaciones de estado consecutivas en las que se van eliminado medidas y se van utilizando diferentes combinaciones de elementos sospechosos, se obtiene una estimación de estado sin medidas sospechosas. El tiempo requerido para realizar el proceso completo es 76 4.2 Métodos de estimación topológica uno de sus principales inconvenientes, junto con el hecho de que la reducción del conjunto de medidas sólo se puede realizar mientras exista suciente redundancia local. En otros trabajos se utiliza la interpretación geométrica de los residuos causados por er- rores topológicos. Así, en [Clements and Davis, 1988], se proponen las condiciones sucientes para la detección, identicación y ausencia de errores topológicos. El proceso de detección e identicación de errores se realiza mediante el denominado test coseno. El inconveniente principal de este método está en que si están presentes tanto errores en las medidas como errores topológicos, el método no encontrará una solución válida. Por otro lado, la realización del test es computacionalmente costosa para redes con un gran número de buses y se requiere detectar múltiples errores. El método propuesto en [Koglin and Neisius, 1990] se basa en el hecho de que cuando existe un error topológico, las inconsistencias en las medidas estimadas que encuentra el estimador de estado están localizadas cerca del error topológico. El método consiste en ir eliminando las medidas redundantes en la proximidad de un bus que se sospecha contiene un error topológico, sin eliminar otras medidas sospechosas que no estén próximas. Utilizan- do la lista de medidas eliminadas, se crea una tabla con todas las subestaciones y ramas sospechosas de contener un error topológico. Una vez construida la tabla, se seleccionan aquellas subestaciones que tienen inyecciones en el propio bus o en sus vecinos sospechosas de contener error o que contienen ujos saliendo de la subestación sospechosos. Sólo las subestaciones seleccionadas de esta forma se tienen en cuenta en la búsqueda de errores topológicos. La búsqueda consiste en la resolución de un problema de mínimos cuadrados para una red pequeña consistente únicamente en las subestaciones sospechosas y sus vecinos directos, tratando de realizar una estimación de estado cambiando el estado de un interrup- tor sospechoso de contener un error topológico. Si la función objetivo que se obtiene por este método es mejor que la calculada sin considerar el cambio topológico, se acepta el cambio y se da por localizado el error. La principal desventaja de éste método es que el número de variantes posibles crece exponencialmente con el número de líneas, y debe resolverse una estimación de estado para cada una de ellas. El método puede presentar problemas de convergencia. En [Simoes Costa and Leao, 1993] se utilizan índices que permiten medir el grado de correlación entre medidas estimadas con síntomas de ser erróneas y la sensibilidad a los 77 Estimación topológica errores que con mayor probabilidad pueden ocurrir bajo las condiciones de funcionamiento actual del sistema. El método utiliza la lista de medidas sospechosas de ser erróneas para seleccionar un conjunto de componentes de la red relacionados con esas medidas. Este con- junto se va reduciendo mediante el análisis de la matriz de sensibilidad, tomando aquellos elementos relacionados con magnitudes mayores en las columnas de esta matriz. Partiendo del conjunto reducido de elementos sospechosos, se repite el proceso (estimación de esta- do, detección de medidas y creación del conjunto de elementos sospechosos) tantas veces como sea necesario, habiendo cambiado el estado del elemento que se supone contiene el error topológico. Este algoritmo permite distinguir entre errores topológicos y errores en las medidas, aunque a cambio de un coste computacional alto, lo que constituye su desventaja principal. Los métodos más recientes tratan de modelar el estado de cada interruptor explícita- mente en el proceso de estimación de estado ([Monticelli, 1993], [Slutsker and Mokhtari, 1995], [Monticelli, 2000] y [de la Villa Jaén and Expósito, 2001]). Partiendo de la base de que la impedancia de un interruptor tiene dos valores posibles: cero cuando está cerrado e innito cuando está abierto, estos métodos modelan las relaciones entre los ujos de po- tencia que circulan por él y la tensión en sus terminales, permitiendo utilizar los ujos por estos elementos como variables de estado. Se basan, por tanto, en incluir tanto los ujos de potencia activa como reactiva como nuevas variables de estado a estimar. Los valores estimados para estos ujos permiten determinar el estado abierto o cerrado de los corre- spondientes elementos topológicos. Cada elemento topológico se modela de forma diferente, según su estado inicial se suponga en servicio, fuera de servicio o desconocido ([Slutsker and Mokhtari, 1995]). Estos métodos presentan dos características principales: el modelado explícito de los elementos topológicos requiere modelar una parte de la red a nivel de nodos y equipos físicos, en vez de utilizar el modelo más simple de buses y ramas; la inclusión de un elemento topológico en el proceso de estimación de estado supone la inclusión de cuatro nuevas variables de estado en el sistema (dos variables para la tensión en un nuevo bus y dos variables de ujo) y cuatro pseudomedidas. La principal desventaja del método radica en que para mantener el tamaño del problema manejable sólo algunos elementos topológicos deberían ser incluidos en el proceso de estimación de estado. En [Singh and Alvarado, 1995] se utiliza esta misma idea, pero particularizada para la estimación de estado por el método 78 4.2 Métodos de estimación topológica LAV (mínimos valores absolutos, del inglésLeast Absolute Value). El modelado explícito de los elementos topológicos también se utiliza en [Mili et al., 1999]. En este trabajo se desarrolla un método de preprocesamiento topológico basado en el análisis de todos los ujos de potencia activa y reactiva obtenidos después de una estimación de estado basada en el método de Huber ([Huber, 1981]). La ventaja principal de este método frente a los discutidos en el párrafo anterior es que no sufre de posibles problemas de convergencia. Por otro lado, su principal inconveniente es el tiempo de cómputo adicional requerido para su implementación. Un tercer tipo de estimadores topológicos se basan en la utilización de Redes Neu- ronales Articiales. El primer intento se describe en [Vinod Kumar et al., 1996], donde se utilizan dos redes neuronales para realizar de forma independiente una estimación de estado y una estimación topológica. Para el primer problema se utiliza una red del tipoFunction- al Link Network (FLN) ([Yoh-Han, 1989]), mientras que para el procesamiento topológico los mejores resultados se obtienen utilizando una red del tipoCounterpropagation ([Hecht- Nielsen, 1987]). Las entradas a la red son los ujos de potencia activa de cada línea así como el estado recibido de cada elemento topológico de la red. La salida de la red es una combi- nación de -1 y 1 que representa la conguración topológica estimada para toda la red. La principal limitación de este trabajo es que sólo permite discernir entre 16 topologías posibles, donde de una a otra sólo cambia el estado de una única línea, lo que limita su aplicabilidad a sistemas reales. Otro método basado en redes neuronales se presenta en [Souza et al., 1996], que pos- teriormente es mejorado en [Souza et al., 1998]. El método se basa en la utilización de las innovaciones normalizadas como entradas a una red neuronal del tipo GMDH (Group Method of Data Handling) ([Farlow, 1984]). Las innovaciones normalizadas son índices que se calculan en función de las medidas recibidas y las medidas estimadas mediante un pro- ceso de predicción de series temporales, que puede perder abilidad en situaciones donde se produzcan cambios bruscos en la carga del sistema. Por otro lado, la capacidad de este método para distinguir entre dos errores topológicos se muestra únicamente para medidas no erróneas y en situaciones donde una rama de la red está realmente abierta, pero es consid- erada por el estimador cerrada. Estos efectos negativos son pequeños comparados con otros tipos de errores. Por otra parte, este método puede producir resultados erróneos cuando 79 Estimación topológica Figura 4.1: Estructura general del estimador topológico. ocurren varios cambios topológicos simultáneamente en la red, especialmente cuando sólo uno de ellos es comunicado a SCADA. 4.3. Estimación topológica con Perceptrones multicapa En esta sección describimos el primero de los dos estimadores topológicos desarrollados, basado en RNAs tipo Perceptrón multicapa [García-Lagos et al., 1998b]. Este estimador se basa en la utilización de un modelo del sistema orientado a buses y ramas, y presenta dos procesos claramente diferenciados. En una primera etapa, se estima de manera independi- ente y paralela la topología de cada bus del sistema, esto es, el estado de los interruptores asociados a las líneas que conuyen en cada bus, en las inmediaciones de ese bus (Estimación de Topología Local). En una segunda etapa, las topologías estimadas para cada bus son con- frontadas entre sí y con la aportada por el módulo SCADA, realizándose la propuesta de topología denitiva de acuerdo con un conjunto de reglas (Estimación de Topología Global). El esquema general del sistema propuesto se ha representado en la gura 4.1. 80 4.3 Estimación topológica con Perceptrones multicapa 4.3.1. Estimación de topología local En esta sección discutimos los fundamentos del módulo dedicado a la estimación topológ- ica local de cada bus, que será denominado estimador topológico local. Esta fase está con- stituida por dos etapas secuenciadas: preprocesamiento y clasicación, y en ella se realiza la estimación topológica de cada bus independientemente y de forma paralela. El objetivo de este módulo es establecer una asociación entre el conjunto de medidas que pueden asociarse a un bus y la topología del mismo. Esta asociación es difícil de establecer debido a que para una misma topología pueden existir un número innito de combinaciones de valores de las medidas. Para conseguir esta asociación nos basamos en el principio de conservación de la energía que establece que"... en una red eléctrica alimentada por fuentes independientes, todas de la misma frecuencia, la suma de la potencia compleja suministrada por las fuentes independientes es igual a la suma de la potencia compleja recibida por todas las demás líneas de transmisión de la red eléctrica". [Bergen, 1986]. Utilizaremos el bus de la gura 4.2 como modelo en el análisis del estimador. Este bus tiene dos líneas (línea 1 y línea 2), un generador y una carga.Pg representa la medida de potencia activa que el generador inyecta en la red a través del bus.Pl es la medida de potencia activa asociada a la carga (inyección de potencia que sale de la red a través del bus). P1 y P2 son los ujos de potencia activa de las líneas 1 y 2. Ig, Il, I1 e I2 representan interruptores que pueden estar en servicio o cerrados (conectan eléctricamente el elemento al bus) o fuera de servicio o abiertos (desconectan eléctricamente el elemento del bus). Suponiendo que todos los interruptores de la gura 4.2 están cerrados y que las medidas no presentan errores, si sumamos todas las posibles combinaciones de ujos de potencia activa del bus, en condiciones normales de funcionamiento, sólo una de estas sumas sería exactamente cero, debido al principio de conservación de la energía. En este caso sólo la primera combinación de sumas es cero, es decir, Pg + Pl + P1 + P2 = 0. En general, si aplicamos la función δ a cada combinación, se obtiene un vector de 14 componentes de ceros y unos que, de forma única, se puede asociar a la topología actual de la red. El vectorv de 81 Estimación topológica Generador C arg a P P  I I  I  L í nea 1 I  P  P  L í nea 2 M edi dor Int erru p t or Figura 4.2: Representación de un bus de una red, con un generador, una carga y dos líneas. unos y ceros para el bus bajo análisis viene dado por la ecuación (4.3.1).    δ(Pg + Pl + P1 + P2)  δ(Pg + P + P )  l 1   δ(Pg + Pl + P2)    δ(Pg + P1 + P2)   δ(  Pl + P1 + P2)     δ(P  g + Pl)   δ(Pg + P1)  v =    (4.3.1) δ(Pg + P 2 )   δ(Pl + P1)    δ(P1 + P2)   ( )    δ Pg    δ(P )  l   δ(P 1)  δ(P2) Si las medidas no presentan errores, sería directo implementar un sistema que asigne a cada vector obtenido de esta forma una topología compatible para el bus. El problema es que en un sistema real las medidas contienen errores, que harían que ninguna de las sumas fueran cero, es decir, la función δ no es utilizable en la práctica. Para soslayar este hándicap, teniendo en cuenta que cada medida tienen un error asociado, la funciónδ será reemplazada por una función de transferencia radial como se describe a continuación. La construcción del 82 4.3 Estimación topológica con Perceptrones multicapa vector utilizando funciones radiales constituye la etapa de preprocesamiento del estimador topológico. Esta etapa produce agrupaciones (cluster) de vectores, en el sentido de que todas las entradas asociadas a un misma topología producirán vectores en el espacio [0, 1]n, no exactamente iguales, pero muy próximos entre sí. La salida de esta etapa será utilizada por la etapa de clasicación, constituida por una red neuronal, que identicará cadacluster, es decir, asociará cada vector con la topología actual. 4.3.1.1. Etapa de preprocesamiento Como se ha señalado arriba, la aplicación de la función impulso no es efectiva en la construcción de un vector que pueda ser utilizado para determinar de forma directa la topología de un bus debido a los errores presentes en las medidas. Esto ha sido resuelto utilizando funciones radiales. La función de transferencia radial viene dada por la ecuación (4.3.2): −x2 y(x) = e σ2 (4.3.2) Esta función se caracteriza por tener una saliday máxima (y = 1) cuando x es cero y tiende a cero cuando x se aleja de este punto. Es decir, la función tiene forma de campana de Gauss. El parámetro σ determina el ancho de la campana y lo denominaremos en adelante parámetro de normalización. En la gura 4.3 se representa la función de la ecuación (4.3.2) para diferentes valores del parámetro de normalización. La etapa de preproceso estará constituida por tantas neuronas radiales como combinaciones de ujos de potencia activa y reactiva existan para un bus (gura 4.4). Cada neurona recibe la suma de una posible combinación de ujos y produce un valor en el intervalo [0, 1]. La salida de la etapa de preproceso será, por tanto, un vector cuyos componentes pertenecen al intervalo[0, 1] y constituyen una respuesta localizada ante los estímulos de entrada, es decir, la salida de las neuronas es signicativamente mayor que cero sólo cuando la entrada esté situada en una porción cercana a cero. El efecto de los errores en las mediciones se atenúa gracias al ajuste del ancho de la campana (parámetro de normalización). Cuanto mayores son los errores, el saldo de sumas se aleja de cero, pero si hacemos mayor el ancho de campana, su salida puede seguir estando próxima a uno. Por tanto, el ancho de la campana es proporcional a la estimación del error que tienen asociadas las medidas que entran en la neurona. Cuando la neurona tiene una única entrada, hemos encontrado que el valor del parámetro de normalización óptimo es dos veces la desviación 83 Estimación topológica Función de transferencia de base rad ial 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -1 -0.5 0 0.5 1 x Figura 4.3: Función de transferencia de base radial para diferentes valores deσ.         Figura 4.4: Representación esquemática de la etapa de preprocesamiento de base radial para un patrón con 3 medidas de potencia activa y 3 de reactiva. 84 4.3 Estimación topológica con Perceptrones multicapa típica del error asociada a la medida. Cuando la neurona recibe una combinación den entradas, el parámetro de normalización se calcula de acuerdo a la ecuación (4.3.3). √∑ pi = 2 σ2j + 1 (4.3.3) j La salida de cada neurona vendrá dada porPla ecuación (4.3.4): 2 2 y = −(e j∈C pj) /pi i i (4.3.4) donde yi es la salida de la neurona i, asociada con el subconjunto i-ésimo de ujos, Ci representa el conjunto de índices de ramas incluidas en el subconjuntoi, y pi es el parámetro de normalización. Como puede comprobarse experimentalmente, patrones pertenecientes a topologías difer- entes producen patrones muy diferenciados en algunas componentes del vector preprocesado (salida de la etapa de preproceso), y patrones muy diferentes para una misma topología producen vectores preprocesados cuyos componentes son similares. Así, las guras 4.5(a) y 4.5(b) representan las salidas preprocesadas para 100 patrones de ujos de dos topologías diferentes de la red estándar IEEE-14. Comparando ambas, puede observarse que la sali- da de la etapa de preprocesamiento produce patrones característicos diferentes para cada topología. Una vez disponemos de los vectores preprocesados y teniendo en cuenta que sus com- ponentes tienen características que permiten identicar la topología a la que pertenecen, en una segunda etapa se utilizará un clasicador neuronal para asociar los vectores preproce- sados con la topología del bus. Este es el objetivo de la etapa de clasicación-codicación que se analiza a continuación. 4.3.1.2. Etapa de clasicación Las redes neuronales del tipo Perceptrón Multicapa con algoritmo de aprendizajeBack- propagation [Rumelhart et al., 1986] resultan especialmente aptas para la agrupación en clases de un conjunto de n-uplas basándose en la distancia entre los puntos representados por éstas en un espacio n-dimensional. Consecuentemente, será una red de este tipo la que constituya el módulo de clasicación de topologías locales. Estas redes recibirán como entra- da la salida de la etapa de preprocesamiento, y deberán producir a su salida la codicación 85 Estimación topológica Patrones preprocesados Patrones preprocesados 1 1 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 Componente de l vector Componente de l vector (a) (b) Figura 4.5: Representación de las salidas de la etapa de preprocesamiento para patrones típicos de dos topologías diferentes. del estado de cada una de las líneas que une el bus en cuestión con el resto de la red. La gura 4.6 muestra el esquema de la etapa de clasicación. Puesto que las neuronas de salida tienen una función de activación tipo tangente hiperbólica, valores próximos a +1 serán interpretados como línea cerrada, valores próximos a -1 como línea abierta y valores intermedios como indecisión (gura 4.7). Los umbrales que determinan la pertenencia de un valor de salida a alguno de los tres tramos anteriores son obtenidos de manera heurística como un compromiso entre el índice de abilidad de la red al proponer un estado de línea y la probabilidad de que este valor sea una indecisión. Entrenamiento de la red neuronal Cada bus de la red eléctrica dispone de una red neuronal local, que de forma indepen- diente estima la topología para las líneas pertenecientes al bus. La red neuronal empleada es un Perceptron Multicapa con una capa de entrada, una oculta y una de salida. La estructura del estimador topológico neuronal para cada bus se muestra en la gura 4.6. Para el proceso de entrenamiento supervisado, la salida de la red neuronal se entrenará para que produzca una codicación única para el estado de cada línea del bus. Una salida +1 indicará que la línea está en servicio y una salida de -1 indicará que la línea está fuera de servicio. 86 4.3 Estimación topológica con Perceptrones multicapa Figura 4.6: Arquitectura del estimador topológico neuronal local.        C er r a do            Indecisión          A b ier t o            Figura 4.7: Márgenes asignados a las salidas de la red neuronal para determinar el estado abierto, cerrado o de indecisión. 87 Estimación topológica La generación de los patrones de entrenamiento de la red neuronal sigue el siguiente proceso: 1. Se ja una de las topologías posibles de la red, así como una conguración aleatoria de cargas y generaciones para cada bus a partir de un caso base. 2. Mediante la solución del problema de ujo de carga asociado, se obtiene el valor ver- dadero de cada medida. 3. Se añade a la medida verdadera un error de media cero y varianza prejada para cada medida. 4. Se selecciona la información de ujos de potencia activa y reactiva por cada línea que parte del bus considerado. En la generación de patrones, de todas las topologías posibles del bus, no se considera aquella en la que todas las líneas están abiertas, es decir, la topología que aísla el bus del resto de la red. Para cada topología considerada, se han generado 100 patrones diferentes. Así, si tenemos un bus con 4 líneas, se han considerado 15 topologías y, por tanto, se han generado un total de 1500 patrones. Para realizar el entrenamiento supervisado de la red neuronal se han construido pares de patrones entrada - salida deseada (target), siendo la entrada el vector de patrones de ujo de potencia y la salida deseada la topología real del bus. Las pruebas se han realizado para la red IEEE-14. Como algoritmo de entrenamiento se ha elegido el denominado Backpropagation con ganancia adaptativa. Cada bus de la red tiene su propia red neuronal, que es entrenada de manera indepen- diente. La convergencia del algoritmo de aprendizaje hasta un error globalSSE = 0,01 se produce, en todos los casos, en menos de 10000 épocas. El número de unidades ocultas para cada red varía desde 20 hasta 60 según el número de entradas (que a su vez depende del número de líneas que tenga el bus). La evolución del error cuadrático y el valor de la tasa de aprendizaje durante el entrenamiento de una red neuronal típica se ha representado en la gura 4.8. En ella se puede observar cómo, para la última parte del entrenamiento, ha sido necesario utilizar una tasa de aprendizaje variable en cada iteración. 88 4.3 Estimación topológica con Perceptrones multicapa 5 Entrenamiento de 9736 épocas 10 0 10 -5 10 0 2000 4000 6000 8000 Epoch 800 600 400 200 0 0 2000 4000 6000 8000 10000 Epoch Figura 4.8: Evolución de la suma del error cuadrático y de la tasa de aprendizaje durante el entrenamiento de la red neuronal. En resumen, la salida de la etapa de estimación topológica local está constituida por las salidas en el rango [−1, 1] de sus neuronas. Si todas las salidas tomaran exactamente los valores -1 (abierto) ó 1 (cerrado), el vector de salida representaría un código que indica la topología a la que pertenece el vector de medidas de entrada, puesto que el proceso de aprendizaje de la red se ha realizado con este objetivo. Sin embargo, en la mayoría de los casos las salidas no serán -1 ó 1, sino valores próximos a éstos. En estos casos, cuando la salida está próxima a -1 ó 1, ésta se toma respectivamente como abierto o cerrado. Sin embargo, es posible que algunas salidas estén más próximas a 0 que de -1 ó 1, en cuyo caso decidir si representa a un -1 o un 1 no es posible. Para solventar esta limitación se ha implementado una segunda fase del estimador topológico, el módulo de estimación topológica global. 4.3.2. Estimación de topología global La función principal de la etapa de estimación topológica global es confrontar las esti- maciones obtenidas para cada uno de los buses de la red por el estimador topológico local. Así, este módulo es el encargado de comparar, para cada línea de la red, la coherencia de la estimación local en cada bus de sus extremos, procediendo de la siguiente forma cuando las estimaciones obtenidas en cada bus es contradictoria: 89 T as a de ap re n diz a j e Suma del error cuadrático Estimación topológica Si una estimación es indecisión y la otra no, ignorar la indecisión. Si ambas estimaciones son indecisiones o ninguna lo es pero son estimaciones contra- dictorias, utilizar el estado proporcionado originalmente por SCADA. 4.3.3. Proceso de Estimación Topológica Como se ha mostrado en las secciones anteriores, el proceso de estimación de estado está compuesto por dos fases: la fase de estimación local (compuesta a su vez por dos etapas, la etapa de preproceso y la etapa de clasicación) y la fase de estimación global. La primera fase recibe un conjunto de combinaciones de ujos de potencia y produce una propuesta topológica para cada línea de la red (línea en servicio o fuera de servicio) o una indeterminación. La segunda fase permite unicar estimaciones locales, así como utilizar la información de estado de interruptores y seccionadores procedentes de SCADA. Sin embargo, la aplicación del estimador de topología local correspondiente a un determinado bus requiere conocer las medidas de ujo de todas las líneas que conuyen en dicho bus. Puesto que esta exigencia está muy lejos de poder cumplirse en todos los buses de una red eléctrica real, debe establecerse un proceso que proporcione un conjunto de medidas apropiadas que sustituyan a aquellas no suministradas por el sistema de adquisición de datos siempre que sea posible. En este sentido, es posible reemplazar medidas de ujo ausentes por pseudomedidas del otro extremo de la línea, ponderadas de forma adecuada. Además, el proceso de estimación topológica puede repetirse después de realizar una estimación de estado en aquellos buses que no disponían de todas las medidas, utilizando las medidas estimadas. El proceso completo de estimación topológica se resume a continuación: Estimador Topológico basado en MLP: 1. Para cada bus de la red eléctrica, recopilar las medidas de inyección y flujo disponibles desde SCADA. 2. Para cada bus que no disponga del conjunto de medidas completo, generar todas las posibles pseudomedidas. 3. Estimador Topológico Local. Para cada bus con el conjunto de medidas (o pseudomedidas ) completo, aplicar el Estimador Topológico Local 90 4.3 Estimación topológica con Perceptrones multicapa 3.1. Presentar el vector de medidas a la etapa de preproceso, para obtener el vector preprocesado. 3.2. Presentar el vector preprocesado a la etapa de clasificación. 3.3. Las salidas no indeterminadas de la etapa de clasificación constituyen una propuesta de topología para el bus. Algunas salidas de esta etapa pueden ser indeterminaciones, en cuyo caso la topología del bus aún no puede ser estimada. 4. Estimador Topológico Global. Para cada bus que ha generado una salida indeterminada o contradictoria en el paso 3.3, aplicar las reglas del estimador topológico global para estimar la topología del bus. 5. Para las topologías de los buses que no han sido estimadas, utilizar la información topológica recibida desde SCADA. 6. Realizar una estimación de estado. 7. Para los buses que en el paso 2 no se pudo completar el conjunto de medidas, completarlo utilizando las medidas estimadas en el paso 6. 8. Repetir el proceso con la nueva configuración de medidas. 4.3.4. Resultados de la estimación de topología En esta sección, nos centramos en el bus 2 de la red IEEE-14. Este bus tiene 4 líneas, un generador y una carga, lo que lo hace sucientemente genérico (las dos líneas que unen los buses 1 y 2 se han modelado como una línea equivalente). Para poner a prueba el funcionamiento de las redes neuronales, se ha generado un nuevo conjunto de patrones correspondientes a todas las topologías posibles para este bus. Estos patrones son diferentes a los utilizados en la fase de entrenamiento de la red neuronal. 4.3.4.1. Prueba del modelo de estimación topológica local El objetivo es obtener la topología del bus 2 cuando se presentan a la red las entradas de los patrones generados. La red neuronal, idealmente, responde poniendo cada una de 91 Estimación topológica sus salidas a -1 o 1 según estime que la línea está abierta o cerrada, respectivamente. Sin embargo, no todas las salidas serán valores bipolares -1 o 1, sino que es posible cualquier valor en el intervalo [-1,1]. Esto nos lleva a la siguiente denición: El intervalo de incertidumbre representa los valores de salida de las neuronas que no serán interpretados como estado de línea abierta o cerrada, sino que indican que la red neuronal simplemente no es capaz de estimar el estado de dicha línea. Cuando la salida de la red neuronal, para una línea, está dentro del intervalo de incer- tidumbre, asumimos que la red neuronal no es capaz de decidir sobre el estado de la línea, es decir, ha producido una indecisión. Estas indecisiones serán utilizadas en una segunda etapa del proceso que, con información adicional sobre buses vecinos e información digital sobre el estado de los elementos topológicos, podrá en muchos casos resolver la indecisión. Para la validación del modelo se han realizado dos bancos de pruebas claramente difer- enciados. En una primera batería de pruebas se realizan estimaciones topológicas suponiendo que todas las medidas de un bus están disponibles. En el segundo caso, se supondrá que una medida de inyección o ujo para un bus no está disponible. Esta medida ausente será sustituida por una pseudomedida. Para la primera prueba, donde todos los ujos de potencia e inyecciones para el bus están disponibles, el estimador topológico ha sido capaz de clasicar correctamente todos los patrones excepto uno, es decir, ha encontrado la topología correcta que los generó. El intervalo de incertidumbre se ha jado en [−0,4, 0,4]. El patrón no clasicado ha producido que las salidas de la red neuronal estén en el intervalo de incertidumbre. Las salidas de la red neuronal fueron, y = [−1,0000, 0,9298,−0,9343,−0,5589]T . El último componente del vector y es el que está dentro del intervalo de incertidumbre. La causa por la que este patrón no es correctamente clasicado por la red neuronal está en lo atípico del mismo. Concretamente, representa una topología en la que hay una línea cerrada por la que uye una cantidad muy pequeña de potencia. Esto hace que la red neuronal no pueda decidir si la línea está abierta o cerrada. En general, todos los pa- trones pertenecientes a esta topología presentan unas salidas de la etapa de preprocesamien- to atípicas. Esto se puede comprobar comparando la gura 4.5(a), correspondiente a una clase topológica típica, con la gura 4.5(b), que representa a los patrones de entrenamiento 92 4.3 Estimación topológica con Perceptrones multicapa pertenecientes a la misma clase que el patrón mal clasicado. Como segundo banco de pruebas se generan patrones y se simula la ausencia de una medida de ujo o de inyección. Esta situación es más realista que la correspondiente a la primera prueba, ya que en un sistema real es poco probable que todas las medidas estén disponibles para un bus. El ujo o inyección no disponible será sustituido por una pseudome- dida que reemplazará al dato ausente. Concretamente, para cada patrón p del conjunto de patrones de la prueba 1, se generan 5 nuevos patrones de la siguiente forma: 1. El propio vector p, que denominaremos p1. 2. Se supone que el vector p tiene una de sus medidas muy errónea. Así, el nuevo vector p2 tiene todas sus componentes idénticas a p excepto el dato correspondiente a un ujo, que se reemplaza por su valor más un ruido proporcional a su desviación típica (esto es, se vuelve a añadir un error, puesto que p ya es un vector medido). Con esto simulamos la elección de una pseudomedida buena, esto es, una pseudomedida próxima a la medida real. 3. Estamos en el mismo caso que el anterior, pero el ujo que se reemplaza será mu- cho más ruidoso que el anterior, concretamente un ruido de distribución normal con desviación típica 10σ, donde σ es la desviación típica del error original del componente a reemplazar. Con esto, generamos un patrónp3 que simula a p con una pseudomedida no próxima a la medida real. 4. En este caso, seleccionamos un ujo y suponemos que éste no se conoce (no tenemos un aparato de medida para la línea en el extremo del bus 2 o bien éste está fuera de servicio). Este dato se sustituirá por una pseudomedida, concretamente por el ujo del medidor del otro extremo de la línea, con signo cambiado. Así,p4 tiene, en uno de sus componentes, el ujo medido en el extremo opuesto de la línea. 5. Para este caso tenemos la misma situación que en 4, pero supondremos que el ujo que utilizamos como sustituto es muy ruidoso, es decir,p5 utiliza como pseudomedida el ujo medido en el otro extremo, pero, añadiéndole un ruido adicional de valor10σ, donde σ es la desviación típica del error del medidor. 93 Estimación topológica Con estos nuevos patrones podremos estudiar las soluciones que aporta el estimador topológico ante la situación que cada uno simula. En la tabla 4.1 se resumen los resultados de esta prueba. Cada la corresponde a un patrón del conjunto de prueba, que llamaremos patrón base, y cada columna p1 a p5 indica el vector generado a partir del patrón base. La columna fallos indica el número total de vectores que no fueron correctamente clasicados. En cada casilla aparece un '0' cuando la estimación topológica es correcta para el patrón considerado, un '1' cuando es incorrecta y una 'x' cuando la red neuronal ha generado una indecisión. Si exceptuamos el caso del patrón base 19, en todos los demás el error se produjo por indecisión, es decir, no se obtuvo una topología correcta ni incorrecta. El caso del patrón base 19 presenta los mismos problemas que se comentaron anteriormente. El número de patrones no clasicados es de 9 frente a un total de 150, lo que supone un 6% de patrones no clasicados correctamente o que produjeron una indecisión. Sin embargo, el porcentaje de patrones mal clasicados se reduce a la mitad (3%) si no tenemos en cuenta las indecisiones. En las pruebas anteriores no se ha considerado el caso más desfavorable, que se presenta cuando no se dispone de medida de ujo de potencia en ningún extremo de una línea que está en servicio, y los ujos se reemplazan por pseudomedidas de valor0. Esto lleva al estimador topológico a considerar que la línea está abierta cuando en realidad está cerrada. 4.3.4.2. Prueba del estimador topológico completo Para vericar el funcionamiento del el estimador topológico se han generado dos pruebas diferentes. En la primera, se supone que todos los ujos de potencia activa y reactiva están disponibles (estas medidas pueden proceder de SCADA o ser pseudomedidas). Esta prueba nos permitirá evaluar el sistema sin la necesidad de utilizar los resultados de un estimador de estado. En la segunda prueba se asume que no todos los ujos están disponibles, y que hay presentes varios errores topológicos en el modelo de red obtenido desde SCADA. En este caso, es necesario realizar una estimación de estado para reemplazar los ujos no conocidos. De nuevo y sin pérdida de generalidad, utilizaremos como caso de estudio el bus número 2 de la red IEEE-14. La gura 4.9 muestra este bus y sus vecinos. La notación que empleamos es la siguiente: Li,j expresa el estado del interruptor de la línea i-j en el extremo i;Zi,j es el par de medidas de ujo de activa y reactiva de la línea i-j, medidas en el extremo i. Finalmente, 94 4.3 Estimación topológica con Perceptrones multicapa Tabla 4.1: Resultados de la estimación topológica local para la red neuronal del bus 2. P. Base fallos p1 p2 p3 p4 p5 1 0 0 0 0 0 0 2 0 0 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 0 0 5 0 0 0 0 0 0 6 0 0 0 0 0 0 7 1 0 0 0 0 x 8 0 0 0 0 0 0 9 0 0 0 0 0 0 10 0 0 0 0 0 0 11 0 0 0 0 0 0 12 0 0 0 0 0 0 13 0 0 0 0 0 0 14 0 0 0 0 0 0 15 0 0 0 0 0 0 16 0 0 0 0 0 0 17 0 0 0 0 0 0 18 0 0 0 0 0 0 19 5 1 1 1 1 x 20 0 0 0 0 0 0 21 1 0 0 0 0 x 22 2 0 0 0 x x 23 0 0 0 0 0 0 24 0 0 0 0 0 0 25 0 0 0 0 0 0 26 0 0 0 0 0 0 27 0 0 0 0 0 0 28 0 0 0 0 0 0 29 0 0 0 0 0 0 30 0 0 0 0 0 0 95 Estimación topológica 5 4 1 3                          Figura 4.9: Representación esquemática del bus 2 y sus vecinos en la red IEEE-14.. si a un interruptor se le asigna el valor 0 se indica que está cerrado y si se le asigna el valor 1 se indica que está abierto. En la tabla 4.2 se muestra un resumen de los resultados de estas dos pruebas. En la mayoría de los casos la topología encontrada por el sistema es correcta, de forma que la tabla sólo muestra aquellos casos en los que el resultado ha sido erróneo o bien casos típicos del bus bajo estudio. En cada caso se realizan las mismas pruebas para diferentes patrones de carga de forma que los resultados son generales para todos ellos. En la primera columna se muestra un número que referencia a cada caso; en la segunda columna se muestra la topología verdadera de la red en la simulación (el vector mostrado corresponde a la conguración de línea [L1,2, L2,3, L2,4, L2,5]); en la tercera se muestra la topología que utiliza el estimador de estado para encontrar el conjunto de medidas que faltan; la columna cuatro muestra el conjunto de medidas que no están disponibles ni para el estimador topológico ni para el estimador de estado. Finalmente, en la columna de resultados se indica, para cada caso, el resultado de la estimación topológica de todas las líneas del bus 2. La indicación correcta (C) signica que todas las líneas han sido estimadas correctamente; la indicación indecisión 2-x o error 2-x (E) signica que la estimación topológica realizada ha fallado únicamente en el estado de la línea 2-x. Para estos dos últimos resultados se indica la estimación realizada para la misma línea en el bus x. A continuación, se comentan aquellas simulaciones que producen un resultado problemático en la estimación topológica. 96 4.3 Estimación topológica con Perceptrones multicapa Tabla 4.2: Resultados representativos de la interacción del estimador de estado y del esti- mador de topología. E. signica Erróneo y C. signica Correcto. N T. Real T. Entrada E.E Medidas que faltan Resultado 1 0000 0000 Z23 Indecisión 2-3 - C. 3-2 2 0000 0000 Z21 C. 3 0000 0000 Z21, Z23 y Z24 Indecisión 2-3 - C. 3-2 4 1000 1000 Z23 E. 2-4- C. 4-2 5 1000 0000 Z23, Z24 E. 2-4- C. 4-2 6 1000 0101 Z23, Z21 E. 2-4 - C. 4-2 7 1000 1010 Z24, Z23 E. 2-4 - C. 4-2 8 0010 0010 Z23 C. 9 0010 0010 Z21, Z23, Z24 C. 10 0010 0000 Z21, Z23 C. 11 0010 0000 Z23, Z24 C. 12 0010 1000 Z24 C. 13 0010 1000 Z21 E. 2-1 - C. 1-2 14 0010 1000 Z24 C. 15 0010 1001 Z23, Z24 C. 16 0100 0100 Z23, Z24 C. 17 0100 0100 Z21, Z23, Z24, Z25 C. 18 0100 0000 Z23 C. 19 0001 0000 Z23, Z25 C. 20 1010 1010 Z21, Z23, Z24, Z25 C. 21 1010 0010 Z21, Z24 C. 22 1010 0010 Z21, Z23, Z25 C. 23 1010 0000 Z23, Z25 C. 24 1010 0000 Z21 E. 2-1 - C. 2-1 25 1010 0000 Z24 E. 2-4 - C. 4-2 26 1010 0000 Z24, Z42 E. 2-4 - E. 4-2 27 0110 0000 Ninguna C. 28 0110 0000 Z23 E. 2-3 - C. 3-2 29 0110 0000 Z24 E. 2-4 - C. 4-2 30 0110 0000 Z21, Z25 C. 31 0110 0000 Z21, Z25 + (*) C. 32 1110 1110 Z21, Z23, Z24, Z25 C. 33 1110 0110 Z23, Z24 C. 34 1110 0110 Z21 E. 2-1 - C. 1- 2 35 1110 0110 Z24 E. 2-4 - C. 4-2 36 1110 0100 Z23 C. 37 1110 0100 Z21 E. 2-1 - C. 1-2 38 1110 0100 Z23, Error topológico en 3-4 C. 39 1110 0100 Z23, Error topológico en 3-4, 5-6 y 13-14 C. . 40 0111 0111 Z21, Z23, Z24, Z25 C. 41 0111 0110 Z21 C. 42 0111 0110 Z25 E. 2-5 - C. 5-2 43 0111 0110 Z23, Z25 E. 2-5 - C. 5-2 44 0111 0100 Ninguna E. 2-4 - C. 4-2 45 0111 0100 Z25 E. 2-4 - C. 4-2E. 2-5 - C. 5-2 97 Estimación topológica La indecisión del caso 1 se debe a que el ujo que realmente circula por la línea 2-3 en la conguración de la red utilizada es muy bajo, de menos de 1 MW de activa, lo que no permite al estimador topológico decidir sobre el estado del interruptor. En el caso número 3 se tiene el mismo problema. En los casos del 4 al 7 se tiene que el ujo que se mide en la línea 2-4 es muy pequeño (-0.8 MW y -0.34 MVAr), lo que determina que en la etapa de preprocesamiento el vector generado sea uno típico de topologías con la línea 2-4 abierta. En el caso 13 el estimador de estado parte de una topología con un error en la línea 2-1, para la cual tampoco hay medida disponible (Z21), con lo que el estimador de estado parte de que la línea está erróneamente abierta. Consecuentemente, estima un ujo de activa y reactiva de valor 0, lo que fuerza al estimador topológico a cometer un error en la estimación de esa línea. En los casos 24 y 25 se presenta el problema de que el estimador de estado parte de dos errores topológicos para el bus 2. Como una de las dos líneas con error tiene una medición disponible con, posiblemente, un valor pequeño o cero, el estimador de estado asigna una gran parte del saldo de ujo del bus hacia la línea que no dispone de medida. Este tipo de error no puede ser corregido debido a que el vector de estado que se encuentra se adapta para ser coherente con los errores topológicos. En el caso 26 este efecto se acentúa al encontrar el estimador local del bus 4 la línea como cerrada debido, de nuevo, a un ujo muy grande asignado por el estimador de estado. Los casos 28-29 presentan los mismos problemas, pero para una topología diferente. Con el caso 31 se intenta simular la situación en la que el estimador de estado parte de una topología con dos errores en el bus 2 y, además, se añade otro error en una línea de un vecino (1, 3, 4 o 5) pero que no pertenece al bus 2. En este caso todos los errores son corregidos por el estimador topológico. En el caso 32 se añaden otros dos errores en buses de líneas no próximas al bus 2, concretamente en las líneas 5-6 y 12-13 de la red. Los resultados muestran que los errores topológicos son corregidos en todos los casos (con la conguración de medidas señalada). Para el caso 34 se tiene el mismo problema discutido anteriormente, esto es, el error topologíco no puede ser corregido si el estimador no dispone de la medida de una línea que 98 4.3 Estimación topológica con Perceptrones multicapa está abierta y el estimador de estado la considera como cerrada y, además, hay otro error topológico en otra línea del mismo bus. En los casos 35 a 45 se presentan situaciones similares en las que también aparecen errores topológicos por las mismas causas discutidas anteriormente y otros en los que se han añadido errores topológicos a líneas no adyacentes al bus 2. En esta última situación, se comprueba que el estimador local del bus 2 no se ve afectado por tales errores. En resumen, podemos armar que el estimador topológico de un bus falla únicamente en las tres situaciones siguientes: 1. Cuando una línea que está cerrada tiene una medida de ujo muy próxima a cero y desviación típica grande; en este caso el estimador de topología clasica la línea como abierta. 2. Cuando se parte de un estado de línea erróneo (se considera abierta cuando realmente está cerrada) y no se dispone de medida o pseudomedida para la línea, el estimador de estado genera una medida de ujo cero que es clasicada por el estimador topológico como característica de línea abierta. 3. Cuando se parte de un estado de línea erróneo (se considera cerrada cuando realmente está abierta) y no se tiene medida para ésta misma línea y hay otros errores topológicos en líneas que pertenecen al mismo bus. En este caso, el estimador de estado asigna un ujo generalmente de valor muy alto que es interpretado como característico de un estado de línea cerrada por el estimador topológico. Por lo tanto, la aplicabilidad de esta herramienta para una red eléctrica dada pasará por un estudio detallado de las características de cada bus con respecto a la probabilidad de que se presenten para éste las causas de fallos 1, 2 y 3. Estos fallos podrían evitarse congurando el sistema de medidas de forma que se reduzca al máximo el número de buses en los que se pueden dar las condiciones anteriores; o asignando un índice de abilidad a cada estimador local en función de la probabilidad que tenga el bus asociado de presentar las circunstancias problemáticas 1, 2 y 3. Cuando se produzcan contradicciones en la estimación del estado de una línea, se dará mayor importancia a la estimación realizada por el bus con una mayor abilidad. 99 Estimación topológica 4.3.5. Conclusiones sobre los resultados del estimador topológico basado en MLP . En esta sección se ha presentado un estimador de topología neuronal basado en un Perceptrón Multicapa, con una etapa de preprocesamiento de neuronas de base radial. Este estimador está formado por un conjunto de redes neuronales, una para cada bus del sistema, que actúan paralelamente en una primera fase. Una vez realizada la etapa de estimación local, el estimador global, basado en reglas muy simples, se encarga de compatibilizar las estimaciones locales para construir la topología de una red eléctrica orientada a buses y ramas. En las pruebas realizadas con los estimadores topológicos locales para cada bus, los resultados señalan que, salvo para patrones muy atípicos, el porcentaje de errores cuando se dispone de todo el conjunto de medidas es 0. Los patrones atípicos son aquellos en los que líneas cerradas presentan medidas de ujo muy próximas a cero y que tienen una estimación de su error muy alta, esto es, medidas con una desviación típica grande. Este tipo de vectores no puede ser clasicado por la red neuronal ya que presentan características similares a patrones con una topología diferente. Por otro lado, el residuo que genera el estimador de estado cuando parte de un error topológico en estas líneas es pequeño, es decir, desde el punto de vista de la estimación de estado este tipo de errores no invalida la estimación realizada. Cuando el conjunto de mediciones no es completo pero se dispone de pseudomedidas, incluso muy ruidosas, el porcentaje de aciertos es muy alto, produciendo sólo errores en el caso de utilizar pseudomedidas de ujo 0 en líneas que realmente están cerradas. Cuando el conjunto de medidas y pseudomedidas para un bus no es completo, es nece- sario realizar una estimación de estado previa para encontrarlas. En estos casos, cuando el estimador de estado parte de una topología correcta, los resultados muestran un 100% de éxitos en la estimación topológica nal cuando las indecisiones se corrigen con la estimación realizada en el otro extremo de la línea, lo que signica que el estimador topológico diseñado no rectica topologías que realmente son correctas. También, se han visto situaciones en las que el estimador topológico no es capaz de 100 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis corregir una topología errónea que ha sido usada para generar el conjunto de mediciones incompleto para un bus. En estos casos, el estimador de estado genera un conjunto de estimaciones que se adaptan a la topología errónea que el estimador topológico no es capaz de ltrar. Se ha mostrado que los estimadores topológicos locales no se ven afectados por errores topológicos en líneas no adyacentes al propio bus, lo que permite realmente la utilización paralela de cada estimador. Finalmente, señalamos que el estimador topológico diseñado puede completarse con un análisis de residuos para detectar medidas muy erróneas producidas por algún error topológi- co no detectado. En denitiva, se trata de aprovechar el hecho de que los errores topológicos no detectados pueden generar residuos muy grandes para mediciones y estimaciones de líneas adyacentes. 4.4. Asistente topológico basado en funciones base radiales con distancia de Mahalanobis En esta sección proponemos otro método de estimación topológica que mejora signi- cativamente los resultados aportados por el estimador basado en Perceptrones Multicapa. El asistente topológico, tal y como se denominará a partir de ahora, está basado en neu- ronas de funciones base radiales con distancia de Mahalanobis ([García-Lagos et al., 2000b], [García-Lagos et al., 2003]). 4.4.1. Etapa de preproceso La etapa de preproceso para este asistente topológico es idéntica a la etapa de preproceso del estimador topológico basado en Perceptrones Multicapa (ver sección 4.3.1.1). Por tanto, el análisis y resultados de esta etapa son los mismos que en la sección señalada anteriormente. Pasamos sin más a la descripción de la etapa de clasicación, basada en un modelo neuronal completamente diferente. La gura 4.10 presenta un esquema de esta etapa. 101 Estimación topológica 4.4.2. Etapa de clasicación La etapa de clasicación (ver gura 4.11.a)) se compone de una capa de neuronas de potencial Gaussiano con distancia de Mahalanobis [Lee and Kil, 1991]. La función de activación para estas neuronas viene denida por la ecuación (4.4.1): P (xij−Cij)2 −(x−C )H(x−C )T − jy(x) = e i i = e σ 2 ij (4.4.1) donde x es el vector de entrada (salida de la etapa de preproceso),Ci es el centro del grupo o cluster i, y H es la matriz de distancias. Para implementar el sistema,Ci será el vector teórico asociado a la topología i, esto es, la salida preprocesada para medidas exactas (sin error) de una topología particular, y Hi será una matriz diagonal de covarianzas inversas asignada a cada componente de los vectores de la topologíai. Esta matriz se obtiene desde un conjunto de patrones preprocesados correspondientes a una base de datos obtenida a partir de soluciones de un programa de ujo de carga para cada topología particular. Como puede observarse de la denición de la función de transferencia, la forma de estas funciones no es una clásica Gaussiana simétrica, sino una Gaussiana asimétrica donde la inuencia de cada componente de los vectores de entrada está ponderada por su correspondiente covarianza. Cada una de estas unidades indicará el grado de pertenencia de un vector de entrada a una topología particular. De esta forma, un vector de entrada correspondiente a la topología i producirá una salida próxima a 1 en la unidadi, y una salida próxima a 0 en el resto de las unidades. La gura 4.11.b) representa, como ejemplo, las salidas de la etapa de clasicación para dos patrones de dos topologías diferentes. La topología propuesta por el estimador será aquella correspondiente al punto con un valor mayor en el eje y. En en primer caso de la gura 4.11.b) el patrón se asocia a la topología 2, y en el segundo caso a la topología 10. Resumiendo, el asistente topológico, para cada bus, consiste en una etapa de preproceso a la que se presenta un conjunto de ujos de potencia. El vector de salida de la etapa de preproceso se presenta a la capa de neuronas de la etapa de clasicación. La topología propuesta para el patrón de ujos será aquella asociada a la neurona cuya salida sea mayor. 102 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 10 20 30 40 50 60 70 Índices de las unidades de preproceso 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 10 20 30 40 50 60 70 Índices de las unidades de preproceso (a) (b) Figura 4.10: Representación de la etapa de preproceso y la salida del asistente topológico basado en funciones potenciales de Gauss. (a) Etapa de preproceso. (b) salida de la etapa de preproceso. 103 Salidas de las unidades de preproceso Salidas de las unidades de preproceso Estimación topológica 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 Índices de las unidades de clasificación 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 Índices de las unidades de clasificación (a) (b) Figura 4.11: Esquema de la etapa de clasicación del asistente topológico basado en funciones potenciales de Gauss. (a) Representación de las neuronas de base radial con distancia de Mahalanobis, que constituyen la etapa de clasicación del asistente topológico. (b) Salida. 104 Salidas de las unidades de clasificación Salidas de las unidades de clasificación 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis 4.4.3. Resultados experimentales En primer lugar señalamos que los resultados de aplicación de este método no están afectados por el tamaño de la red, debido a que se aplica independientemente a cada uno de los buses de la misma. No obstante, con el objetivo de comprobar la efectividad de método, se han utilizado las redes estándares IEEE de 14, 30, 57 y 118 buses, donde se han comprobado los resultados para todas las posibles topologías de varios buses. Por razones de brevedad sólo se muestran los resultados del bus número 15 de la red IEEE-118, pero los resultados son extensibles a los demás buses de la red. El bus número 15 tiene una inyección y líneas de conexión a los buses 13 (línea 15-13), 14 (línea 15-14), 17 (línea 15-17), 19 (línea 15-19) y 33 (línea 15-33). Las simulaciones se han realizado para un periodo completo de 63 días. Cada patrón diario se ha obtenido a partir de la curva de la Figura 4.12 variando la carga base de cada bus de la red desde un 50% a un 140%. Adicionalmente, las cargas de cada bus se cambian añadiendo un ruido gaussiano de media cero y desviación estándar correspondiente a un 2% de la carga base. Una vez denido el patrón de carga y generación de cada bus de la red, se calcula el vector de estado a partir de la solución de un problema de ujo de carga. Con este vector de estado se obtiene el conjunto de patrones de ujo e inyeccionesreales del sistema. Para simular el conjunto de medidas que se utilizarían en un sistema real, a cada patrón de ujos e inyecciones obtenidos en el paso anterior se añade un ruido gaussiano con media 0 y desviación estándar dada por la ecuación (4.4.2) [Souza et al., 1997]. 3σZ = ACC× | Z | + FS (4.4.2) En esta ecuación, |Z| es el valor absoluto de la medida, ACC=0.02 es un parámetro denom- inado exactitud y FS=0.035 es el parámetro full-scale. Además, se ha simulado la presencia de medidas anormalmente erróneas mediante la inclusión de un error normal con desviación estándar de 3σ a 15σ. Siguiendo este procedimiento, disponemos de un conjunto de 1500 medidas de ujo e inyecciones, algunas de ellas anormalmente erróneas, para las diferentes topologías de cada bus de las redes analizadas. Para comprobar la funcionalidad del asistente topológico se han realizado diferentes experimentos atendiendo principalmente a dos criterios: 105 Estimación topológica 1.4 1.3 1.2 1.1 1 0.9 0.8 0.7 0.6 0.5 0 200 400 600 800 1000 1200 1400 1600 Hora Figura 4.12: Patrón para la variación de la carga diaria de los buses. a) Disponibilidad del conjunto de medidas asociadas a un bus o la ausencia de ellas. b) Existencia o no de medidas anormalmente erróneas. En las siguientes secciones se comentan los resultados obtenidos. 4.4.3.1. Todas las medidas disponibles. Cuando todas las medidas están disponibles1, se han realizado las siguientes pruebas: i) cada medida se ha obtenido utilizando la desviación estándarσi dada por la ecuación (4.4.2) ii) Se han producido algunas medidas muy erróneas, calculadas a partir de sus valores reales utilizando desviaciones estándares de 5σi, 10σi, y 15σi. Se han analizado todas las topologías posibles de cada bus. El asistente topológico propone, en todos los casos, la topología correcta. Como ejemplo mostramos los resultados paras las siguientes situaciones: la gura 4.13(a) muestra las salidas del sistema para un conjunto de medidas normales cuando la línea 15-33 está abierta (fuera de servicio). Esta conguración está asociada a la unidad 2 de la etapa de clasicación. La gura 4.13(b) muestra la salida del sistema cuando la línea 15-17 esta abierta y la inyección ha sido obtenida usando una desviación estándar de 5σi. Esta topología está asociada a la unidad 5. La gura 4.13(c) muestra la salida del sistema cuando las líneas que están abiertas son la 15-13 y la 15-33, y el ujo de potencia de la línea 15-17 se obtiene utilizando una desviación 1Al igual que para el estimador de topología basado en perceptrones multicapa, para obtener el conjunto completo de medidas para un bus podemos utilizar pseudomedidas. 106 Relación sobre la carga base del bus 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis estándar de 10σi. Esta topología está asociada con la unidad 18. Por último, la gura 4.13(d) muestra la salida del sistema cuando las líneas que están abiertas son la línea 15-13 y la línea 15-17, y el ujo de potencia de la línea 15-14 se obtiene usando una desviación estándar de 15σi. Esta topología está asociada a la unidad 21. En estas guras, el eje X representa las 31 unidades de la etapa de clasicación, donde la neurona i se asocia con la topología número i (se ha obviado la conguración en la que todas las líneas del bus están fuera de servicio). El eje Y representa las salidas de cada unidad para un patrón de entrada particular. 4.4.3.2. No todas las medidas disponibles. En este experimento repetimos las simulaciones anteriores asumiendo que la inyección del bus o un ujo no está disponible para el bus, y esta medida no puede ser reemplaza- da por una pseudomedida. En esta situación, anulamos todas las componentes del vector preprocesado en las cuales interviene la medida ausente, asociando a estas componentes un valor de σ muy alto cuando se calcula la distancia de Mahalanobis. Esto signica que todos los componentes del vector preprocesado relacionados con la medida no disponible son ig- norados. Sin embargo, la discriminación entre diferentes topologías es aún posible debido a que el resto de componentes es aún signicativo. Esto se debe a la ley de Kirchho, según la cual, cuando sólo falta una de las medidas de bus, ésta puede ser calculada como la suma algebraica del resto de medidas. En este caso, el asistente topológico produce un 100% de situaciones correctas usando medidas erróneas con una desviación estándar de hasta6σi. Los resultados de estos exper- imentos se muestran en la gura 4.14. Así, la gura 4.14(a) muestra la salida del sistema para un conjunto de medidas normales cuando las líneas 15-14 y 15-33 están abiertas, y la inyección de potencia no está disponible. Esta topología está asociada con la unidad 10. La gura 4.14(b) muestra la salida del sistema cuando está abierta la línea 15-17, el ujo de potencia de la línea 15-13 no está disponible y la inyección se obtiene utilizando una desviación de 3σi. Esta topología está asociada con la unidad 5. La gura 4.14(c) muestra la salida del sistema cuando las líneas abiertas son la 15-17 y la 15-19, el ujo de potencia de la línea 15-17 no está disponible y el ujo de la línea 15-33 se obtiene mediante una desviación de 5σi. Esta topología está asociada con la unidad 7. Por último, la gura 4.14(d) muestra la salida cuando las líneas abiertas son las 15-13, 15-17, 15-19 y 15-33, el ujo de potencia de 107 Estimación topológica 0.9 1 0.8 0.9 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Índices de las unidades de clasificación Índices de las unidades de clasificación (a) (b) 0.8 1 0.9 0.7 0.8 0.6 0.7 0.5 0.6 0.4 0.5 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Índices de las unidades de clasificación Índices de las unidades de clasificación (c) (d) Figura 4.13: Salidas de la etapa de clasicación para patrones pertenecientes a diferentes topologías, cuando todas las medidas del bus están disponibles. 108 Salidas de las unidades de clasificación Salidas de las unidades de clasificación Salidas de las unidades de clasificación Salidas de las unidades de clasificación 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis la línea 15-17 no está disponible y la inyección de potencia se obtiene usando una desviación estándar de 6σi. Esta conguración de las líneas está asociada a la unidad 24. Cuando los errores en las medidas erróneas son mayores de 6σi los resultados de la clasicación no son satisfactorios en muchos casos, por lo que se ha jado este umbral como valor máximo para el funcionamiento correcto del asistente topológico en el caso de ausencia de una medida. 4.4.4. Conclusiones sobre los resultados del asistente topológico basado en unidades de funciones base radiales con distancia de Maha- lanobis En esta sección, se ha presentado un nuevo método para la determinación de la topología de una red compatible con el conjunto de medidas disponibles en el sistema. El asistente topológico está formado por dos etapas. La primera es una etapa de preprocesamiento, que está compuesta por una capa de elementos de proceso con función radial, que transforman las inyecciones y ujos de potencia activa de cada bus en un nuevo vector cuyas compo- nentes pertenecen al intervalo [0,1]. Esta transformación produce agrupaciones de patrones similares, de tal forma que dos patrones de entrada correspondientes a la misma topología producirán patrones preprocesados muy similares. La segunda etapa, de clasicación, se compone de una capa de unidades con función de activación Gaussiana con distancia de Mahalanobis. En esta capa hay una unidad por cada posible conguración topológica de un bus, de forma que cuando se presenta a la misma un vector preprocesado, la unidad cuya salida sea mayor indica la topología que debe asociarse al vector de entradas de inyección y ujos original. En comparación con otras técnicas numéricas y neuronales, este modelo presenta las siguientes ventajas: a) El proceso de estimación es local, y la topología de cada bus se obtiene de una forma independiente y en paralelo. b) Como consecuencia, la complejidad del sistema crece linealmente con el tamaño del sistema de potencia. c) Los parámetros involucrados en el modelo se obtienen de forma fácil y directa desde una base de datos histórica, no requiriendo de ningún proceso de entrenamiento. d) Para los buses en los que se dispone de todas las medidas asociadas (medidas de campo 109 Estimación topológica 1 1 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Índices de las unidades de clasificación Índices de las unidades de clasificación (a) (b) 1 1 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Índices de las unidades de clasificación Índices de las unidades de clasificación (c) (d) Figura 4.14: Salidas de la etapa de clasicación para patrones pertenecientes a diferentes topologías, cuando una de las medidas del bus no está disponible. 110 Salidas de las unidades de clasificación Salidas de las unidades de clasificación Salidas de las unidades de clasificación Salidas de las unidades de clasificación 4.4 Asistente topológico basado en funciones base radiales con distancia de Mahalanobis o pseudomedidas), el sistema obtiene la topología correcta del bus incluso para medidas generadas con un error muy alto, de hasta 6σ. e) El asistente topológico puede usarse cuando un ujo de medida o inyección no está disponible; en esta situación, se obtiene la topología correcta incluso con medidas anormalmente erróneas. f) El rendimiento del sistema es altamente inmune a grandes cambios en la curva de carga del sistema. 111 Estimación topológica 112 Capítulo 5 Análisis de seguridad 5.1. Introducción El objetivo principal de un sistema de seguridad para un sistema de energía eléctrica es mantener el punto de operación de éste dentro de una zona de seguridad, garantizando así un suministro de energía continuo y aceptable. Las nuevas condiciones del mercado de la energía, originadas por nuevas circunstancias como la deregulación, el incremento del consumo, y las restricciones económicas, sociales y medioambientales en la construcción de nuevas redes, fuerzan al sistema a trabajar cerca de sus límites de seguridad, produciendo puntos de operación cada vez menos conservativos. En consecuencia, se hace necesaria la monitorización continua del sistema para detectar situaciones de peligro lo antes posible. En particular, la tarea de Análisis de Contingencias debe informar de si el estado actual del sistema es seguro, crítico o inseguro con respecto a cada posible contingencia, esto es, a un posible fallo en un componente particular del sistema. Esta tarea puede ser abordada bien por métodos funcionales, caracterizando la gravedad de cada contingencia mediante un valor numérico, o bien por métodos grácos, permitiendo la evaluación de cada contingencia de una manera visual. En ambos casos, el análisis de contingencias está condicionado por dos factores: por una parte, el modelado del sistema requiere del uso de miles de variables con valores ruidosos o parcialmente conocidos; por otra parte, el comportamiento del sistema es altamente no lineal con respecto a estas variables. Como se acaba de señalar, la evaluación de la seguridad del sistema incluye la clasi- cación del estado actual para decidir si opera en un estado seguro, crítico o inseguro. La 113 Análisis de seguridad seguridad del sistema se evalúa tanto para el estado actual como para un número de estados simulados derivados del estado actual asumiendo que una o varias líneas, transformadores o generadores queden fuera de servicio (outage). Las técnicas más empleadas para realizar esta tarea se basan, en mayor o en menor medida, en la utilización de soluciones de ujo de carga para evaluar el estado del sistema [Warwick et al., 1997]. El modelo de ujo de carga de un sistema de potencia consiste en una serie de ecuaciones algebraicas no lineales cuyas variables dependientes son las inyecciones netas de potencia de los buses (la generación de potencia en el bus menos la carga); los parámetros son las impedancias; y las variables independientes son las tensiones complejas de cada bus. Para el cálculo de las tensiones complejas de cada bus y la clasicación del estado actual del sistema es necesario resolver numéricamente este sistema de ecuaciones, generalmente utilizando un modelo linealizado tal como el método deNewton. Para decidir sobre la seguridad del sistema, la tensión de cada bus y el ujo de potencia por cada línea deben compararse con los valores máximos y mínimos soportados por los diferentes compo- nentes de la red, es decir, para que el sistema sea clasicado como seguro, la solución del problema de ujo de carga debe satisfacer los límites de corriente máxima que puede circular por una línea, los límites de potencia reactiva, los límites de tensión y los límites de caída de tensión. Para realizar un análisis de seguridad completo es necesario considerar todas las posibles combinaciones de fallos en los elementos de la red, lo que convierte al problema en intratable debido al crecimiento exponencial del número de casos posibles a resolver con respecto al número de contingencias posibles. La estimación de la seguridad que se acaba de describir se denomina análisis de seguridad estática. Cuando se tiene en cuenta el comportamiento temporal del sistema, el sistema de potencia viene descrito por un conjunto de ecuaciones diferenciales no lineales cuyas condiciones límites (también llamadas condiciones frontera) vienen dadas por las ecuaciones no lineales del problema de ujo de carga descritas anteriormente. Por tanto, la seguridad estática es una aproximación de primer orden de la seguridad dinámica [Warwick et al., 1997]. En este trabajo, sólo se considera la seguridad estática. Aunque los avances en telecomunicación y computación permiten un conocimiento cada vez más detallado de los sistemas de energía, las técnicas de análisis clásicas, basadas en la solución de problemas de ujo de carga siguen siendo insatisfactorias ya que no pueden 114 5.1 Introducción garantizar soluciones en tiempo real para todas las posibles contingencias. Sin embargo, son estos métodos los más extendidos en al actualidad, principalmente, los basados en el cálculo desacoplado rápido de los ujos de carga (Fast Decoupled Load Flow en la nomenclatura inglesa) [Monticelli et al., 1990]. Aunque con este método se consigue reducir signicativa- mente el número de cálculos implicados, su principal inconveniente sigue siendo la cantidad de cálculos de ujos de carga necesarios para la determinación de los ujos de línea y ten- siones de buses para cada contingencia, lo que convierte a estos métodos en inaplicables para propósitos de tiempo real. Además, puesto que están basados en algoritmos de convergencia rápida para el cálculo de ujos de carga, la convergencia no está garantizada en casos de sobrecarga del sistema. En este capítulo, se profundiza en el análisis de la aplicabilidad de las RNAs al prob- lema del análisis de contingencias. En primer lugar, se analiza el enfoque funcional del análisis de contingencias describiendo la aplicación de los paradigmas Perceptrón Multicapa (MLP) con aprendizaje Backpropagation y Redes de Funciones Base Radiales (RBF). En segundo lugar, se analiza el enfoque visual describiendo la aplicación de los MapasAuto- Organizativos de Kohonen tanto bidimensionales como lineales. Esta última aplicación nos parece especialmente interesante ya que proporciona un sistema de monitorización de con- tingencias extremadamente rápido y amigable desde el punto de vista de un operador del sistema. Como casos de estudio se han utilizado las redes estándar IEEE-14 e IEEE-118 y los patrones de entrada han sido obtenidos a partir de un caso base siguiendo la metodología explicada más adelante. En consecuencia, la estructura del capítulo queda como sigue. En la sección 5.2 se presenta un breve repaso bibliográco sobre las técnicas más extendidas para análisis de contingencias. La sección 5.3, Generación de patrones e Índices de Prestación (Performance Index en inglés) explica el proceso de generación de los patrones usados co- mo entradas a los distintos sistemas neuronales, así como la expresión matemática de los índices de prestación usados para la evaluación numérica de las contingencias. La sección 5.4, Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado, está dedicada al estudio de este tipo de redes, conc- retamente el MLP y RBF, aplicadas a la evaluación numérica de contingencias. La sección 5.5, Visualización de contingencias con Mapas Auto-Organizativos de Kohonen, desarrolla el análisis de este tipo de redes como herramientas para la visualización rápida del nivel 115 Análisis de seguridad de gravedad de contingencias. Finalmente, la sección 5.6, Conclusiones, realiza un breve resumen de las principales aportaciones del capítulo. 5.2. Principales métodos de análisis de contingencias El análisis de contingencias debe considerar la posibilidad de fallo de diferentes com- ponentes del sistema para evaluar la seguridad del mismo, estimando la probabilidad y gravedad de una situación insegura. Debido a la naturaleza no ideal del funcionamiento de los diferentes elementos físicos del sistema, al comportamiento del consumo eléctrico o a condiciones externas climáticas que pueden inuir en el funcionamiento del sistema de potencia, el análisis de seguridad presenta características no deterministas. Los métodos Monte Carlo se han utilizado ampliamente para el análisis probabilístico de los sistemas de potencia, tanto para tareas de planicación ([Bertoldi et al., 1988]) co- mo para determinar su abilidad ante fallos en determinados componentes. Así, en [Lerma, 1990] se presenta la aplicación de este método para el análisis de seguridad estático, donde para varios elementos de la red (generadores, cargas y líneas) se estima su probabilidad de estar fuera de servicio, y se supone que el consumo de energía en cada nodo de la red alcanza su valor máximo. El análisis completo del sistema permite obtener la probabilidad de que el consumo de energía no sea satisfecho, así como obtener los puntos de la red más vul- nerables, lo que puede ser utilizado para tareas futuras de planicación. En [Pereira et al., 1992] se presenta una estructura general que permite combinar los métodos analíticos y las simulaciones Monte Carlo para el análisis de sistemas de potencia. La idea principal de este trabajo es la utilización de un método analítico aproximado simple como aproximación inicial para un modelo más detallado tipo Monte Carlo. Analizando las diferencias encon- tradas por el método analítico aproximado y el obtenido por simulaciones Monte Carlo, se generan unos índices probabilísticos que permiten identicar las situaciones en las que el método analítico, computacionalmente menos costoso, puede ser aplicado con garantías, utilizando las simulaciones Monte Carlo en los casos donde los resultados analíticos no son aceptables. Esta combinación hace compatibles los métodos analíticos con los probabilísti- cos, permitiendo en muchos casos obtener lo mejor de cada uno de ellos. En [Billinton and Sankarakrishnan, 1995] se analizan varios métodos basados en simulaciones Monte Carlo, 116 5.2 Principales métodos de análisis de contingencias comparando especialmente los métodos secuenciales y no secuenciales. El trabajo justica la validez del método secuencial para la obtención de índices que permiten cuanticar la frecuencia y duración de interrupciones del suministro eléctrico. El modelado de la incer- tidumbre del sistema puede ser mejorado considerando que la demanda del sistema también tiene comportamiento probabilístico. Así, en [Saraiva et al., 1996] se utiliza la simulación Monte Carlo junto con lógica difusa. El consumo de potencia de cada bus se modela medi- ante reglas difusas, obteniendo de esta forma unafunción de pertenencia para la potencia no suministrada por el sistema, mediante la resolución de un problema de carga óptimo difuso (fuzzy optimal power ow) ([Miranda and Saraiva, 1992]), lo que permite obtener un estado más exacto del sistema, a costa de un tiempo de cómputo mayor. Otros trabajos [Billinton and Jonnavithula, 1996] intentan reducir la complejidad computacional mediante técnicas de reducción de varianza del método Monte Carlo. En [Mori and Yuihara, 1998] se utiliza un método basado en análisis de intervalos que permite reemplazar a los métodos Monte Carlo, métodos de ujo de carga estocásticos y a los métodos de ujo de carga difusos en el sentido de que simplica el manejo de variables estocásticas, mejorando la eciencia de los métodos probabilísticos. Los métodos Monte Carlo presentan las ventajas de que son exibles y permiten un alto detalle en la simulación de sistemas complejos, tanto en su modo de operación como en su conguración. Sin embargo, en general, los métodos basados en técnicas Monte Carlo presentan los siguientes problemas: requieren de un alto tiempo de cómputo para obtener una estimación able del estado de la red, incluso utilizando nuevas técnicas de reducción de complejidad; debido a su base probabilística, es difícil decidir cuándo terminar la sim- ulación; la obtención de las funciones de distribución de probabilidad es a veces una tarea muy compleja; pueden presentar problemas de convergencia; el modelado más preciso de variables con componentes aleatorias como la demanda de energía, aunque hace más able la evaluación del estado actual del sistema, incrementan los recursos necesarios para realizar el análisis. Debido a estos inconvenientes, estos métodos se han utilizado principalmente para tareas de planicación, y no para el análisis de contingencias en tiempo real. Otros métodos de análisis de contingencias no probabilísticos se basan en la obtención de índices, generalmente mediante la solución de problemas de ujo de carga, que permiten evaluar la gravedad de las contingencias consideradas en la simulación. Estos índices suelen 117 Análisis de seguridad considerar como problemas independientes el análisis de seguridad de tensiones (manten- imiento de los niveles de tensión en cada bus dentro de sus márgenes de seguridad), y el análisis de la capacidad de suministro de la potencia demandada en cada bus del sistema (máximo consumo permitido en un bus para mantener la estabilidad de la red), ya que las contingencias que causan sobrecargas en las líneas no necesariamente causan violaciones en los márgenes de tensión y viceversa ([Albuyeh et al., 1982]). Otra alternativa, dentro de los métodos clásicos, aparece en [Vaahedi et al., 1999], donde se describe un módulo de moni- torización (screening) y ordenación (ranking) de contingencias basado en Índices de Soporte Reactivo RSI (en inglés, Reactive Support Index) y un proceso de ltrado iterativo. Con el objetivo de reducir los tiempos de cómputo requeridos para realizar la simulación del gran número de posibles contingencias en un sistema grande, se han propuesto diferentes técnicas como la utilización de algoritmos de ujos de carga más ecientes, la reducción (mediante selección) del número de contingencias consideradas o la distribución del trabajo. Así, en [Ejebe et al., 1988] se propone un algoritmo que identica la localización de los buses que potencialmente pueden presentar problemas de márgenes de tensión, deniendo una subred sobre la que realizar el análisis de contingencias, que permite el análisis de un número mayor de ellas. Sin embargo, la denición de la subred debe realizarse para cada posible contingencia. En [Ajjarapu and Christy, 1992] se presenta un método para encontrar de forma continua soluciones de problemas de ujo de carga comenzando con un caso base y continuando hasta encontrar los límites de estabilidad de tensión del sistema (punto crítico). La idea general de este método es emplear un esquema de predicción-corrección para encon- trar un camino hacia la solución de un conjunto de ecuaciones que se han modicado para considerar cambios en la carga del sistema. La principal ventaja de este método es que no encuentra problemas de condicionamiento numérico cerca del punto crítico. En [Ejebe et al., 1996] se comparan cuatro métodos diferentes para evaluar la distancia hasta el punto de co- lapso de tensión para un nivel de carga particular y se proponen mejoras tanto en eciencia como en exactitud de resultados. En [Lemaître and Thomas, 1996] se describe el proceso de paralelización de un sistema de análisis de seguridad y de coste de operación basado en simulaciones Monte Carlo que permite reducir los tiempos de cómputo. En [Santos et al., 1999] se propone el análisis de contingencias mediante la resolución de problemas de ujo 118 5.2 Principales métodos de análisis de contingencias modicados en dos aspectos importantes. En primer lugar, se proponen cambios en el proce- so de solución para ahorrar operaciones aritméticas en relación al método clásico. Por otro lado, se propone una estructura cliente/servidor heterogénea (los clientes no tienen por qué tener las mismas características) para la distribución de la carga computacional a través de computadores conectados en red mediante sockets. La estructura del análisis es la siguiente: el servidor realiza la resolución del caso base y selecciona aquellas contingencias que deben ser analizadas. Cada vez que un cliente queda libre, el servidor le envía datos (vectores y matrices) del caso base y de la contingencia que debe analizar. Cuando el cliente termina de analizar la contingencia, envía los resultados al servido y queda libre para procesar otra contingencia. Las ventajas de este sistema distribuido son: la exibilidad, ya que el número de clientes puede variar dinámicamente y éstos pueden ser diferentes tanto en conguración hardware como software; la eciencia, ya que mediante una política de distribución de tareas dinámica permite asignar contingencias a clientes según su carga computacional actual (y no sólo potencial); y por último, abilidad, ya que si un cliente queda fuera de servicio, la contingencia que está analizando será asignada a otro cliente. Aunque se han propuesto numerosas mejoras a los métodos clásicos de análisis de con- tingencias, todos ellos sufren en mayor o mejor medida de limitaciones temporales debido a que la evaluación de un gran número de contingencias no es posible de realizar en tiem- po real. Otros métodos, como el presentado en [Vaahedi et al., 1999] permiten mejorar los resultados, pero a costa de añadir etapas de ltrado que sobrecargan el sistema. Por otro lado, aunque las técnicas de paralelización y distribución de la carga computacional presen- tan ventajas potenciales frente a los sistemas centralizados, la disponibilidad de hardware y software especíco supone una desventaja importante en muchos casos, además de que suponen un aumento de la complejidad en la gestión de los sistemas. Otros métodos para abordar el problema de la seguridad están basados en sistemas expertos [Fujiwara et al., 1986], que intentan explotar el conocimiento humano formulando explícitamente reglas que permitan predecir los efectos de diferentes contingencias y asistir al operador en la toma de decisiones. La lógica difusa es otro método basado en reglas que intenta cuanticar el conocimiento cualitativo del sistema por parte del operador, y que ha sido aplicado a seguridad exitosamente. Así, en [Hsu and Kuo, 1992] se presenta un sistema basado en lógica borrosa para la ordenación (ranking) de contingencias. El proceso 119 Análisis de seguridad de ordenación comprende dos etapas. En primer lugar, se resuelve un problema de ujo de carga simulando una contingencia. Los valores obtenidos, codicados convenientemente, se emplean en una segunda etapa como entrada al controlador difuso, cuyas reglas han sido generadas a partir de la experiencia de los operadores del sistema. La salida del controlador difuso es un índice de peligrosidad de la contingencia que se utiliza para clasicarla dentro de la lista de contingencias analizadas anteriormente. La ventaja principal de este método es que permite incorporar la experiencia de los operadores en el proceso de ordenación. Además, las reglas difusas pueden ser calibradas durante el funcionamiento del sistema, lo que permite la mejora del producto a lo largo del tiempo de funcionamiento del mismo. Otro método basado en lógica borrosa se presenta en [Lo and Abdelaal, 2000], cuyos resultados tienen una calidad comparable a los obtenidos con métodos clásicos computacionalmente mucho más costosos. En [Matos et al., 2000] se presenta una solución basada también en lógica borrosa. El método consta de varias etapas. En la primera, la etapa de generación de patrones para entrenamiento, se deben generar numerosos patrones correspondientes a distintos puntos de operación, que deben contener gran diversidad en niveles de carga. Para cada patrón generado se determina si el sistema es seguro o inseguro. La segunda etapa se denomina de selección de características, en la que los patrones generados en la etapa anterior se simplican mediante técnicas estadísticas. La tercera etapa consiste en el diseño de un clasicador difuso para cada una de las contingencias disponibles. La última etapa es la de clasicación on-line, en la que cada nuevo patrón se clasica en un estado seguro o inseguro, con un coste computacional mínimo. La ventaja de este método radica en que la carga computacional es alta únicamente en las tres primeras fases del método, que se realizan o-line y que sólo hay que realizar una vez. Además, a diferencia de la mayoría de los trabajos relacionados, permite analizar contingencias dobles para una topología particular. Los métodos que emplean lógica difusa presentan el inconveniente de que es necesario fuzzilizar las variables del sistema, para que el método pueda ser aplicado satisfactoriamente. Para realizar esta tarea es necesario denir diferentes umbrales para las variables que inter- vienen en el sistema, realizar una cuanticación difusa (fuzzy quantization) para construir la funciones de pertenencia y seleccionar el conjunto de operadores difusos a utilizar para el problema particular. La precisión con la que realice esta operación determinará la ecien- cia del sistema. En todo caso, este tipo de solución suele ser poco portable, requiriendo la 120 5.2 Principales métodos de análisis de contingencias reconstrucción del sistema cuando se quiere llevar a otro entorno diferente. Las técnicas basadas en Redes Neuronales Articiales constituyen una muy interesante alternativa a los métodos clásicos de evaluación de seguridad. Estas técnicas disponen de diferentes paradigmas especialmente aptos para llevar a cabo el análisis de contingencias, tanto desde el enfoque funcional como visual. Así, los paradigmas neuronales alimentados hacia delante y aprendizaje supervisado como el Perceptrón Multicapa o las redes de Fun- ciones Base Radiales, pueden ser utilizados como aproximadores de las funciones numéricas que evalúan el nivel de seguridad de cada contingencia, permitiendo así la construcción de un ranking de contingencias. Por otra parte, los paradigmas no supervisados como los Ma- pas Auto-Organizativos de Kohonen, caracterizados por su capacidad para extraer criterios de clasicación no evidentes a partir del procesamiento no supervisado de un conjunto de patrones y por su capacidad para mostrar posibles relaciones entre patrones en un espa- cio dimensionalmente reducido, pueden ser usados en un sistema de clasicación visual de contingencias de acuerdo con su nivel de seguridad. En [Yan et al., 1991] se presenta un modelo basado tanto en sistemas expertos como en RNAs para la monitorización de la seguridad del sistema. La primera etapa consiste en un sistema experto que determina si una contingencia es segura o no, y se clasica según el tipo de problemas que puede generar. Las contingencias que son potencialmente peligrosas se pasan a un segunda etapa, compuesta por tres RNAs, que determina su nivel de gravedad. Cada una de las tres redes neuronales de la segunda etapa está entrenada para especializarse en un tipo particular de contingencia. En [Chung and Ying, 1998] se utiliza un MLP como equivalente al modelo externo de una red eléctrica, de forma que se consigue una reducción en el modelo equivalente del sistema que se resolverá mediante ujos de carga, cuyos resultados son utilizados para el análisis de contingencias. El objetivo nal es la reducción de los tiempos de cómputo en el análisis de contingencias. Un sistema basado en redes neuronales tipoCounterpropagation ([Hecht-Nielsen, 1987]) se presenta en [Lo et al., 1998]. La salida de la red neuronal es el valor de un índice que permite determinar de forma aproximada la gravedad de la contingencia. Los patrones de entrenamiento se generan mediante la solución de problemas de ujo de carga, y se simulan un número de contingencias predenidas por el usuario. Para cada solución se calcula el 121 Análisis de seguridad correspondiente índice de severidad. Los resultados son prometedores en el sentido de que la red clasica la gravedad de las contingencias de la misma forma que lo hace la ordenación generada por un problema de ujo de carga. La capacidad de las redes neuronales del tipo Redes de Funciones Base Radiales [Moody and Darken, 1989] para el análisis de contingencias se analiza en [Maghrabi et al., 1998] y [Refaee et al., 1999]. En [Maghrabi et al., 1998] se utilizan para tareas de planicación, no requiriendo un funcionamiento en tiempo real. Este trabajo se mejora y amplía en [Refaee et al., 1999], donde se explota la capacidad de este tipo de redes para estimar los ujos de potencia de las líneas y la tensión de los buses en el caso de la ocurrencia de una contingencia. Se utilizan dos RBF: la primera, se entrena para hacer corresponder la matriz de admitancias de la red, la carga y generación de cada bus con los ujos por las distintas líneas de la red; la segunda red, utiliza las mismas entradas, pero obtiene las tensiones de cada bus. El sistema, al igual que su predecesor, sólo se utiliza para tareas de planicación de la expansión del sistema de potencia. En [Luan et al., 2000] se utiliza el método de regresión R-ReliefF ([Robnik-Sikonja and Kononenko, 1997]) para reducir la dimensión de los patrones de entrada a un modelo neuronal. Los patrones de entrada están compuestos por las inyecciones de potencia en cada bus de la red en una situación de pre-contingencia, y la salida es un índice de prestación correspondiente a la situación post-contingencia. El método se basa en considerar como un problema de regresión no lineal las relaciones entre las entradas a la red y el índice de prestación (PI) correspondiente a varias contingencias. Una aplicación del MLP para monitorización y ordenación de contingencias se describe en [Sidhu and Cui, 2000]. A partir de la solución de problemas de ujo de carga realizados o-line, se generan patrones para entrenar un MLP. Las entradas son los 27 armónicos principales obtenidos a partir de la aplicación de una transformada rápida de Fourier al vector cuyas componentes son la generación y la carga de cada uno de los buses de la red IEEE-14, además de un número entero que indica la contingencia que se está analizando. Esta transformación permite disminuir el número de iteraciones necesarias para entrenar a la red neuronal. Las salidas de la red son dos índices que representan el grado de peligrosidad del vector de entrada original. Los resultados demuestran que el MLP es capaz de generalizar bien, requiriendo en la fase de ejecución un tiempo considerablemente menor que el requerido 122 5.2 Principales métodos de análisis de contingencias para realizar el mismo análisis mediante la solución de ujos de carga utilizando el método rápido desacoplado. El principal inconveniente de este método está en la existencia de una única red neuronal que debe evaluar todas las contingencias, diferenciando contingencias únicamente mediante una entrada adicional. Este tipo de modelos hace que el proceso de entrenamiento de la red sea muy costoso y difícil y, en la mayoría de los casos, no produce buenos resultados de generalización durante la fase de operación. En [Chicco et al., 2001] se analiza la capacidad de generalización de tres paradigmas neuronales diferentes (RBFs, PLN (Progressive Learning Network) y SOM) para la predic- ción on-line de tensiones en los buses de un sistema, con el objetivo de obtener de forma rápida las tensiones del sistema ante contingencias. Los mejores resultados son obtenidos por redes tipo RBF. En [Kim and Singh, 2002] se aborda el problema del análisis de seguridad probabilísti- co, utilizando tanto SOMs como simulaciones Monte Carlo. El análisis se lleva a cabo tanto para estabilidad transitoria como estabilidad en estado estable, mediante la denición de tres índices probabilísticos para cada contingencia. A partir del análisis de estos tres índices para cada posible contingencia, se decide si el sistema es seguro o inseguro. Para reducir la cantidad de cálculos que se necesitarían para evaluar, para cada contingencia, estos índices por simulaciones Monte Carlo, se utiliza una SOM que realiza una clasicación de los pa- trones para varios años. Para cada clase del mapa, se evalúan estos índices, decidiendo si el sistema es o no seguro. Cada neurona se marca como segura o insegura en función de los índices. Esta operación se realiza únicamente en la fase de entrenamiento del sistema. En la fase de ejecución sólo se utiliza el SOM, presentando un patrón a su entrada y declarándolo seguro o inseguro según la neurona que ha ganado. A partir del estudio de las técnicas de análisis de contingencias que utilizan modelos neuronales, se pueden obtener las siguientes conclusiones: En la mayoría de los trabajos en los que se utilizan RNAs para el análisis de contingen- cias el objetivo o salida de la red es la clasicación de un patrón de entrada en uno de dos posibles estados: seguro o inseguro. En general esta información no es suciente, ya que es conveniente indicar además el grado de seguridad o inseguridad del patrón, así como una evolución del mismo. Esto permite tener una perspectiva general del estado 123 Análisis de seguridad actual y una predicción a corto plazo del estado del sistema. Los modelos neuronales que emplean métodos de regresión (p.e. [Luan et al., 2000]) tienen el inconveniente de que para realizar el modelo de regresión, deben consider- ar solamente un número reducido de contingencias, ya que de otra forma el modelo neuronal resulta muy complejo. La inclusión de la topología de la red en el modelo es una idea interesante porque permite analizar múltiples contingencias indirectamente. Esto se ha hecho por ejemplo en [Refaee et al., 1999], utilizando la matriz de admitancias. Sin embargo, la capacidad de generalización de la red dependerá en gran medida de los patrones utilizados en la fase de entrenamiento (es imposible generar todas las Y-matriz combinaciones para todas las topologías diferentes. La inclusión de una entrada particular que indica la topología que se está estudiando, exige el uso de patrones de entrada heterogéneos, en los que aparecen mezcladas vari- ables cualitativas (variables discretas, generalmente) y magnitudes medidas (variables continuas, generalmente) que convierten el proceso de aprendizaje de la red en una tarea muy difícil. Por otro lado, la consideración de contingencias distintas a la n-1 requeriría la creación de un modelo neuronal nuevo. La aplicación de los modelos analizados a redes de gran tamaño requiere la reducción de la dimensionalidad de los patrones de entrada (feature selection), pero en general no se proponen métodos efectivos para esta tarea, o los que se proponen son computa- cionalmente muy complejos. En este trabajo proponemos el uso de técnicas neuronales que evitan en gran medida estos inconvenientes. Así, describimos sistemas neuronales apropiados tanto para la selección de variables, la monitorización visual o la evaluación numérica y ordenación de contingen- cias. 124 5.3 Generación de patrones e índices de prestación 5.3. Generación de patrones e índices de prestación Como casos de estudio se han utilizado las redes estándares IEEE-14 e IEEE-118. Para ambas, se han denido dos índices diferentes a partir del principio de desacoplo entre las po- tencias activa y reactiva: Índice de Prestación de Potencia Activa (PIp) e Índice de Prestación de Potencia Reactiva (PIv). Las expresiones que describen ambos índices aparecen en las ecuaciones (5.3.1) y (5.3.2) ([Sidhu and Cui, 2000]), ∑ Pl PIp = w ( )2pl (5.3.1) P α l,lim ∑ | Vi − V= i,lim |PIv wvi (5.3.2) Vi,lim β donde Pl es el ujo de potencia activa en la línea l, Pl,lim es el límite permitido para el ujo de la potencia activa en la línea l, wpl es el factor de ponderación de gravedad de una sobrecarga en la línea l, Vi es la magnitud de tensión en el bus i, Vi,lim es el límite permitido para la tensión en el bus i, wvi es el factor de ponderación de la gravedad de una sobretensión en el bus i, y α y β son los conjuntos conteniendo únicamente las líneas cuyo ujo de potencia activa es superior a su potencia límite y los buses cuya tensión es superior a su tensión límite, respectivamente. En adelante, los índices de prestación de una contingencia particular i se indicarán como PIp, i y PIv, i. Los patrones de entrada a las redes neuronales implementadas se obtienen a partir de un análisis en componentes principales (ACP) del conjunto de los ujos de potencia activa y reactiva de todas las líneas del sistema. El patrón de ujos de potencia utilizado consiste en los valores de potencia horarios de 41 días obtenidos a partir del caso base de cada una de las redes IEEE mediante el siguiente procedimiento: Cada carga horaria del caso base se multiplica por un coeciente variable entre0,5 y 1,8, lo que simula un patrón de carga próximo a la realidad (ver gura 5.1). Esta carga global se distribuye entre todos los buses de acuerdo con su capacidad de carga predenida. 125 Análisis de seguridad 3.5 3 2.5 2 1.5 1 0.5 0 100 200 300 400 500 600 700 800 900 1000 Figura 5.1: Coecientes aplicados al patrón base de cada red para obtener patrones con diferentes cargas del sistema Cada carga de bus se somete a un ruido normalmente distribuido de media 0 y desviación típica 2%. Finalmente, a partir del patrón de cargas de buses, se lleva a cabo la solución del problema de ujo carga obteniendo el patrón denitivo de ujos de potencia activa y reactiva. 5.3.1. Selección de características Uno de los inconvenientes del análisis de contingencias para redes eléctricas medianas o grandes es la gran cantidad de variables que deben ser analizadas para decidir sobre el estado seguro o inseguro de una contingencia particular. Para resolver este problema se utilizan técnicas conocidas como de selección o extracción de características (feature selection en inglés), cuyo objetivo es encontrar un nuevo conjunto de variables de entrada menor que el original (gura 5.2). Existen varias técnicas de extracción de características aplicadas especialmente al análisis de contingencias, entre las que cabe destacar las descritas en [Luan et al., 2000], [Mazon et al., 2001], [Fidalgo and Lopes, 2001] y [Jensen et al., 2001]. 126 5.3 Generación de patrones e índices de prestación Entradas Reales Entradas Preproc esadas x1 x y2 1 x Análisis de y3 2 ... Componentes y3 Principales ... ym x n >> mn Figura 5.2: Representación esquemática de la selección de características mediante Análisis por Componentes Principales para RNAs.. En este trabajo se ha empleado la técnica denominada Análisis por Componentes Prin- cipales ([Jollife, 1986], [Jackson, 1991]), que se describe brevemente en esta sección. El coeciente de correlación lineal, o la medida asociada denominada covarianza, con- stituye la base del análisis por componentes principales. Considerando todas las covarianzas de todas las parejas de variables de entrada y sus valores, es posible denir un nuevo con- junto de variables de entrada denominadas componentes principales. El objetivo nal del análisis de componentes principales es transformar un espacio de representaciónP en un nuevo espacio P ′ en el que los datos estén incorrelados, es decir, busca encontrar un nuevo conjunto de ejes ortogonales en el que la varianza de los datos sea máxima, de forma que la dimensionalidad del problema se reduzca. Esta transformación se puede expresar mediante una función g tal que verique la ecuación (5.3.3): Y = g(X) (5.3.3) donde X representa el espacio de patrones original, e Y el conjunto de patrones derivados o características. En la práctica, la transformación que se realiza es lineal, por lo que la transformación dada por la ecuación (5.3.3) puede expresarse como en la ecuación (5.3.4): Y = GX (5.3.4) donde G es una matriz de coecientes de transformación. El objetivo de esta transformación es la obtención de nuevos atributos con algún signicado, siendo éste el que determina el método para la obtención de la matriz G. Adicionalmente, algunas de las nuevas variables podrán eliminarse de forma directa. El primer componente principal es la variable que ex- plica la mayor heterogeneidad entre los patrones (es decir, la que tiene mayor varianza). 127 Análisis de seguridad El segundo componente principal es la variable que es más heterogénea después del primer componente y que no está correlacionada con él. El tercer componente principal no está correlacionado ni con el primero ni con el segundo, y tiene la tercera varianza mayor, y así sucesivamente. Existen dos casos límites poco probables en situaciones reales. El primero es que los datos originales no estén correlacionados, en cuyo caso habrá tantas componentes principales como componentes originales. La segunda situación se tiene cuando la redun- dancia entre las variables de entrada es total, existiendo en este caso un único componente principal. La ordenación de los componentes principales en función de la varianza tiene ventajas evidentes a la hora de seleccionar una dimensionalidad particular para los patrones trans- formados. La obtención de la matriz de transformación puede formularse como un problema de maximización de la varianza en el espacioP ′ con la restricción de mantener la ortogonalidad de G. Una técnica adecuada es la utilización de los multiplicadores de Lagrange. En resumen, el uso de componentes principales para transformar el conjunto original de patrones se justica por dos razones. En primer lugar, el análisis puede resaltar ciertos aspectos o propiedades sobre los datos que no era posible distinguir en los datos originales. En segundo lugar, puede reducir la información original en un conjunto más reducido de variables. Para el caso particular del análisis de contingencias, la reducción de la dimensión del espacio de entrada es evidente a partir de los datos mostrados en la tabla 5.1. Según esta tabla, tomando una transformación de vectores de 6 componentes obtenidos mediante un análisis por componentes principales de un conjunto original de 20 componentes, es posible explicar el 99,9% de la variabilidad de los mismos. En el caso de la red IEEE-118, el mismo porcentaje se consigue tomando las 18 componentes principales. 128 5.4 Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado Tabla 5.1: Porcentaje total de explicación de la variación del conjunto de patrones originales de la red IEEE-14, tomando diferentes componentes principales Número de Componentes Porcentaje de Variación explicado 3 90 4 92 5 93 6 99,9 8 99,95 9 99,98 12 99,99 5.4. Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado El enfoque funcional del análisis de contingencias consiste en obtener una evaluación numérica de la peligrosidad de cada contingencia particular. Esto permite la posterior orde- nación de contingencias en función de dicho valor de peligrosidad. Esta ordenación oranking permite al sistema estar preparado para hacer frente a las averías más peligrosas. Normal- mente, esta evaluación numérica se obtiene a partir del cálculo de un índice de prestación predenido. Las redes neuronales articiales de topología alimentada hacia delante y aprendizaje supervisado, tales como el Perceptrón Multicapa conBackpropagation o las redes de Fun- ciones Base Radiales se caracterizan por su capacidad para aproximar funciones no lineales, a partir de un proceso de aprendizaje que puede ser relativamente largo, pero con respuesta en tiempo real en su modo de operación. En este trabajo, se aplican los dos paradigmas mencionados al cálculo de los índices PIp, i y PIv, i para cada una de las contingencias simples de la red IEEE-14. Por otra parte, el uso directo de patrones de entrada formados por todos los ujos de potencia del sistema produce una alta dimensionalidad del espacio de entrada, lo que di- culta la convergencia del proceso de aprendizaje. Esta limitación se resuelve en nuestro caso, mediante la formación de un reducido número de variables de entrada a partir del análisis de 129 Análisis de seguridad componentes principales descrito anteriormente. En denitiva, para el análisis de contingen- cias de la red estándar IEEE-14, descrito a continuación, han sido implementadas 20 redes neuronales de cada paradigma, habiéndose reducido el patrón original de 40 componentes de ujo a uno de seis componentes. En las siguientes subsecciones se muestran los resultados de simulación obtenidos para el cálculo de cadaPIp,i mediante redes Perceptrón Multicapa y Funciones Base Radiales (RBF). 5.4.1. Evaluación numérica de contingencias con Perceptrón Multicapa y Backpropagation Se ha implementado una red Perceptrón Multicapa para el cálculo de cada uno de los índices de prestaciónPIp,i de la red IEEE-14. La estructura de las redes es la siguiente: capa de entrada de seis neuronas, cada una de ellas correspondiendo a una de las componentes principales obtenidas; capa intermedia de veinte neuronas con función de activación tangente hiperbólica; capa de salida con una neurona con función de activación lineal, correspondiente a un PIp, i particular. El conjunto de patrones generado ha sido dividido en un conjunto de entrenamiento (900 patrones) y un conjunto de prueba (100). El algoritmo de aprendizaje ha sido el de Levenberg-Marquardt [Hagan and Menhaj, 1994] y la estrategia de aprendizaje usada ha sido la conocida como validación cruzada ([Tibshirani, 1996]) (del ingléscross- validation). Los mejores resultados han sido obtenidos para un proceso de treinta épocas de entrenamiento. La tabla 5.2 muestra los errores relativos medios (en tanto por ciento) para las fases de entrenamiento y prueba para las contingencias conPIp, i mayor que cero para algún patrón de entrada. Aunque los errores de prueba para las contingencias 2 y 8 son mayores en media al 5%, hay que hacer notar que esto se debe a la pequeña cantidad de patrones que producen, para estas contingencias, un valor delPI mayor que cero. Para otras contingencias con un número mayor de patrones con valores altos de suPI los resultados presentan valores mucho más bajos del error. La gura 5.3 muestra de manera gráca los valores real y calculado del PIp,i para el conjunto de patrones de prueba (la contingencia 1 corresponde a un fallo en la línea que une los buses 1 y 2 de la red). La tabla 5.3 muestra la ordenación de contingencias realizada por el sistema neuronal junto con la ordenación real para los patrones de prueba. Es necesario hacer notar que las 39 contingencias que se muestran en esta tabla corresponden a diferentes contingencias 130 5.4 Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado SSE= 3.265419, ERM= 0.021971 4 3.5 Real Obtenido 3 2.5 2 1.5 1 0.5 0 -0.5 0 10 20 30 40 50 60 70 80 90 100 Patrón Figura 5.3: Representación gráca de los valores real y calculado del índice de prestación PIp, 1 para el conjunto de los patrones de prueba. 131 Objetivo -Prueba- Análisis de seguridad Tabla 5.2: Errores relativos medios en tanto por ciento (MAPE) para los índices de prestación de las contingencias problemáticas de la red estándar IEEE-14. Contingencia MAPE(%) - Entrenamiento MAPE(%) - Prueba 1 0.6226 1.21 2 0.1519 5.041 8 0.03 6.18 10 2.53 2.05 13 0.18 0.28 16 0.56 0.17 para varios estados diferentes de la red eléctrica. Con este experimento queremos probar la habilidad del sistema neuronal para mantener el orden de cualquier contingencia para cualquier rango de valores de los índices de prestación. Obviamente, en una situación real donde sólo es necesario ordenar las contingencias del estado actual de la red, el porcentaje de contingencias correctamente ordenadas es mucho mayor. Del análisis de la tabla 5.3 se puede concluir que las contingencias más peligrosas han sido clasicadas correctamente: el orden de las 3 primeras se mantiene y las 7 primeras, con algún pequeño error, también. Los resultados peores se presentan en la clasicación de los patrones con órdenes 20, 29, 37 y 38, que producen unos resultados totalmente erróneos. 5.4.2. Evaluación numérica de contingencias con redes de funciones base radiales Las redes de Funciones Base Radiales son ampliamente referenciadas en aplicaciones de aproximación de funciones, especialmente por su capacidad de aprendizaje local. En estas redes, cada intervalo de la función se aproxima por un conjunto limitado de neuronas especializadas, lo que, al menos teóricamente, permite un mejor ajuste de la función. Por otra parte, una vez resuelto el problema de la distribución de neuronas en el espacio de denición de la función, el cálculo del conjunto óptimo de pesos de la red se realiza de forma rápida mediante la resolución de un sistema de ecuaciones lineal. Esta última característica evita la existencia de un proceso de aprendizaje probabilístico que, además de ser largo en el tiempo, puede no llegar a la solución óptima. En este apartado, se reproduce la aplicación de este tipo de redes para la aproximación de los Índices de Prestación. Como caso de estudio, se calcula el Índice de Prestación PIp, i de cada posible contingencia de la red IEEE-14. 132 5.4 Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado Tabla 5.3: Ordenación de las contingencias según el valor de su índice de prestación. Las columnas con título OR representan la ordenación real de la contingencia, OO la orde- nación obtenida por las redes MLP, OR-OO la diferencia (en número de posiciones) entre la ordenación real y obtenida, PIR representa el índice de prestación real, PIO el índice de prestación obtenido. La última columna (PIR - PIO) muestra la diferencia entre los índices de prestación real y obtenido para cada contingencia. Las contingencias mostradas corresponden a diferentes estados de la red eléctrica. OR OO OR - OO PIR PIO PIR - PIO 1 1 0 11.3518 11.2070 0.1448 2 2 0 10.9391 10.9489 -0.0098 3 3 0 10.6498 10.7936 -0.1438 4 6 -2 10.6238 10.5003 0.1236 5 4 1 10.5042 10.5862 -0.0820 6 7 -1 10.4816 10.4827 -0.0011 7 5 2 10.4726 10.5386 -0.0660 8 9 -1 5.4933 5.4461 0.0472 9 10 -1 5.3665 5.3994 -0.0329 10 11 -1 4.9147 4.9165 -0.0018 11 12 -1 4.7929 4.7777 0.0151 12 13 -1 4.7443 4.7585 -0.0141 13 15 -2 4.7190 4.7091 0.0099 14 14 0 4.7046 4.7392 -0.0346 15 16 -1 3.1873 3.1977 -0.0103 16 20 -4 2.3398 2.3133 0.0265 17 19 -2 2.3306 2.3214 0.0091 18 39 -21 2.2186 -1.7914 4.0100 19 21 -2 2.1799 2.1966 -0.0167 20 38 -18 2.1018 0.0745 2.0274 21 22 -1 2.0735 2.0655 0.0080 22 23 -1 2.0438 2.0509 -0.0071 23 24 -1 1.9861 2.0080 -0.0219 24 18 6 1.9734 2.7148 -0.7415 25 26 -1 1.9297 1.8588 0.0709 26 25 1 1.9244 1.9113 0.0131 27 27 0 1.2476 1.2499 -0.0023 28 31 -3 1.1315 1.1014 0.0301 29 37 -8 1.1227 0.3031 0.8197 30 28 2 1.1157 1.1151 0.0006 31 29 2 1.1134 1.1138 -0.0004 32 30 2 1.1024 1.1030 -0.0006 33 32 1 1.1003 1.1006 -0.0002 34 33 1 1.0844 1.0899 -0.0055 35 34 1 1.0683 1.0671 0.0012 36 35 1 1.0485 1.0484 0.0001 37 17 20 1.0318 3.0806 -2.0488 38 8 30 1.0171 6.8917 -5.8747 39 36 3 1.0147 0.5912 0.4235 Del mismo modo que el caso de la aplicación del MLP, se ha utilizado una red neuronal para cada contingencia. Cada una de estas redes cuenta con seis entradas (correspondientes a las seis componentes principales ) y una salida (el valor delPIp, i correspondiente a la contingencia en cuestión). El número de neuronas intermedias, cuyas funciones de activación son las funciones radiales, varía entre 68 y 215 dependiendo de la contingencia tratada. Este número de neuronas intermedias y su distribución en el espacio de entrada han sido calculados a partir del algoritmo de entrenamiento de Mínimos Cuadrados Ortogonales para Redes de Funciones Base Radiales ([Chen et al., 1991]). En este algoritmo, los centros donde se ubican las neuronas se estiman mediante un problema de regresión utilizando mínimos 133 Análisis de seguridad cuadrados ortogonales. En cada paso del algoritmo, se selecciona un subconjunto de centros para las neuronas de entre todos los posibles, de forma que se maximice la varianza de la salida deseada. Este algoritmo presenta dos grandes ventajas frente a otros disponibles para las redes de funciones base radiales: aporta un método sistemático y eciente para determinar los centros de las neuronas de la red; y elimina los problemas relacionados con la creación de muchas neuronas innecesarias y de condicionamiento numérico deciente de los métodos basados en la selección aleatoria de centros. Otro parámetro importante en el diseño de la red es el denominadospread, que deter- mina, para cada neurona de base radial, qué distancia debe tener un vector de entrada a su centro para que ésta produzca una salida de 0,5. Un valor alto de este parámetro hace que exista un área relativamente grande alrededor del vector de entrada donde la neurona responde con valores cercanos a uno. Esto permite que varias neuronas puedan responder con salidas mayores que cero a un mismo vector de entrada. Por el contrario, un valor muy pequeño del parámetro spread hace que ante un vector de entrada particular sólo una neu- rona responda con una salida mayor que cero. Aunque existen varios métodos heurísticos que tratan de buscar un valor adecuado para este parámetro, son en general muy dependi- entes de la función que se está aproximando. En este trabajo, se ha buscado un valor óptimo realizando un estudio estadístico de los resultados para diversos valores del parámetro. El valor más pequeño considerado viene dado por la expresión|mean(d)− 2std(d)| y el mayor valor es |mean(d) + 2std(d)|, donde mean(d) es el valor medio de las distancias entre cada dos vectores de entrada y std(d) la desviación típica. Este proceso lleva a un valor óptimo del parámetro para cada contingencia analizada. Sin embargo, se ha podido comprobar que estos valores son muy similares para las diversas contingencias analizadas, por lo que en el diseño del sistema no es necesario realizar el estudio por cada contingencia. La tabla 5.4 muestra los errores relativos medios (en tanto por ciento) para las fases de entrenamiento y prueba para las contingencias con PIp, i mayor que cero para algún patrón de entrada. La gura 5.4 muestra de manera gráca los valores real y calculado para el PIp, 1 (contingencia 13 correspondiente a un fallo en la línea que une los buses 6 y 13). La tabla 5.5 muestra la ordenación de contingencias realizada por el sistema neuronal junto con la ordenación real para los patrones de prueba. Al igual que en la tabla 5.3, las contingencias que se muestran corresponden a diferentes contingencias para varios estados 134 5.4 Evaluación numérica y ordenación de contingencias con redes neuronales alimentadas hacia delante y aprendizaje supervisado SPREAD= 3.500000e+000, SSE= 2.886488, ERM= 0.040451, GOAL= 20.000000 5 Real Obtenido 4 3 2 1 0 -1 0 10 20 30 40 50 60 70 80 90 100 Patrón Figura 5.4: Representación gráca de los valores real y calculado del índice de prestación PIp, 1 para el conjunto de los patrones de prueba. 135 Objetivo -Prueba- Análisis de seguridad Tabla 5.4: Errores relativos medios en tanto por ciento (MAPE) para los índices de prestación de las contingencias problemáticas de la red estándar IEEE-14. Contingencia MAPE(%) - Entrenamiento MAPE(%) - Prueba 1 3.6 4.2 2 3.4 5.7 8 1.2 8 10 1.8 10 13 3.9 4.0 16 2.6 3.2 diferentes de la red eléctrica Como muestra la tabla 5.5, las primeras 9 contingencias han sido ordenadas perfecta- mente. Excepto para las contingencias con posiciones reales 27, 30, 33, 34 y 37, la clasicación es casi perfecta, obteniendo una clasicación que sólo desplaza el orden de la contingencia en una o dos posiciones. El resultado de la ordenación de la tabla 5.3 es peor que la ordenación de la tabla 5.5. Aunque los resultados en cuanto a errores relativos del MLP son mejores que el caso de las redes RBF, la ordenación es más able en el caso de las redes de funciones base radi- ales. La justicación de este resultado aparentemente contradictorio se debe a que las redes de funciones base radiales implementadas tienen mayor dicultad en aproximar la función correspondiente a los P.I. cuando éstos tienen un valor cero o próximo a cero (contingencia nada o poco peligrosa), lo que empeora los resultados globales sobre el conjunto de patrones de prueba. Sin embargo, la aproximación funcional de las RBF es mejor cuando los valores a predecir son mucho mayores que cero. 5.5. Visualización de contingencias con mapas Auto-Organizativos de Kohonen Los Mapas Auto-Organizativos de Kohonen se caracterizan por su capacidad para clasi- car un conjunto complejo de patrones de manera no supervisada, extrayendo criterios de clasicación no obvios ni expresados de manera explícita. Esta clasicación se lleva a cabo mediante la distribución de un espacio de entrada VI de alta dimensión en un espacio de salida VO de menor dimensión, preservándose las relaciones topológicas existentes entre los 136 5.5 Visualización de contingencias con mapas Auto-Organizativos de Kohonen Tabla 5.5: Ordenación de las contingencias según el valor de su índice de prestación. Las columnas con título OR representan la ordenación real de la contingencia, OO la orde- nación obtenida por las redes RBF, OR-OO la diferencia (en número de posiciones) entre la ordenación real y obtenida, PIR representa el índice de prestación real, PIO el índice de prestación obtenido y la última columna la diferencia entre estos dos últimos índices. OR OO OR - OO PIR PIO PIR - PI 1 1 0 11.9711 11.6672 0.3039 2 2 0 11.5060 11.5566 -0.0505 3 3 0 11.3253 11.4034 -0.0782 4 4 0 11.0233 11.1157 -0.0924 5 5 0 10.9274 11.0231 -0.0957 6 6 0 10.8771 10.9453 -0.0682 7 7 0 10.7677 10.8477 -0.0799 8 8 0 5.6128 5.3694 0.2433 9 9 0 5.2736 5.2871 -0.0135 10 11 -1 5.2355 5.2264 -0.0011 11 10 1 5.2292 5.2366 0.0028 12 13 -1 5.0543 5.0638 -0.0676 13 12 1 5.0513 5.1219 -0.0125 14 14 0 4.9673 4.9780 -0.0107 15 15 0 3.3668 3.6850 -0.3182 16 16 0 3.3159 2.9007 0.4152 17 18 -1 3.2500 2.7756 0.5163 18 19 -1 3.1887 2.7337 0.3684 19 17 2 3.1613 2.8203 0.3856 20 20 0 3.1045 2.4106 0.6939 21 21 0 2.2791 2.2456 0.0334 22 24 -2 2.2318 1.8301 0.5396 23 23 0 2.1897 1.8385 0.3512 24 25 -1 2.1553 1.6922 0.4681 25 26 -1 2.1539 1.6872 0.4818 26 27 -1 2.1279 1.6721 -0.0846 27 22 5 2.1165 2.2125 0.2864 28 29 -1 1.2476 1.5355 -0.0203 29 31 -2 1.2183 1.2679 0.2545 30 37 -7 1.1420 0.6053 0.1275 31 34 -3 1.1368 0.9638 -0.4446 32 33 -1 1.1352 1.0109 -0.1646 33 30 3 1.1244 1.2998 0.5191 34 28 6 1.1237 1.5814 -0.4118 35 35 0 1.0864 0.8415 0.2449 36 38 -2 1.0553 0.0446 0.2186 37 32 5 1.0394 1.0145 0.0285 38 36 2 1.0318 0.8367 0.9872 39 39 0 1.0043 0.0318 0.9725 patrones de entrada. El espacio de salida viene constituido por un conjunto de neuronas ordenadas en un plano o una línea, en el cual se dene una función de vecindad. Tras el pro- ceso de aprendizaje, un vector de entrada x = (x1, ..., xn) activará la neurona i del espacio de salida cuyo vector de pesoswi = (wi1, ..., win) tenga menor distancia al vector x. De esta manera, el vector wi podrá ser considerado como el prototipo de la región del espacio de entrada cuyos vectores activan a la neurona i. Finalmente, dos vectores de entrada similares según la relación denida en VI , activarán la misma neurona o dos neuronas cercanas en el espacio de salida (gura 5.5). Las características brevemente descritas de los Mapas Auto-Organizativos resultan en principio prometedoras para la implementación de un sistema de monitorización visual de 137 Análisis de seguridad        =              =     Figura 5.5: Representación esquemática de la distribución de un espacio n-dimensional de entrada en un espacio bidimensional mediante un Mapa Auto-Organizativo de Kohonen. contingencias, ya que en este entorno, es a veces más interesante y práctico poder visualizar de manera directa la posición relativa en cuanto a peligrosidad del estado actual en un ranking de contingencias que conocer el valor exacto del Índice de Prestación que dene esa peligrosidad. Para analizar de manera experimental esta posibilidad, en primer lugar se ha desarrollado una SOM bidimensional destinada a la visualización de contingencias, y se ha probado con la red IEEE-14 [García-Lagos et al., 2001]. A partir del análisis de esta aplicación dedujimos que el uso de redes SOM lineales parecía especialmente indicado en este contexto, por lo que, en segundo lugar, se ha desarrollado una SOM lineal que ha sido probada con la red IEEE-118. A continuación se describen de manera detallada ambas implementaciones, discutiendo sus prestaciones y ventajas. 5.5.1. SOM bidimensional para la visualización de contingencias En este apartado se analiza la aplicación de una SOM bidimensional de 10x10 neuronas a la clasicación de los patrones generados previamente para la IEEE-14. Estos patrones están compuestos por los Flujos de Potencia Activa de cada línea de la red. De manera similar, se ha repetido el estudio usando como patrones los Flujos de Potencia Reactiva, aunque no se reproducen aquí por presentar análogos resultados. El algoritmo de adaptación de pesos 138 5.5 Visualización de contingencias con mapas Auto-Organizativos de Kohonen para la SOM ha sido el indicado por la ecuación (5.5.1): w~ i(t + 1) = w~ i(t) + lrhiv(~x− w~ i(t)) (5.5.1) donde ~x es un vector de entrada,w~ i es el vector de pesos de la neurona i, y hiv(), la función de vecindad, determina el incremento del peso de cada neurona como una función de su proximidad a la neurona ganadora para el patrón ~x. En nuestro caso, el área de vecindad viene dada por un cuadrado centrado en la neurona ganadora, cuyo lado decrece hasta cero a lo largo del entrenamiento. lr es la razón dinámica de aprendizaje, la cual evoluciona a lo largo del proceso de entrenamiento según la ecuación (5.5.2): l ( r0lr t) = c·t (5.5.2)(1 + nn) siendo lr0 la razón de aprendizaje inicial (0.3, en nuestro caso), c una constante (0.2), t la iteración actual y nn el número de neuronas de la red [Cottrell and Letremey, 1995] [Haykin, 1994]. Para cada contingencia, el conjunto de patrones de ujos de potencia activa disponible se ha dividido previamente según el valor real de suPIp,i. De esta manera, se han estable- cido siete intervalos de peligrosidad, asociándose cada uno de ellos a un símbolo para su visualización en el mapa: punto, que representa unPIp,i de valor cero, círculo, signo más, cuadrado, triángulo invertido, rombo, pentágono y hexágono, respectivamente, estados con un PIp,i en (0,1.5], (1.5, 3], (3, 4.6], (4.6, 6.1], (6.1, 7.6], (7.6, 9], y (9, inf). El proceso de entrenamiento se ha realizado para una única SOM a partir de los patrones de entrenamiento de ujos de potencia activa disponibles. La obtención de cada gura se realiza mediante el procedimiento siguiente: 1. Se entrena una única red neuronal. Es necesario advertir de que al tratarse de un entrenamiento no supervisado, este proceso realiza exclusivamente una distribución de los patrones de entrada, sin relación en principio con ninguna contingencia particular. 2. Para cada contingencia considerada en el análisis se crea una copia idéntica de la red entrenada, que será utilizada de forma exclusiva para esa contingencia. Se dispone, por tanto, de N redes idénticas, donde N es el número de contingencias que se desean considerar. 139 Análisis de seguridad Figura 5.6: Representación de la clasicación de los patrones obtenida por la red de Kohonen para la contingencia 1. Los símbolos de la gura se han seleccionado en función del índice de prestación de cada patrón. Cada subgráco o rectángulo representa una neurona del mapa. El rectángulo de la esquina superior izquierda es la neurona 1, el rectángulo de la esquina superior derecha es la neurona 10 y el rectángulo de la esquina inferior derecha corresponde a la neurona 100. Los huecos de la gura representan neuronas a la que no pertenece ningún patrón. El mapa de Kohonen representado es de dimensión 10x10. 3. Los patrones de entrada a todas las redes son los mismos. Cada patrón (ujos de potencia activa) representa el estado de la red para la topología base y un nivel de carga determinado antes de la ocurrencia de cualquier contingencia. 4. Para cada patrón se dispone del valorPIp,i para cada contingencia. 5. Para el SOM de una contingencia particular i: a) Se presenta el patrón j-ésimo a la red y se obtiene la neurona ganadoragj . b) En el rectángulo gj , correspondiente a la neurona gj ganadora, se representa un punto con un atributo obtenido en función del valor dePIp,i . La respuesta de la SOM es distinta para cada contingencia analizada, produciendo para cada una de ellas una distribución particular de las zonas asociadas a cada nivel de 140 5.5 Visualización de contingencias con mapas Auto-Organizativos de Kohonen Figura 5.7: Representación de la clasicación de los patrones obtenida por la red de Kohonen para la contingencia 13. peligrosidad. Los resultados de simulación muestran claramente que la organización nal de la red incorpora el criterio del nivel de peligrosidad de cada contingencia. Como puede apreciarse en las guras 5.6 y 5.7, que representan la distribución de patrones para las contingencias 1 y 13, respectivamente, las clases se ordenan de manera continua en orden creciente de su PIp,i. Los resultados obtenidos muestran la alta aplicabilidad del paradigma en dos impor- tantes operaciones relacionadas con el análisis de contingencias: En primer lugar, la presentación del estado actual del sistema al mapa asociado a cada contingencia permitirá la rápida visualización del nivel de seguridad de ese estado actual. En este sentido, la gura 5.8, muestra la distribución en el mapa elaborado para la contingencia 10. Los patrones señalados corresponden a estados no utilizados en el entrenamiento y su PI puede verse en la tabla 5.6. En la gura 5.8 se ha representado con un círculo negro la neurona que cada patrón ha activado. Junto al círculo aparece el número del patrón que ha activado esa neurona (ver tabla 5.6). Los patrones 1, 7, 8, 9 y 10, que tienen todos un PIp,10 cero, activan neuronas cuyo atributo es un punto, indicando que presentan estados 141 Análisis de seguridad que ante la ocurrencia de la contingencia 10 no suponen peligro. Los patrones 2, 3 y 4 han activado las neuronas 3 y 14, correspondiente a una zona marcada para patrones que tienen un PI en el intervalo (0, 1.5], etc. Como puede comprobarse, todos los patrones se han clasicado correctamente (es decir, han activado una neurona marcada con el símbolo correspondiente al intervalo al que pertenece su PI). En algunos casos, las neuronas activadas tienen atributos pertenecientes a dos intervalos diferentes (patrones 12 y 14), pero estas neuronas se encuentran siempre en la frontera entre zonas del mapa correspondiente a los dos intervalos. En segundo lugar, los mapas obtenidos pueden ser utilizados como herramientas para el seguimiento de la evolución del sistema hacia estados de mayor o menor peligrosidad y a la predicción de esta evolución respecto a cada contingencia. En este sentido, la gura 5.8 también muestra la evolución del estado del sistema para un segmento particular del conjunto de patrones de prueba utilizados. La gura 5.9 muestra los valores PI para la contingencia 10, y la secuencia de 16 puntos correspondientes a los estados que han activado las neuronas de la gura 5.8. Se aprecia claramente que la evolución del sistema hacia estados de mayor peligrosidad va aparejada a la evolución del mapa hacia regiones ascendentes a lo largo de la diagonal secundaria, es decir hacia regiones asociadas a una mayor peligrosidad de la contingencia analizada. Justamente esta ordenación de las diferentes clases o regiones a lo largo de una diagonal de la SOM nos lleva a plantear la hipótesis de que la relación entre patrones puede ser proyectada sobre un mapa lineal de Kohonen. Esta posibilidad proporcionaría una mayor claridad a la monitorización de contingencias descrita anteriormente, ya que a un operador le resultará más fácil comparar posiciones activadas en líneas que en planos, y podrán ser monitorizadas a la vez muchas más contingencias, ya que obviamente, en una pantalla caben más líneas que planos. La comprobación de esta hipótesis se describe en la siguiente sección [García-Lagos et al., 2002]. 5.5.2. SOM lineal para la visualización de contingencias Una SOM lineal corresponde a un única la de neuronas. Cada neurona tiene únicamente dos vecinas directas. La función de vecindad viene dada, por un segmento centrado en la neurona, en vez de por un cuadrado. Los algoritmos de entrenamiento han sido adaptados, 142 5.5 Visualización de contingencias con mapas Auto-Organizativos de Kohonen 5 2 13 3,4 6 15 12 14 16 11 7 1 9 8 1,10 Figura 5.8: Mapa de Kohonen para la contingencia 10 y las neuronas activadas para patrones con diferentes PI no utilizados durante el entrenamiento. Tabla 5.6: Identicación de las neuronas activadas y el valor correspondiente PI correspon- dientes a la gura 5.8. Número Neurona Activada PI 1 91 0 2 3 1.2253 3 14 1.4415 4 14 1.3438 5 5 3.6199 6 15 2.4723 7 85 0 8 92 0 9 82 0 10 91 0 11 47 3.9644 12 29 8.9394 13 8 7.0063 14 30 9.7227 15 20 10.4199 16 35 2.6166 143 Análisis de seguridad 12 15 10 14 12 8 13 6 11 4 5 6 16 2 2 3 4 1 7 8 9 10 0 0 5 10 15 20 25 30 35 40 45 50 P a t r ó n Figura 5.9: Representación de los índices de prestación de la contingencia 10 para varios patrones. y se han utilizado SOM de 10 neuronas. Como caso de estudio para la visualización de contingencias mediante SOMs lineales hemos utilizado la red estándar IEEE-118. Los patrones, generados como se describe en la sección 5.3, han sido nuevamente sometidos a un análisis en componentes principales obteniendo en este caso 18 componentes con las que es posible explicar el 99.99% del la funcionalidad del sistema. Al igual que en los casos anteriores, el conjunto completo de patrones ha sido dividido en un conjunto de entrenamiento y otro de prueba. Las simulaciones muestran que en efecto, la ordenación de los patrones se realiza de manera ordenada a lo largo de cada línea variando desde estados con bajo PI a estados con muy alto PI. La gura 5.10 muestra la distribución obtenida para las contingencias 3, 4, 7, 8, 9, 11, 14, 17, 26 y 33. La gura 5.11 muestra la situación de peligrosidad de un determinado patrón de entrada con respecto a las contingencias 3, 4, 7, 8, 9, 11, 14, 17, 26 y 33. De esta gura puede deducirse que el patrón presentado representa un estado de peligrosidad alto para las contingencias 3 y 4, un nivel medio de peligrosidad para las contingencias 9, 14 y 33, un nivel bajo de peligrosidad para las contingencias 7, 11, 17 y 26, y no es peligroso para las contingencias 8 y 26. 144 Indice de Pres ta ción (PI) 5.5 Visualización de contingencias con mapas Auto-Organizativos de Kohonen Visualización de Múltiples Contingencias 03 . . . . . . . . . . - - - - - - - & & & & & & + + + + x x n 044 . . . . . . . . . . . . . . . . . - - - - & & + + + + x x n 077 . . . . . . . . . . . . . . . . . . . . - - - - - - - & & n 088 . . . . . . . . . . . . . . . . . . . . . . . . - - & & & n 099 . . . . . . . . . . . . . . . . - - - - & & & & & + + x x n 11 11 . . . . . . . . . . . . . . . . . . . . . . - - & & & & & n 11 44 . . . . . . . . . . . . . . . . - - - - & & & & + + x x * n 11 77 . . . . . . . . . . . . . . - - - - - - - - - & & & & & & n 22 66 . . . . . . . . . . . . . . . . . . . . . . . . . . . & & n 33 . . . . . . . . . . . - . . . . - & - - - & & & & & + + x n N eur onas Figura 5.10: Visualización de varios Mapas de Kohonen lineales en una misma gura. Se han representado 10 Mapas de Kohonen lineales de 1 x 30 neuronas cada uno. Cada la de la gura representa el Mapa de Kohonen visualizado para cada contingencia particular. Las contingencias visualizadas son la 3, 4, 7, 8, 9, 11, 14, 17, 26 y 33 de la red IEEE-118. Visualización Global de Contingencias 03 # 044 # 077 # 088 # 099 # 11 11 # 11 44 # 11 77 # 22 66 # 33 # Neurona Figura 5.11: Representación del nivel de peligrosidad que ha producido un determinado patrón presentado a la red de Kohonen Lineal. La neurona ganadora es la neurona 7, pero su nivel de peligrosidad es distinto para cada contingencia, como muestra el correspondiente atributo de la neurona 7 en cada la de la gura. 145 Número de la Contingencia Número de la Contingencia Análisis de seguridad 10 14 15 9 8 16 7 7 6 8 13 17 6 9 12 5 5 11 18 4 10 19 4 20 3 3 21 26 2 1 1 2 22 23 24 25 0 0 5 10 15 20 25 30 PP aa tt rr óó nn Figura 5.12: PI, para la contingencia 3, de 26 patrones no usados durante el entrenamiento del SOM. Visualización de la contingencia 3 01 022 * * 033 * 044 * 055 * 066 * 077 088 ** 099 * 10 * 11 * 122 * 133 * 144 * 155 * 166 * 177 * 188 * 199 * 22 0 * 22 1 * 22 22 * 22 33 * 22 44 * 22 55 * 22 66 * N eur ona Figura 5.13: Respuesta del SOM lineal de la contingencia 3 a cada uno de los patrones de la gura 5.12. 146 Patrón PPII 5.6 Conclusiones La aplicación del SOM a la monitorización on-line de la evolución del estado de la red se muestra en las guras 5.12 y 5.13. En la primera de ellas, se representan losPI de 26 patrones de entrada no utilizados en la fase de entrenamiento de la red. En la gura 5.13 se muestra la respuesta del SOM para la contingencia 3 a cada uno de estos patrones. La la i-ésima corresponde a la respuesta del SOM ante el patrón i. Como puede observarse, la red ha respondido ante cada patrón activando la neurona correcta según el valor delPI correspondiente, lo que prueba su utilidad como herramienta para la monitorización de la evolución del sistema ante contingencias. 5.6. Conclusiones Este capítulo ha estado dedicado al estudio de la aplicabilidad de distintos paradig- mas neuronales a la tarea de Análisis de Contingencias en un sistema de energía eléctrica. En este sentido, hemos estudiado dos aspectos del Análisis de Contingencias. Por un lado, aparece la tarea de evaluar numéricamente la gravedad de cada una de las contingencias que pueden generarse a partir del estado actual del sistema, lo que nos permitirá establecer una ordenación de contingencias en orden creciente de gravedad (Contingency Ranking). Por otro lado, aparece la tarea de monitorizar de forma visual y gráca la gravedad de dichas contingencias. Ambos aspectos presentan características que hacen en principio aconsejable el uso de determinados paradigmas neuronales en su solución. Así, en cuanto a la evaluación numérica, se trata de aproximar una función, el correspondiente Índice de Prestación, cuyo cálculo para cada estado de la red exige la utilización de métodos numéricos computacional- mente costosos y prohibitivos para operaciones en tiempo real. Sin embargo, para esta fun- ción, podemos obtener en modo simulación un amplio conjunto de patrones entrada-salida. En consecuencia, las redes neuronales alimentadas hacia adelante con aprendizaje super- visado, cuyo aprendizaje a partir de ese conjunto de patrones puede ser lento, pero cuyo funcionamiento en modo de operación es en tiempo real, parecen perfectamente recomend- ables. En cuanto a la monitorización visual, paradigmas como los Mapas Auto-Organizativos de Kohonen, por su capacidad para clasicar un conjunto de patrones complejos de acuer- do con criterios difícilmente explicitables por un operador, y de mostrar esa clasicación de manera gráca y visualmente interpretable parecen igualmente recomendables. Nosotros hemos puesto a prueba las hipótesis anteriores para los paradigmas Perceptrón Multicapa y 147 Análisis de seguridad Redes de Funciones Base Radiales en el caso de la evaluación numérica y para el paradigma SOM de Kohonen en el caso de la monitorización visual. En el primer caso, se han elegido como funciones para ser aproximadas los Índices de Prestación PIv y PIp de cada una de las posibles contingencias de la red estándar IEEE-14, generándose una red (MLP o RBF) para la evaluación de cada Índice de Prestación y cada contingencia. Los resultados experi- mentales muestran que las redes MLP constituyen una herramienta muy recomendable para la evaluación numérica de dichos Índices y para la obtención de la ordenación (ranking) de contingencias en tiempo real. Así, los resultados de los errores relativos para los patrones de prueba han sido muy aceptables, quedando comprendidos entre un mínimo de 0.17% para la contingencia 16 y un máximo de 6.18% para la contingencia 8. Esto se reeja en unranking en el que la mayoría de los patrones han sido ordenados correctamente. En el caso de las redes RBF se ha obtenido una menor capacidad de generalización. Así, los errores para los patrones de prueba presentan un mínimo de 3.2% para la contingencia 16 y un máximo de un 10% para la contingencia 8. Sin embargo, hay que hacer notar que el empeoramiento de los resultados con respecto a los producidos por el MLP se debe a errores en la aprox- imación de patrones que tienen un PI cero. Esto se traduce en un índice de error para el ranking menor que en el caso del MLP. Por otra parte, los resultados muestran una mayor dependencia respecto a la variabilidad en el número de neuronas ocultas de la red, lo que merma en gran parte su utilidad ya que no se conoce un método eciente que determine este número de forma exacta. En el segundo caso, en primer lugar, se ha estudiado la capacidad de una SOM bidi- mensional para la clasicación de los estados del sistema en función de su peligrosidad. Una única red SOM de 10x10 ha sido entrenada con los patrones de aprendizaje, proporcionando una distribución particular de los patrones en clases de distinto nivel de peligrosidad para cada contingencia. La característica principal de estas distribuciones es que las distintas clases aparecen siempre ordenadas de menor a mayor peligrosidad a lo largo de una diagonal del mapa. Desde un punto de vista práctico, este hecho no sólo facilita enormemente la visu- alización de la peligrosidad de una contingencia particular, sino que permite el seguimiento de la evolución del sistema y la predicción de su acercamiento o no a un estado de peligro. Desde un punto de vista organizativo, permite plantear la hipótesis de que la estructura ideal para la SOM en este caso es la lineal. La hipótesis ha sido conrmada utilizando como 148 5.6 Conclusiones caso de estudio la red estándar IEEE-118. Al igual que en el caso bidimensional, a partir del entrenamiento de una única SOM lineal se obtiene una distribución distinta de los niveles de peligrosidad a lo largo de la línea para cada contingencia, pero en todos los casos estos niveles mantienen el orden de peligrosidad creciente. El uso de SOM lineales añade, a las ventajas ya señaladas para las bidimensionales, la facilidad de presentar en una única pantalla un gran número de contingencias (una por línea) y la facilidad de comparar la peligrosidad de distintas contingencias cuando éstas se distribuyen en una línea y no en un plano. 149 Análisis de seguridad 150 Capítulo 6 Conclusiones y líneas futuras 6.1. Conclusiones En esta tesis doctoral se han estudiado varios paradigmas neuronales, tanto desde el punto de vista teórico como de su aplicación a la resolución de problemas reales complejos. Así, se han estudiado el Perceptrón Multicapa, las Redes de Funciones Base Radiales, los Mapas Auto-Organizativos de Kohonen, las redes recurrentes de Elman y el modelo neuronal de Hopeld. Cada uno de ellos ha sido aplicado a un problema complejo relacionado con tareas importantes en la Gestión de Sistemas de Energía Eléctrica (EMS). Cuando la solución obtenida con los paradigmas simples no ha aportado una solución aceptable, se han propuesto paradigmas complejos que sí aportan soluciones adecuadas. En todos los casos se ha hecho una revisión bibliográca para mostrar el estado del arte. A continuación enumeramos, agrupadas según la tarea particular dentro de la gestión de un EMS, la aportaciones principales de este trabajo. Predicción de la demanda de energía eléctrica Se ha propuesto un sistema neuronal complejo compuesto de dos etapas. En la primera etapa, mediante un mapa Auto-Organizativo de Kohonen, se realiza una clasicación de los perles de demanda diaria. Esta clasicación permite la agrupación de los mismos atendiendo a criterios de laboralidad, climáticos y sociales. El resultado de esta primera fase, que sólo debe realizarse una vez, es la división de la serie temporal en otras más regulares y, por tanto, más fácilmente predecibles. 151 Conclusiones y líneas futuras La segunda etapa consiste en la aproximación de la función de consumo futuro mediante redes neuronales recurrentes de Elman. Aunque se han realizado numerosas pruebas con otros modelos, los mejores resultados se han obtenido con este paradigma neuronal. Para cada clase obtenida en la primera etapa, se han construido dos redes recurrentes de Elman, una para la predicción del perl horario de carga para 24 horas, y otra para la predicción de la demanda de la hora h + 1. El perl de 24 horas permite conocer la demanda de energía eléctrica con un horizonte de 24 horas. La aportación del módulo de predicción de la hora h + 1 es la incorporación al modelo de las condiciones meteorológicas, económicas o sociales que tienen lugar dentro de las 24 horas del día, que pasarían desapercibidas en el predictor del perl, que utiliza como entradas los consumos del día anterior de la misma clase del que se quiere predecir. En ambos casos, las entradas de las redes neuronales son los consumos horarios consolidados y una predicción de la demanda integrada, eliminándose la inuencia de errores acumulados en los datos de carga horaria. En todos los casos se ha propuesto un proceso de reentrenamiento periódico (on-line) que hace que la inuencia de la no-estacionaridad de la curva de demanda sea menor que en el caso de realizar la predicción con paquetes estadísticos, menos exibles y con un tiempo mucho mayor de adaptación al entorno particular. La elección del paradigma de Elman para la aproximación de la función de consumo ha simplicado el proceso de construcción de las redes neuronales, ya que el número de neuronas ocultas y el número de pesos tienen menor inuencia en el proceso de entrenamiento que el caso de las redes MLP o RBF, con la ventaja de poder utilizar los algoritmos desarrollado para el MLP. Estimación de estado El problema de la estimación de estado clásica de un sistema de energía eléctrica ha sido analizado desde el punto de vista de la solución que aporta una red neuronal de Hopeld. Se han presentado los parámetros de la red para que ésta resuelva un problema particular. Se han estudiado las dinámicas de activación de neuronas que aportan una solución más eciente, y se ha propuesto un valor óptimo para la función de transferencia de cada neurona. Los resultados obtenidos muestran que la precisión que aporta frente a un estimador clásico WLS es competitiva, encontrando en muchos casos un valor del residuo nal (función 152 6.1 Conclusiones a minimizar) más pequeño que el obtenido por el estimador WLS. Debido a que las matrices a partir de las que se determinan los pesos de la red son altamente dispersas, la matriz de pesos de la red también lo es. Para aprovechar esta situación se ha diseñado una estructura de datos especial para la simulación de la red neuronal que optimiza el proceso de evolución natural de la red, lo que ha reducido considerablemente los tiempos de cómputo requeridos para que la red se estabilice en el mínimo de su función de energía. Sin embargo, aun con estas optimizaciones, los tiempos de cómputo requeridos para obtener estos resultados son mucho mayores que los requeridos por un estimador clásico. Con estas características de la solución del problema de estimación de estado con redes de Hopeld, es necesario concluir que el paradigma de Hopeld no aporta ninguna ventaja frente a los métodos clásicos, bien establecidos, robustos y ecientemente implementados. Estimación de topología Para la tarea de estimación de topología se han propuesto dos soluciones diferentes, ambas basadas en la utilización directa de las medidas disponibles desde SCADA y, cuando es necesario, en la creación de pseudomedidas o en la utilización de estimaciones producidas por un estimador de estado. Las dos soluciones han supuesto la utilización de dos estructuras neuronales complejas. Las dos soluciones tienen en común que las medidas o pseudomedidas disponibles para realizar la estimación de topología son preprocesadas por una capa de neuronas base radiales. Esta etapa de preproceso lleva a cabo un ltrado que produce, para cada conjunto de medidas reales, un vector que forma agrupaciones, en el sentido de que todas las medidas de una topología dada producen patrones no exactamente iguales pero sí muy similares. La primera solución se completa con un MLP por cada bus de la red, que generará una propuesta topológica local. Cada MLP es entrenado de forma supervisada para generar las topologías que han producido los correspondientes patrones preprocesados. La segunda solución reemplaza el MLP por una red de una sola capa de neuronas con función de transferencia Gaussiana con distancia de Mahalanobis, una por cada topología posible de un bus de la red. Cada una de estas neuronas recibe como entradas el vector preprocesado, y genera una salida que indica el grado de pertenencia del vector preprocesado a una topología particular. La topología correcta es tomada como la correspondiente a la 153 Conclusiones y líneas futuras neurona cuyo valor de salida es mayor. La segunda solución aporta varias ventajas sobre la primera. En primer lugar, elimina la necesidad de realizar un proceso de entrenamiento supervisado, que en el caso del MLP requiere de un gran número de patrones por cada bus de la red y que, por tanto, es lento. En segundo lugar, la utilización de la distancia de Mahalanobis permite utilizar el estimador topológico aún en el caso de que una medida del bus no esté disponible. En ambos casos, el proceso de estimación topológica se realiza de forma local para cada bus, lo cual implica que la complejidad computacional del método crece sólo de forma lineal con el número de buses de la red. Análisis de Seguridad Se ha estudiado la aplicabilidad de varios paradigmas neuronales a la tarea del análisis de contingencias, abordando el problema tanto desde el punto de vista de la ordenación de las mismas en función de su gravedad, como desde el punto de vista de su monitorización de forma visual y gráca. Para el caso de la ordenación de contingencias, se han utilizado los paradigmas neu- ronales con entrenamiento supervisado MLP y RBF. Ambos paradigmas, en su fase de op- eración, funcionan en tiempo real, lo que los hace válidos para ser utilizados como alternativa a otros métodos clásicos con costes computacionales mucho mayores. Los resultados com- parativos de estas dos redes muestran un porcentaje mayor en los errores relativos medios y un porcentaje mayor en la correcta ordenación nal de contingencias para el caso de la red RBF. Esta aparente contradicción puede explicarse debido a que la red RBF produce errores mayores que la red MLP para patrones con un índice de prestación igual a cero. Sin embargo, los errores en estos patrones, que representan estados no peligrosos, no afectan a la ordenación nal. En la monitorización visual de contingencias se ha utilizado el paradigma Auto-Organizativo de Kohonen (SOM). En primer lugar, se ha propuesto la utilización de una única SOM bidi- mensional para la clasicación de los estados del sistema. Una única red permite, para los patrones de una contingencia dada, su ordenación en función del grado de peligrosidad de la contingencia. Además, la ordenación de los mismos sigue una distribución lineal a lo largo 154 6.2 Líneas futuras de la diagonal del mapa. Esta distribución facilita enormemente la visualización de la peli- grosidad de una contingencia particular y, sobre todo, permite el seguimiento de la evolución del sistema y la predicción de su acercamiento o no a un estado de peligro. Por otro lado, la distribución lineal sobre la diagonal del mapa ha permitido formular y vericar la hipótesis de que la arquitectura ideal de la SOM para este problema es lineal. Así, el entrenamiento de una única SOM lineal ha permitido una distribución de los niveles de peligrosidad que, aunque distinta para cada contingencia, mantiene el orden de peligrosidad creciente en todos los casos. Esta solución aporta la facilidad de permitir la presentación en una única pantalla de un gran número de contingencias. 6.2. Líneas futuras Como líneas futuras de investigación en los temas abordados en este trabajo, destacamos los siguientes: - Los paradigmas propuestos para tareas relacionadas con EMS pueden ser aplicados a otros muchos campos, tales como economía, ingeniería y otras áreas sociales. - Utilización de modelos híbridos como RNAs y lógica borrosa para el tratamiento especíco de la predicción de la demanda de energía eléctrica en los periodos especiales, de forma que podrían constituir una etapa correctora que permita incorporar, mediante reglas, el conocimiento experto de la inuencia de factores como la laboralidad, variación meteorológica, etc. - En entornos donde se disponga de gran cantidad de datos históricos para periodos especiales como Navidad o Semana Santa, sería factible la creación de clases propias para cada uno de estos periodos, produciendo series temporales mucho más regulares. - La aplicación del modelo neuronal propuesto para la predicción de la demanda por separado de cada nodo de la red (predicción de carga por nodos) podría aportar información útil para tareas relacionadas con el análisis de seguridad. Esta aplicabilidad requiere de la disponibilidad de gran cantidad de datos históricos separados para cada nodo de la red. - Estudio de la aplicabilidad del paradigmas de Hopeld a problemas de optimización dentro de las tareas de un EMS. 155 Conclusiones y líneas futuras - Estudio de nuevos paradigmas para tareas de seguridad dinámica, estimación de estado dinámica, etc. - Inclusión de las medidas de fasores en el estimador topológico basado en funciones Gaussianas con distancia de Mahalanobis. - Ampliación del número de contingencias simultáneas consideradas en el análisis de contingencias. 156 Apéndice A Descripción de los paradigmas neuronales empleados En este apéndice describimos las características principales de los paradigmas neuronales utilizados a lo largo de esta tesis doctoral. A.1. Perceptrón Multicapa (MLP) La gura A.1 muestra la estructura básica de un Perceptrón Multicapa (del inglés Multilayer Perceptron o MLP) con una capa de entrada, dos capas ocultas y una de salida. En este tipo de arquitectura neuronal, todas las neuronas de una capa están conectadas a las neuronas de la capa precedente. Todas las señales uyen en la misma dirección: hacia adelante. La capa de entrada generalmente no está constituida por neuronas (representadas en la gura como pequeños cuadros), ya que no realizan procesamiento alguno, siendo su única función la de alimentar el vector de entrada a la primera capa oculta. La salida de una capa de neuronas queda según la ecuación (A.1.1): ( ) ā = f W̄ p̄ + b̄ (A.1.1) siendo ā el vector de salidas de la capa, W̄ el vector de pesos, b el vector bías, p̄ el vector de entradas a la capa y f es la función de transferencia de la neurona. 157 Descripción de los paradigmas neuronales empleados Capas Intermedias Capa de Entrada (Hidden Layers) (Input Layer) Capa de Salida (Output Layer) Peso o Fuerza sináptica Conexión o (Weight) Sinapsis Figura A.1: Red neuronal alimentada hacia delante tipo MLP, con dos capas de neuronas ocultas. A.1.1. Simulación o ejecución de la red neuronal El comportamiento de las redes neuronales articiales viene dado por su función de transferencia. Una red de N capas, con unos determinados pesos ybías en las conexiones entre cada una de las capas que conforman la red neuronal, posee un comportamiento denido por la ecuación (A.1.2). ( ā = f b̄N + W̄N · [ ( [ ( ) ] ) ] )f − b̄N−1N N 1 + W̄N−1 · . . . f 1 11 b̄ + W̄ · p̄ . . . (A.1.2) donde N es el número de capas de la red y p̄ es un vector de entrada. Esta función indica que para cada vector de entrada p̄ se obtiene un vector de salida ā, mediante la propagación de señales desde la capa de entrada hacia la capa de salida, como muestra la gura A.2. Cada uno de los vectores de entrada se denomina patrón de entrada a la red neuronal. La fase de ejecución de un MLP es una operación computacional muy rápida consistente en la realización de sumas de productos, que puede realizarse en tiempo real. 158 A.1 Perceptrón Multicapa (MLP) Figura A.2: Dirección del ujo de información durante la ejecución (orecall) de un MLP. A.1.2. Entrenamiento de un MLP El conocimiento de la red neuronal se encuentra en los pesos de las conexiones entre las distintas capas que forman la red neuronal. Durante el proceso de entrenamiento, la red va cambiando los pesos de sus conexiones de forma que la función de transferencia de la red se ajuste al objetivo. El algoritmo más utilizado para realizar este ajuste es el denominado Backpropagation ([Rumelhart et al., 1986]) (propagación hacia atrás del error). Este algoritmo de aprendizaje se basa en propagar el error de salida de cada capa hacia la capa anterior, de forma que se ajusten los pesos de cada capa de manera independiente. El error en la capa de salida ej(k) se dene como la diferencia entre los objetivos (salidas deseadas) tj(k) y las salidas reales obtenidas de la red aj(k) para los diversos patrones de entrada. El error en cada nodo de salida j de la red neuronal viene dado por la ecuación (A.1.3): ej(k) = tj(k)− aj(k) (A.1.3) donde k indica el número de la iteración. El objetivo del algoritmoBackpropagation es minimizar la suma de los errores cuadráti- cos medios de la salida de la red neuronal, dada por la ecuación (A.1.4): 1 ∑S ε (k) = e2j (k) (A.1.4)2 j=1 El error medio de todos los patrones de entrada del sumatorio del error cuadrático viene 159 Descripción de los paradigmas neuronales empleados dado por la ecuación (A.1.5): ∑Q1 ε = ε (k) (A.1.5) Q k=1 siendo Q el número de patrones de entrada disponibles. El objetivo del entrenamiento es minimizar este errorε a la salida. Para ello se aplica una corrección de los pesos y bías de la red neuronal proporcional al gradiente del error instantáneo, que utilizando la regla de la cadena queda como muestra la ecuación (A.1.6): ∂ε (k) ∂ε (k) ∂e = j (k) ∂aj (k) ∂vj (k) (A.1.6) ∂wi,j (k) ∂ ej (k) ∂aj (k) ∂vj (k) ∂wi,j (k) donde vj es el estado interno de la neuronaj. Evaluando por partes esta ecuación, obtenemos: 1 ∑S ∂ε (k) ε (k) = e2j (k) ⇒ = ej (k) (A.1.7)2 ∂ ej (k)j=1 ∂e (k) ej(k) = tj(k)− aj(k) ⇒ j = −1 (A.1.8) ∂aj (k) Si llamamos ϕj a la función de activación de la neurona ∂a (k) ai (k) = ( ( )) ⇒ jϕ ′j vj k = ϕj (vj (k)) (A.1.9)∂vj (k) ∑P ⇒ ∂vj (k)vj = wij (k) ai (k) = ai (k) (A.1.10) ∂wi,j (k)i=0 La variación de los pesos de cada capa viene dado por la ecuación (A.1.11): ∂ε (k) = −ej (k) · ϕ′j (vj (k)) · ai (k) (A.1.11)∂wi,j (k) Por tanto, el incremento viene dado por la ecuación (A.1.12): ∂ε (k) ∆w ′i,j (k) = −α = α ej (k) · ϕj (vj (k)) · ai (k) = α δj (k) · ai (k) (A.1.12)∂wi,j (k) siendo δj el gradiente local. δj (k) = ej (k) · ϕ′j (vj (k)) (A.1.13) 160 A.1 Perceptrón Multicapa (MLP) Para calcular el gradiente del error de cada neurona de cada capa necesitamos conocer el estado interno de la neurona, al que se le aplica la derivada de la función de activación, y el error de salida de la neurona. Este error de salida de cada neurona se conoce en las capas de salida. Para conocer el error de salida en las capas ocultas, el error se propaga hacia atrás desde la capa de salida. Si el nodo j pertenece a la capa de salida, el error en esa capa es conocido, tal y como se mostró en la ecuación (A.1.3). Si el nodo j pertenece a una capa oculta n, y el nodo h a la capa n + 1 el error en la capa n queda según la ecuación (A.1.14): − ∂ε(k) ∑ ∂ε(k) ∂vh (k) ∑ ej(k) = = = e (k) ϕ′ (v (k)) (A.1.14) ∂aj(k) ⊂ ∂vh (k) h h ∂aj(k) h h n+1 h⊂n+1 Para calcular el error por retropropagación utilizamos el método de dos pasadas. 1.- En la pasada hacia delante se simula la red, almacenando el estado interno de las neuronas de cada capa (gura A.2). 2- En la pasada hacia atrás, se retropropaga el error ( gura A.3). δ    (n) δ (n) δ  (n) d (n) y  (n ) e (n ) d  (n) y  (n) e  (n) Figura A.3: Dirección del ujo de información durante la fase propagación hacia atrás del error. Se ajustan los pesos y bías de cada capa en función del gradiente local del error: ∆wi,j (k) = α δj (k) · ai (k) (A.1.15) Este gradiente se calcula de forma recursiva: ∑ δj (k) = ϕ′j (vj (k)) · e ′j (k) = ϕj (vj (k)) · δh (k) whj (k) (A.1.16) h 161 Descripción de los paradigmas neuronales empleados A.1.2.1. Mejoras al algoritmoBackpropagation. Métodos alternativos Para aumentar la velocidad de convergencia del algoritmoBackpropagation se han prop- uesto numerosos métodos que hacen más eciente el proceso de aprendizaje de la red. La primera mejora se consiguió añadiendo a la regla de modicación de los pesos un término denominado momento (momentum). Este término añade un efecto de inercia que permite acelerar la velocidad de convergencia cuando el incremento del los pesos tiene siempre el mismo signo, mientras que su aportación queda anulada si el signo del incremento oscila. Otras propuestas han consistido en la utilización de funciones de transferencia alterna- tivas a la sigmoide, como por ejemplo la función tangente hiperbólica (f(x) = αtanh(bx)). Otras propuestas han utilizado implícitamente o explícitamente las derivadas segundas. Así, del denominado algoritmoQuickprop utiliza heurísticas para encontrar información de cómo son las derivadas segundas, pero sin tener que calcularlas. Finalmente, los métodos de segundo orden se basan en realizar el descenso por el gradi- ente de pesos utilizando información proporcionada por el ritmo de cambio de la pendiente. Ejemplos de estos métodos son los denominados Gradientes Conjugados, Gradientes Conju- gados Escalados y Levenberg-Marquardt. A continuación esbozamos el algoritmo de entrenamiento con ganancia adaptativa, uti- lizado en varios capítulos de esta tesis doctoral. A.1.2.2. Backpropagation con ganancia adaptativa El entrenamiento Backpropagation adaptativo sigue los principios de retropropagación del error que se han visto anteriormente, pero utiliza una tasa de aprendizaje adaptativa. Una tasa de aprendizaje pequeña hará el entrenamiento más largo y estable, mientras que un valor alto incrementará considerablemente el tiempo de convergencia. Sin embargo, si el valor de la tasa de aprendizaje es muy alta, puede hacer el proceso de entrenamiento inestable. Con el ajuste del paso del entrenamientoBackpropagation adaptativo se consigue, por tanto, un entrenamiento más eciente, intentando ajustarlo para conseguir la velocidad de entrenamiento máxima posible, asegurando en todo momento que el entrenamiento no llegue a la inestabilidad. 162 A.1 Perceptrón Multicapa (MLP) Para ello, se requieren tres parámetros adicionales en el entrenamiento de la red neu- ronal: Tasa de incremento. Indica cuánto se debe aumentar el paso si el entrenamiento así lo cree oportuno. Tasa de decremento. Indica cuánto se debe decrementar el paso si el entrenamiento debe reducir el tamaño del paso porque se ha vuelto inestable. Tasa de error. Rango donde el error puede aumentar sin que se considere que el sistema puede estar oscilando. El valor de estos parámetros para realizar un correcto aprendizaje de la red neuronal se deben establecer de forma heurística, mediante el método de prueba y error, la mayoría de las veces basados en la propia experiencia del diseñador de la red neuronal. En cada iteración del entrenamiento de la red neuronal se evalúa la variación del error cometido respecto a la iteración anterior. En este análisis del error se pueden llegar a tres estados deferentes: 1. Si el error ha disminuido, el entrenamiento de la red es correcto y se puede aumentar la tasa de aprendizaje para acelerar el entrenamiento. 2. Si el error ha aumentado por encima del la tasa de error, la red tiende hacia un estado inestable. No se modican los pesos y bías en esa iteración y se reduce la tasa de aprendizaje para evitar la inestabilidad. 3. Si el error ha aumentado por debajo de la tasa de error, es posible que la red deba superar un mínimo local en su función de aprendizaje. Por ello, se modican los pesos y bías de la red de acuerdo a los valores obtenidos en esa iteración, pero no se altera el valor del paso del entrenamiento. Con estas modicaciones, a costa de un incremento computacional pequeño, la conver- gencia del MLP suele ser mucho más rápida que con el métodoBackpropagation básico y, en la mayoría de los casos, suele evitar muchos mínimos locales. 163 Descripción de los paradigmas neuronales empleados A.2. Redes de funciones base radiales (RBF) Las redes neuronales de Funciones Base Radiales (del inglés,Radial Basis Function Networks) son del tipo alimentadas hacia delante, con una arquitectura de tres capas, como muestra la gura A.4. La capa de entrada se utiliza para presentar a la red los patrones de entrada. La segunda capa o capa oculta está constituida por neuronas no lineales, y la capa de salida por neuronales con funciones de transferencia lineales. Unidades de Salida – Lineales Ent. Supervisado Unidades RBF – No Lineales Ent. No supervisado Unidades de Entrada Figura A.4: Estructura de una red de funciones base radiales. La capa oculta proporciona un conjunto de funciones que constituyen una base arbi- traria para los patrones de entrada (vectores de entrada) cuando éstos son alimentados al espacio de las unidades ocultas ([Haykin, 1994]). De esta forma, las neuronas ocultas se denominan funciones base radiales (el término inglés correspondiente esradial-basis func- tions). Estas funciones de transferencia tienen dos parámetros, centro y ancho. La ecuación (A.2.1) muestra una posible elección: −‖ci−x‖ 2 fi(x) = e 2σi (A.2.1) donde x representa el vector de entrada, ci es el centro de la neurona i y σi determina el ancho de la neurona i. Los parámetros ci y σi de cada neurona se jan durante el proceso 164 A.2 Redes de funciones base radiales (RBF) de entrenamiento, así como los pesos de la capa de salida. El término radial se debe a la simetría radial de estas funciones con respecto al centro ci. La función de transferencia de una red RBF viene dada por la ecuación (A.2.2): ∑M yk(x) = wk,ifi(‖ci − x‖, σi) (A.2.2) i=1 donde yk es la salida de la k-ésima neurona de salida de la red,wk,i es el peso de la conexión entre la neurona de salida k y la neurona oculta i, M es el número de neuronas ocultas, yfi viene dada por la ecuación (A.2.1). A.2.1. Entrenamiento de RBF El primer paso en el entrenamiento de una red RBF (al igual que con otros paradigmas) es encontrar el número de neuronas óptimo para resolver un problema particular. En el caso de las neuronas RBF, cada una de ellas cubre una parte del espacio de entrada, por lo que habrá que elegir un número suciente que cubra todo el espacio de entrada. Sin embargo, debido a que el número de neuronas necesarias para cubrir este espacio crece exponencialmente con la dimensión de los vectores de entrada ([del Brío and Molina, 2001], [Haykin, 1994]), generalmente, se hace necesario llegar a un compromiso entre la precisión de la solución y el número de neuronas. Además, como con la red MLP, un excesivo número de neuronas ocultas puede producir una sobreparametrización de la red, lo que repercutirá negativamente en su capacidad de generalización. En este sentido, las técnicas que se emplean comúnmente para la determinación del número de neuronas ocultas en un MLP pueden también ser aplicadas al caso de las redes RBF. Entre ellas, el método de prueba y error suele emplearse frecuentemente, aunque existen otras técnicas más ecientes como el algoritmo Auto-Organizado jerárquico ([Haykin, 1994]). Una vez determinado el número de neuronas base radiales, debemos encontrar los parámetros de la arquitectura. En este sentido, a diferencia del entrenamiento del la red MLP, suele utilizarse un método por etapas, donde en primer lugar se entrenan las neuronas ocultas y, en una segunda etapa, las neuronas de salida. En la primera etapa, el proceso de entrenamiento de la red consiste en encontrar los parámetrosci y σi, de forma que minimicen alguna medida de error. Para los parámetrosci, entre los algoritmos más utilizados podemos destacar los siguientes: 165 Descripción de los paradigmas neuronales empleados Selección aleatoria. Selección de centros mediante el algoritmo k-medias. Una vez jados los parámetros ci, debemos encontrar los parámetros de escalaσi, que suele hacerse mediante técnicas heurísticas. Las ecuaciones (A.2.3) y (A.2.4) muestran dos pro- cedimientos ampliamente utilizados. La primera ecuación calcula de forma aproximada la inuencia en el espacio de entrada de cada neurona en relación a las demás. La segunda se basa en el cálculo del promedio de la distancia de diversos patrones representativos al centro cj . 1 ∑N σ2i = ‖cl − c 2j‖ (A.2.3)N l=1 ∑p1 σ2i = ‖x− cj‖2 (A.2.4)Nj x∈nodoj La última etapa del entrenamiento consiste en el aprendizaje de la capa de salida, esto es, determinar el valor de los pesoswi,j . En este caso, una vez jados los parámetros de las neuronas ocultas ci y σi, los pesos wi,j se calculan aplicando el algoritmo LMS (Least Mean Squares) a la expresión de la salida de la capa de salida según la ecuación (A.2.5): ∑ zk = wk,jfr(ci, σi) + θk (A.2.5) j donde fr representa la salida de una neurona de la capa oculta yθk es el bías de la neurona. Los pesos se obtienen mediante la ecuación (A.2.6): wk,j(t + 1) = wk,j(t) + ε(tk − zk)fr(ci, σi) (A.2.6) donde tk son los valores objetivos o salidas deseadas. Finalmente, señalar que con respecto al entrenamiento de una red MLP, el entrenamien- to de una red RBF es más eciente debido a que éste se realiza en dos etapas. A.3. Red recurrente de Elman La red de Elman forma parte de las denominadas redes parcialmente recurrentes. Tienen la forma general de un MLP, pero se añaden conexiones recurrentes. Está constituida por una 166 A.3 Red recurrente de Elman Figura A.5: Representación de una red de Elman. capa oculta con función de activación tangente hiperbólica y una capa de salida con función de activación lineal. Las conexiones recurrentes parten de la salida de la capa oculta y se realimentan como entradas a esta misma capa, como muestra la gura A.5. Las recurrencias de este modelo neuronal le permite tanto detectar como generar patrones que van cambiando a lo largo del tiempo ([Elman, 1990], [Elman, 1991]). Al igual que el MLP, su estructura de dos capas le permite aproximar cualquier fun- ción que tenga un número nito de discontinuidades con una precisión especicada, con la única condición de que el número de neuronas ocultas sea suciente [Haykin, 1994]. Las realimentaciones aportan a la red, en la iteración t, información sobre el estado de la misma en la iteración t-1. Al igual que el modelo de Jordan, esta red puede ser entrenada con los algoritmos diseñados para el MLP con un mínimo de cambios. A continuación, esbozamos el algoritmo básico de entrenamiento para la red de Elman: Para cada época: 1. Presentar los patrones a la red, y calcular las salidas. 2. Calcular el error de las salidas, comparándolas con las salidas deseadas. 3. Para cada patrón presentado, calcular el incremento de los pesos y bías utilizando el algoritmo Backpropagation. En esta etapa el gradiente de los pesos y bías de las 167 Descripción de los paradigmas neuronales empleados conexiones recurrentes se ignoran. 4. Actualizar el vector de pesos de cada neurona. El inconveniente de esta red frente al MLP es que la adaptación de los pesos utiliza una aproximación del gradiente del error. Por esta razón, para que una red de Elman pueda resolver el mismo problema que un MLP, generalmente requerirá de un número mayor de neuronas ocultas ([Demuth and Beale, 2000]). Por otro lado, aporta varias ventajas impor- tantes. En primer lugar, la realimentación de señales proporciona a la red estados internos y memoria, haciendo que las salidas no dependan sólo de las entradas actuales, sino de las entradas previas. En segundo lugar, tiene la ventaja de que la solución a un problema es menos sensible a los parámetros de la misma (número de neuronas y número de pesos). En tercer lugar, frente a otras redes realimentadas, el modelo de Elman aporta la gran ven- taja de poder utilizar todos los algoritmos de entrenamiento diseñados para el MLP, más ecientes, estables y robustos que los diseñados para redes recurrentes genéricas. A.4. Redes de Kohonen Las redes de Kohonen, también denominadas Mapas Auto-Organizativos (SOM , deSelf -Organizing Maps en inglés) se caracterizan por su capacidad para clasicar un conjunto complejo de patrones de manera no supervisada, extrayendo criterios de clasicación no obvios ni expresados de manera explícita. Esta clasicación es llevada a cabo mediante la distribución de un espacio de entrada VI de alta dimensión en un espacio de salida VO de menor dimensión, preservándose las relaciones topológicas existentes entre los patrones de entrada. El espacio de salida viene constituido por un conjunto de neuronas ordenadas generalmente en un plano o una línea, en el cual se dene una función de vecindad (gura A.6). Tras el proceso de aprendizaje, un vector de entrada~x = (x1, ..., xn) activará la neurona i del espacio de salida cuyo vector de pesos w~ i = (wi1, ..., win) tenga menor distancia al vector x. De esta manera, el vectorw~ i podrá ser considerado como el prototipo de la región del espacio de entrada cuyos vectores activan a la neurona i. Finalmente, dos vectores de entrada similares según la relación denida enVI , activarán la misma neurona o dos neuronas cercanas en el espacio de salida (gura A.7). 168 A.4 Redes de Kohonen Figura A.6: Disposición bidimensional de las neuronas de una red de Kohonen.         =              =     Figura A.7: Representación esquemática de la distribución de un espacio n-dimensional de entrada en un espacio bidimensional mediante un Mapa Auto-Organizativo de Kohonen. 169 Descripción de los paradigmas neuronales empleados A.4.1. Entrenamiento de un SOM En el proceso de entrenamiento, cada vez que se presenta a la red un nuevo patrón de entrada ~x, la red busca la neurona que menor distancia tiene a este vector. Esta neurona se denomina neurona ganadora, y cambia su vector de pesos en el sentido de aproximarse a~x, como reeja la ecuación (A.4.1): w~ i(t + 1) = w~ i(t) + lrhiv(~x− w~ i(t)) (A.4.1) donde ~x es un vector de entrada, w~ i es el vector de pesos de la neurona i, yhiv(), la función de vecindad, determina el incremento del peso de cada neurona como una función de su proximidad a la neurona ganadora para el patrón ~x. Generalmente, el área de vecindad viene dada por un cuadrado centrado en la neurona ganadora, cuyo lado decrece hasta cero a lo largo del entrenamiento, como muestra la gura A.8. lr es la razón dinámica de aprendizaje, la cual evoluciona a lo largo del proceso de entrenamiento según la ecuación (A.4.2): l ( ) = r0lr t (1 + c·t (A.4.2) nn) siendo lr0 la razón de aprendizaje inicial (0.3 en nuestro caso), c una constante (0.2), t la iteración actual ynn el número de neuronas de la red [Cottrell and Letremey, 1995], [Haykin, 1994]. El algoritmo de entrenamiento básico se esboza a continuación: 1. Inicializar los pesos de la red asignando a cada componente de los vectores de pesos números aleatorios en el intervalo [-1,1]. 2. Presentar un nuevo vector de entrada ~x. 3. Encontrar la neurona g cuyos pesos están más próximos (en el sentido de la distancia Euclidea) al vector ~x. 4. Modicar el vector de pesos de la neurona g y de sus neuronas vecinas utilizando la ecuación (A.4.1). 5. Modicar el tamaño de vecindad y la tasa de aprendizaje. 6. Ir al paso 2 hasta mientras no concluya el proceso de entrenamiento. 170 A.5 Red de Hopeld A(n)=0 A(n)=1 A(n)=2 A(n)=3 n Figura A.8: Vecindad topológica cuadrada para una red de Kohonen bidimensional. Las neuronas vecinas de n para varios valores de la función A son todas las incluidas en el cuadrado correspondiente.. A.5. Red de Hopeld Una red de Hopeld ([Hopeld, 1982], [Hopeld, 1984], [Hopeld and Tank, 1985]) tiene una única capa de neuronas, donde cada neurona se conecta con todas las demás, congurando una red recurrente completamente conectada, como muestra la gura A.9. Este modelo neuronal presenta dos variantes, el modelo discreto y el modelo analógico o continuo, que se describen en las secciones siguientes. A.5.1. Modelo discreto En el modelo discreto tanto las salidas como las entradas son valores binarios ({0,1} o {-1,1}), mientras que los pesoswi,j son valores reales (continuos). El potencial de la neurona se calcula según la ecuación (A.5.1): ∑ yi(t) = f( wi,jxj(t)− θi) (A.5.1) j donde f es la función de transferencia de las neuronas. 171 Descripción de los paradigmas neuronales empleados x1 x2 x3 E n t r a d a s xn w3, 3 θ1 θ 2 θ 3 θ n S a l i d a s y1 y2 y3 yn Figura A.9: Arquitectura de una red de Hopeld. En el proceso de ejecución de la red, en t=0, las neuronas reciben el valor de las entradas xj , calculando las salidas asociadas. Debido a las realimentaciones, las salidas se convierten en nuevas entradas en t=1, y así sucesivamente. En general, la dinámica de una neurona de una red de Hopeld viene dada por la ecuación (A.5.2): ∑ xi(t + 1) = f( wi,jxj(t)− θi) (A.5.2) j Esta ecuación proporciona la dinámica de una neurona de la red. Para obtener la dinámi- ca de la red debe especicarse el orden en el que se evalúa la ecuación (A.5.2) para cada neurona, es decir, debemos decidir si todas las neuronas calculan su salida en paralelo (si- multáneamente), secuencialmente (una tras otra), o de forma aleatoria. Esta ordenación se denomina dinámica de la red, y se suelen distinguir dos tipos genéricos ([del Brío and Molina, 2001]): a) Dinámica asíncrona o modo serie de operación. En el instante t sólo una neurona de la red actualiza su estado. La elección de la neurona se puede hacer aleatoriamente o siguiendo un orden preestablecido. 172 A.5 Red de Hopeld b) Dinámica síncrona o modo paralelo, en el que varias neuronas actualizan simultánea- mente su estado en el instante t. Si todas las neuronas actualizan simultáneamente su estado estamos ante el denominado modo de operación completamente paralelo. La aplicación de una u otra dinámica aplicada sobre la misma red hace que opere de forma diferente y que el estado nal de las neuronas sea diferente. Por ser una red realimentada, la respuesta de la red a lo largo del tiempo podrá estabi- lizarse, convergiendo a un estado estable, punto jo o atractor. En otros casos, la respuesta puede no converger, describiendo las salidas una trayectoria aleatoria. Existen teoremas gen- erales que establecen las condiciones que debe cumplir una red realimentada para que su respuesta sea estable. Una forma de hacerlo es mediante el método deLyapunov ([Sympson, 1990]). La función de Lyapunov se denomina también función de energía deLyapunov de- bido a que constituye una generalización del concepto físico de energía. Esta función permite garantizar que si se puede encontrar una función de energía para una red que disminuya con la evolución de la misma, entonces su dinámica será estable. Hopeld demostró ([Hopeld, 1982]) que su modelo era estable en el caso de que la matriz de pesos sea simétrica y de diagonal nula. Esta función de energía tiene la forma de la ecuación (A.5.3): 1 ∑n ∑n ∑n E = − wi,jxixj + θixi (A.5.3)2 i=1 j=1 i=1 donde debe vericarse que wi,i = 0 y wi,j = wj,i. Por construcción, ∆E ≤ 0, por lo que la energía de la red nunca crece. Como consecuencia, la red siempre llegará a un estado de mínima energía que se corresponderá con un estado estable o punto jo. A.5.1.1. Determinación de los pesos La aplicación más importante de este modelo es su utilización como memoria asociativa. En este sentido, para almacenar un conjunto de patrones se suele emplear la regla de Hebb, dada por la ecuación (A.5.4): ∑p1 w = xµi,j i x µ j (A.5.4)n µ=1 para el caso de neuronas binarias de valores {-1,1}. En esta ecuación, p representa el conjunto de patrones. En este caso, no existe un proceso de entrenamiento como en el caso de los 173 Descripción de los paradigmas neuronales empleados otros paradigmas descritos en este apéndice, sino que directamente se obtienen los valores de los pesos aplicando la ecuación (A.5.4) para un conjunto dado de patrones. A.5.2. Modelo continuo El modelo discreto de la red de Hopeld tiene el inconveniente de que las salidas úni- camente pueden estar en dos estados, 0 (o -1) para neuronas inactivas y 1 para neuronas activas (o +1). Esto no se corresponde con los sistemas biológicos que inspiraron los modelos neuronales, donde las salidas de las neuronas pueden tomar cualquier valor en el intervalo [0,1]. Para solventar este problema, en [Hopeld, 1984] Hopeld modicó su modelo permi- tiendo que las neuronas presentasen una respuesta analógica mediante el uso de la función de transferencia sigmoide dada por la ecuación (A.5.5): 1 yi(t) = f(x) = (A.5.5)1 + e−βx Al igual que para el caso discreto, para el modelo continuo puede denirse una función de energía que garantiza su estabilidad. Otra característica importante es que puede implemen- tarse fácilmente mediante electrónica analógica, utilizando amplicadores. En este caso, la función de energía viene dada por la ecuación (A.5.6): ∑ ∑ ∫ yi ∑ E = −1 wi,jyiyj + C g−1i (y)dy − xiyi (A.5.6)2 i,j i 0 i donde Ci es una constante. Hopeld demostró que esta función no es positiva si la función g−1 es monótona creciente y la matriz de pesos simétrica. Cuando la función g es abrupta (ganancia elevada), los estados estables del sistema continuo y discreto coinciden ([del Brío and Molina, 2001]) si se cumple quewi,j = wj,i y wi,i = 0. A.5.2.1. Determinación de los pesos El modelo continuo de Hopeld se suele utilizar en problemas de optimización. El modelo debe basarse en la suposición de que las salidas de la red se corresponden con las variables del problema a resolver. Las condiciones o restricciones del problema deben incorporarse explícitamente como términos de la función de energía de la red. En este caso, cada valor de 174 A.5 Red de Hopeld la función de energía se corresponde con una solución del problema. Si es posible encontrar un conjunto de pesos y entradas que formen una función de energía, dejando evolucionar a la red, ésta alcanzará un mínimo local, que representará una solución localmente óptima del problema. 175 Descripción de los paradigmas neuronales empleados 176 Apéndice B Descripción básica de un sistema de gestión de energía eléctrica En este apéndice se realiza una revisión esquemática de las principales tareas implicadas en la Gestión de un Sistema de Energía Eléctrica. B.1. Introducción Debido a que la generación y el consumo de energía eléctrica generalmente tienen lugar en lugares geográcos muy distantes, es necesariotransportar grandes cantidades de energía eléctrica a lo largo de grandes distancias, y debe realizarse de la forma más eciente posible. La función de un sistema de transporte de energía eléctrica es llevar la energía desde donde se produce hasta los puntos en los que se distribuye. En este sentido, se distingue entre redes de transporte y redes de distribución. Estas últimas realizan la distribución de la energía hasta el usuario nal. Entre las diferencias más importantes entre ambos sistemas están los niveles de tensión a los que se trabaja. Para la red de transporte, los niveles típicos son 400kV, 220kV y 132kV. Para las redes de distribución, los niveles de tensión suelen estar por debajo de los 110kV. Las tareas que se describen en este apéndice son las típicas de la red de transporte. Durante la operación de la red de transporte pueden presentarse condiciones de fun- cionamiento anormales que deben ser resueltas en un corto espacio de tiempo. La tarea de los operadores del sistema es realizar la operaciones de control necesarias para mantener la 177 Descripción básica de un sistema de gestión de energía eléctrica seguridad de la red ante estas eventualidades. Sin embargo, sin la ayuda de aplicaciones para la monitorización y control, preservar la seguridad puede ser una tarea muy difícil o, bajo circunstancias especiales, imposible. Por tanto, para asistir a los operadores se han diseña- do una serie de aplicaciones o funciones que permiten monitorizar el sistema de forma que pueda mantenerse lejos de situaciones en las que puedan producirse sobrecarga de equipos, niveles de tensión anormales, inestabilidad del sistema, pérdida del suministro de energía a alguna carga e incluso la posibilidad de suspender el suministro en todo el sistema. Estas funciones utilizan periódicamente la información disponible en tiempo real de diversas partes de la red, para determinar si el sistema se encuentra cerca de, o en un estado de emergencia. Estas funciones de seguridad, junto con otras funciones de control y restablecimiento de la seguridad, constituyen lo que se denomina Sistema de Gestión de Energía Eléctrica (del inglés Energy Management System o EMS). La gura B.1 muestra las tareas principales que componen un análisis de seguridad on-line. Este análisis de seguridad constituye la tarea principal en la gestión del sistema. El análisis de seguridad comienza con la recepción en SCADA (sistema de supervisión, control y adquisición de datos, o, en inglés, Supervisory Control and Data Acquisition system) de las medidas analógicas (inyecciones y ujos de potencia, corrientes, módulos de tensión, fasores de tensión y corriente) y digitales (estado de interruptores y seccionadores) a través de las unidades remotas. Las medidas recibidas se someten a un primer ltrado que permite descartar aquellas que tienen valores no coherentes con las cantidades físicas que representan. Los datos digitales son procesados de forma que se construye un modelo topológico de la red que determina el conexionado de sus elementos (conecciones de generadores, cargas, líneas de transmisión, transformadores, etc.). A partir del modelo topológico y de las medidas analógicas disponibles se realiza una estimación de estado que permite obtener el vector de estado de la red, que puede utilizarse para determinar otras variables de interés en el sistema. Como se describe más adelante, las tareas de análisis de observabilidad y de detección de medidas erróneas son parte de la estimación de estado. La estimación de estado permite conocer si la red se encuentra en un estado de emergencia mediante la vericación de ciertos límites de los valores de las variables más importantes. Si el estado actual del sistema es normal, el siguiente paso es determinar la seguridad del mismo ante la posibilidad de que se produzcan determinados fallos en uno o varios 178 B.1 Introducción Medidas Filtrado Observabilidad Topología Estimación de de la Red Detección de Estado Medidas Erróneas Comprobación De Límites Predicción de Estado Demanda por NudosEstado de Emergencia normal Estado restaurable Modelado de la Red Externa Selección de contingencias Flujo de Carga Evaluación de On-line Contingencias Estado seguro Estado inseguro Figura B.1: Componentes principales de un análisis de seguridadon-line ([Balu et al., 1992]). 179 Descripción básica de un sistema de gestión de energía eléctrica equipos de la red o ante el incremento de la demanda de energía. Esta tarea se denomina análisis de contingencias. Debido a que la cantidad de posibles contingencias es muy grande, normalmente se necesita un procedimiento que seleccione un reducido número de ellas entre las posibles o más probables. Esta tarea requiere generalmente de la resolución de problemas de ujo de carga y, en muchos casos, debido a que una contingencia es un evento futuro, de la predicción del consumo de cada nodo de la red (predicción de demanda por nudos). Para cada contingencia seleccionada se evaluará su gravedad, de forma que se puedan tomar las acciones de control anticipadas para asegurar estabilidad del sistema ante la eventualidad de que esa contingencia se produzca. Estas y otras tareas relacionadas se describen brevemente en las siguientes secciones. Por otro lado, la energía no puede ser almacenada de forma eciente. Debido a esto, la generación y el consumo de energía deben igualarse en cada momento. Para garantizar el cumplimiento de esta restricción se requiere conocer con suciente antelación el consumo futuro de energía. Esta es la función de la tarea depredicción de carga. B.2. Predicción de carga eléctrica El objetivo de la predicción de carga eléctrica es obtener los valores futuros de deman- da eléctrica mediante la extrapolación de los datos de consumo pasado. El proceso puede considerar factores exógenos como meteorológicos (temperatura, grado nubosidad, velocidad del viento, grado humedad, nivel de lluvia), estacionales, condiciones socioeconómicas (días laborales o festivos) y condiciones culturales (periodos especiales como Navidad, Semana Santa, Ramadán, etc.). La predicción puede ser clasicada en función de la magnitud que va a ser predicha (pico de carga, carga integral, carga horaria) o en función del intervalo de predicción (muy corto plazo, que considera la predicción de la demanda desde los próximos minutos has- ta la próxima hora, corto plazo, que va desde unas horas a varias semanas, largo plazo, implicando periodos de años). Puesto que la energía eléctrica no puede ser ecientemente almacenada, ajustar las curvas de demanda y producción es una tarea vital para un sistema de gestión de energía. Así, en tareas como Programación Horaria de Unidades Térmicas, Despacho Económico, Mantenimiento, Planicación de Expansión, Seguridad en Tiempo 180 B.3 Estimación de estado Real y Control, es necesaria una buena predicción. En los últimos años, las nuevas condi- ciones de deregularización y competición en el mercado de la energía eléctrica han dado un nuevo impulso a esta tarea, y han condicionado el periodo de predicción para ajustarlo a los periodos de operación del mercado. B.3. Estimación de estado La Estimación de Estado clásica calcula los valores más probables de las variables de estado de un sistema de energía (magnitud y fase de tensión en cada bus) a partir de un conjunto redundante de medidas, entre las que se encuentran las de magnitud de tensión, inyecciones de potencia activa y reactiva en los buses, y ujos de potencia activa y reactiva por las líneas. A partir de las variables de estado estimadas podrán ser obtenidas el resto de variables de interés del sistema. Puesto que es imposible obtener un conjunto de medidas exactas, el módulo de esti- mación de estado se enfrenta a los siguientes problemas: 1. Sólo una parte de las medidas que pueden ser usadas como variables de entrada están disponibles en cada momento. 2. Todas las medidas analógicas son erróneas debido, entre otros factores, al ruido de los instrumentos de medida y del canal de transmisión de la información. 3. La recepción de las medidas no siempre ocurre en el mismo orden en que fueron generadas, ni todas las medidas de determinado conjunto de entrada tienen por qué corresponder al mismo instante de tiempo. 4. Es frecuente el uso de pseudomedidas que pueden ser excesivamente erróneas. 5. La información topológica puede ser errónea o incompleta. La estimación de estado necesita de un mínimo número de medidas que garanticen la observabilidad del sistema, y una información topológica correcta para desarrollar el modelo matemático del mismo. Por tanto, un módulo de estimación de estado debe contener, adicionalmente al estimador propiamente dicho, un submódulo de observabilidad y otro de estimación de topología. 181 Descripción básica de un sistema de gestión de energía eléctrica B.3.1. Análisis de observabilidad El Análisis de Observabilidad consiste en determinar si el conjunto de medidas disponibles es suciente (tanto en número como en ubicación) para resolver el problema de estimación de estado, y en caso negativo, determinar las regiones observables más extensas. Básicamente, un sistema es observable si se puede asociar una medida de ujo o inyección a cada bus del sistema. B.3.2. Estimación de topología Los actuales sistemas llevan a cabo tanto la estimación de estado como el análisis de datos erróneos presuponiendo que la información topológica es correcta, de manera que un error en ésta producirá una conguración de estado incorrecta y una errónea detección de malas medidas. En consecuencia, la identicación de errores topológicos, o estimación de topología, constituye una autentica necesidad en un Sistema de Gestión de Energía. Esta tarea es esencial para que los operadores obtengan el conjunto de datos usados para el análisis de seguridad, en tiempo real. B.3.3. Detección de medidas erróneas Durante el proceso de estimación de estado clásica se parte de la hipótesis de que los errores en las medidas analógicas son pequeños y aleatorios con una distribución normal de parámetros conocidos. Sin embargo, en algunas ocasiones puede ocurrir que una o varias medidas presenten errores grandes debido a fallos en la comunicación u otros motivos. Si estas medidas erróneas no se eliminan como entradas al algoritmo de estimación, los resultados de éste pueden no se sucientemente precisos. Por tanto, se hace necesario detectar, identicar y eliminar la medida o medidas erróneas. B.4. Análisis de seguridad La carga de un sistema de energía eléctrica está continuamente cambiando como con- secuencia de las conexiones y desconexiones de las unidades de consumo. Aunque cambios individuales son en su mayoría pequeños comparados con el tamaño del sistema, pueden aparecer situaciones de gravedad cuando ocurren sucesos tales como el fallo de una línea 182 B.5 Planicación operacional del sistema de energía eléctrica o la caída de un generador. En todo momento se requiere un ajuste continuo entre la en- ergía suministrada por los generadores y la carga eléctrica del sistema, o de lo contrario tanto la frecuencia del sistema como los valores de tensión podrán desviarse de sus niveles aceptables provocando una situación de colapso. El objetivo del análisis de seguridad es detectar y corregir estas desviaciones y actuar de forma que se restaure tan pronto como sea posible los valores normales de funcionamiento. Las nuevas condiciones de nanciación, deregularización o ambientales que aparecen en el nuevo mercado de la energía, están forzan- do grandes cambios en el funcionamiento de los sistemas de energía, poniendo el énfasis en la maximización del uso de los recursos de generación y transporte ya existentes. En conse- cuencia, los sistemas de energía trabajan muy cerca de sus límites de seguridad, y cualquier brecha en ésta puede tener un impacto no previsto. El análisis de seguridad puede dividirse según las condiciones de estabilidad que deben ser respetadas: Estabilidad en estado estable (Steady State Stability). Este análisis de seguridad con- siste en asegurar la capacidad del sistema de mantenerse estable y controlable cuando se producen pequeñas variaciones de carga. Estabilidad en estado transitorio (Transient stability). En este caso se estudia la ca- pacidad del sistema de permanecer estable desde que se produce una perturbación hasta que tienen lugar las actuaciones de control correspondientes. Seguridad dinámica. Se estudia la capacidad del sistema de retornar a un estado esta- cionario aceptable después de que las acciones de corrección hayan sido tomadas. En el análisis de seguridad estático, una vez garantizado éste, continua la estabilidad del sistema en caso de que ocurra un evento crítico. Esta última tarea se suele denominar análisis de contingencias. B.5. Planicación operacional del sistema de energía eléctrica Un sistema de energía debe operar de tal manera que los costes de producción sean mínimos mientras se satisfagan determinadas restricciones temporales y de seguridad. Las tareas implicadas en este objetivo son globalmente denominadas planicación operacional. 183 Descripción básica de un sistema de gestión de energía eléctrica Estas tareas pueden ser clasicadas en planicación a largo plazo (Planicación de Expansión) y planicación a corto y medio plazo ( Programación Horaria de Unidades Térmicas y Despacho Económico de Carga). 184 Apéndice C Diagramas de las redes IEEE estándares utilizadas en esta tesis En este apéndice se presentan los diagramas unilares de las redes estándares IEEE utilizadas como banco de pruebas en las diferentes tareas de la gestión de un sistema de en- ergía tratadas en esta tesis. Los datos descriptivos de las mismas, en formatoIEEE Common Data Format ([on a Common Format for the Exchange of Solved Load Flow Data, 1973]), pueden encontrarse en la dirección http://www.ee.washington.edu/research/pstca/. 185 Diagramas de las redes IEEE estándares utilizadas en esta tesis Figura C.1: Diagrama de la red IEEE 14. 186 Figura C.2: Diagrama de la red IEEE 30. 187 Diagramas de las redes IEEE estándares utilizadas en esta tesis Figura C.3: Diagrama de la red IEEE 57. 188 Figura C.4: Diagrama de la red IEEE 118. 189 Diagramas de las redes IEEE estándares utilizadas en esta tesis 190 Referencias Abe, S. (1989). Theories on the Hopeld neural networks. IEEE International Joint Con- ference on Neural Networks I, pages 557564. Ajjarapu, V. and Christy, C. (1992). The continuation power ow: A tool for steady state voltage stability analysis. IEEE Transaction on Power Systems, 7(1):416423. Albuyeh, F., Bose, A., and Heath, B. (1982). Reactive power considerations in automatic contingency selection. IEEE Transactions on Power Apparatus and Systems, 101:107112. AlFuhaid, A. S., El-Sayed, M. A., and Mahmoud, M. S. (1998). Cascaded articial neural net- works for short-term load forecasting. IEEE Transactions on Power Systems, 12(4):1524 1529. Amjady, N. (2001). Short-term hourly load forecasting using time-series modeling with peak load estimation capability. IEEE Transactions on Power Systems, 16(3):498505. Atencia, M., Joya, G., and Sandoval, F. (2001). Numerical implementation of continuous Hopeld networks for optimization. Proceeding of the European Symposium on Articial Neural Networks (ESANN'01)., pages 359364. Balu, N., Bertram, T., Bose, A., Brandwajn, V., Cauley, G., Curtice, D., Fouad, A., Fink, L., Lauby, M. G., Wollenberg, B., and Wrubel, J. (1992). On-line power system security analysis. Proceeding of the IEEE, 80(2):262280. Bergen, A. R. (1986). Power Systems Analysis. Prentice-Hall Inc., Englewood Clis, New Jersey 07632. 191 REFERENCIAS Bertoldi, O., Salvaderi, L., and Scalcino, S. (1988). Monte Carlo approach in planning studies: An application to IEEE RTS. IEEE Transactions on Power Systems, 3(3):1146 1154. Billinton, R. and Jonnavithula, A. (1996). Variance reduction techniques for use with se- quential Monte Carlo simulation in bulk power system reliability evaluation. Canadian Conference on Electrical and Computer Engineering, 1996., 1:416419. Billinton, R. and Sankarakrishnan, A. (1995). A comparition of Monte Carlo simulation techniques for composite power system reliability assessment. Proceedings of the IEEE WESCANEX'95, pages 145150. Bonanomi, P. and Gramberg, G. (1983). Power system data validation and state calcula- tion by network search techniques. IEEE Transaction on Power Apparatus and Systems, 102(1):238249. Borkowska, B. (1981). How to deal with errors in network data. Proceeding of the 1981 PSCC, Lausanne, pages 513519. Box, G., Jenkins, G., and Reinsel, G. (1994). Time series analysis: Forecasting and control. Broomhead, D. S. and Lowe, D. (1988). Multivariable functional interpolation and adaptive netowks. Complex Systems, 2:321355. Bunn, D. W. (2000). Forecasting loads and prices in competitive power markets.Proceeding of the IEEE, 88(2):163169. Bunn, D. W. and Farmer, E. D., editors (1985). Comparative Models for Electrical Load Forecasting. John Wiley and Sons. Charytoniuk, W., Chen, M. S., and Olinda, P. V. (1998). Nonparametric regresion based short-term load forecasting. IEEE Transactions on Power Systems, 13(3):725730. Chen, S., Cowan, C. F. N., and Grant, P. M. (1991). Orthogonal least squares learning algorithm for radial basis function networks. IEEE Transactions on Neural Networks, 2(2):302309. 192 REFERENCIAS Chicco, G., Napoli, R., and Piglione, F. (2001). Neural networks for fast voltage prediction in power systems. Power Tech. Proceedings, 2001 IEEE Porto, 2:5. Choueiki, M. H., Mount-Campbell, C. A., and Ahalt, S. C. (1997a). Building a 'quasi opti- mal' neural network to solve the short-term load forecasting problem.IEEE Transactions on Power Systems, 12(4):14321439. Choueiki, M. H., Mount-Campbell, C. A., and Ahalt, S. C. (1997b). Implementing a weight- ed least squares procedure in training a neural network to solve the short-term load forecasting problem. IEEE Transactions on Power Systems, 12(4):16891694. Chow, T. W. S. and Leung, C. T. (1996). Neural network based short-term load forecasting using weather compensation. IEEE Transactions on Power Systems, 11(4):17361742. Chung, T. S. and Ying, F. (1998). An ANN-based vetwork equivalent approach for power system on-line voltage security assessment. International Conference on Power System Technology POWERCON '98, 2:1504 1507. Clements, K. A. and Davis, P. W. (1988). Detection and indentication of topology errors in electric power system. IEEE Transactions on Power Systems, 3(4):17481753. Connor, J., Atlas, L., and Martin, D. (1992). Recurrent networks and NARMA modeling. Connor, J., Martin, R., and Atlas, L. (1994). Recurrent neural networks and robust time- series prediction. Neural Networks, 5:240254. Connor, J. T. (1996). A robust neural network lter for electricity demand prediction.Int. J. Forecast, 15(6):437458. Connor, J. T., Atlas, L. E., and Martin, D. (1991). Recurrent neural networks and load fore- casting. Proceedings of the First International Forum on Applications of Neural Networks to Power Systems, pages 2225. Costa, M., Pasero, E., Piglione, F., and Radasanu, D. (1999). Short term load forecasting using a synchronously operated recurrent neural network. International Joint Conference on Neural Networks IJCNN '99, 5(4):34783482. 193 REFERENCIAS Cottrell, M. and Letremey, P. (1995). Classication et analyse des correspondances au moyen de l'algoritme de Kohonen: Application à l'Ètude de donnèes Socio-Économiques. Prépublication du SAMOS, 42. Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function.Math Control Signal Syst., 2:303314. Darbellay, G. A. and Slama, M. (2000). Forecasting the short-term demand for electricity do neural network stand a better chance? Int. J. Forecast, 16:7183. de la Villa Jaén, A. and Expósito, A. G. (2001). Modeling unknown circuit breakers in generalized state estimators. Power Tech Proceedings, 2001 IEEE Porto, 3:4. del Brío, B. M. and Molina, A. S. (2001). Redes Neuronales y Sistemas Borrosos. Ra-Ma, segunda edition. Demuth, H. and Beale, M. (2000). Neural Network Toolbox for Use with Matlab. User's Guide. The MathWorks, Inc., http://www.mathworks.com, 4 edition. Dorner, G. (1996). Neural networks for time series processing. Neural Network World, 4:447468. Drezga, I. and Rahman, S. (1998). Input variable selection for ANN-based short-term load forecasting. IEEE Transactions on Power Systems, 13(4):12381244. Ejebe, G. C., Irisarri, G. D., Mokhtari, S., Obadina, O., Ristanovic, P., and Tong, J. (1996). Methods for contingency screening and ranking for voltage stability analysis of power system. IEEE Transactions on Power Systems, 11(1):350356. Ejebe, G. C., Meeteren, H. P. V., and Wollenberg, B. F. (1988). Fast contingency screen- ing and evaluation for voltage security analysis. IEEE Transactions on Power Systems, 3(4):302307. Elman, J. L. (1990). Finding structure in time. Cognitive Science, 14:179211. Elman, J. L. (1991). Distributed representations, simple recurrent networks, and grammat- ical structure. Machine Learning, 7(2-3):95126. 194 REFERENCIAS Engle, R. F., Mustafa, C., and Rice, J. (1992). Modeling peak electricity demand. Int. J. Forecast, 11:241151. Fan, J. Y. and McDonald, J. D. (1994). A real-time implementation of short-term load fore- casting for distribution power systems. IEEE Transactions on Power Systems, 9(2):988 994. Farlow, S. J., editor (1984). Self-Organizing Methods in Modeling. Marcel Dekker. Fidalgo, J. N. and Lopes, J. A. P. (2001). ANN sensitivity analysis for identication of relevant features in security assessment. Power Tech Conferente, PPT'2001. Fujiwara, R., Sakaguchi, T., Kohno, Y., and Suzuki, H. (1986). An intelligent load ow engine for power system planning. IEEE Transactions on Power Systems, PAS-3:302307. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (1998a). Application of Hop- eld neural networks to state estimation. Proceeding of the International ICSC/IFAC Symposium on Neuronal Computation, 1:405411. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (1998b). A neural topology estima- tor for power systems. Proceeding of the Fourth International Conference on Engineering Applications of Neural Networks June 10-12, 1998, 4:245252. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (1999). Study of the evolution of a stock market by means of Self-organizing maps of Kohonen. Proceeding of the Sixth International Meeting on Advances in Computational Management, pages 110. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (2000a). Hopeld neural networks for state estimation: Parameters, ecient implementation and results.Elektrotechnik und Informationstechnik, 1:47. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (2000b). A modular power system topology assessment based on Gaussian potential functions. Proceedings of the IASTED International Conference. Power and Energy Systems., Sep:217223. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (2001). Neural networks for contingency evaluation and monitoring in power systems. From Natural to Ariticial Neural Computation, June:505512. 195 REFERENCIAS García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (2002). Self-organizing maps for contingency analysis: Visual classication and temporal evolution.Conference of the IEEE Industrial Electronics Society - Sevilla 2002. García-Lagos, F., Joya, G., Marín, F. J., and Sandoval, F. (2003). Modular power system topology assessment using gaussian potential functions. Aceptado para su publicación en IEE Proceedings on Generation, Transmission and Distribution. Gjelsvik, A., Aam, S., and Holten, L. (1985). Hachtel's augmented matrix method  a rapid method improving numerical stability in power system static state estimation. IEEE Trans. Power Apparatus and Systems, 104(11):29872993. Habiballah, I. O. and Quintana, V. H. (1991). Fast-decoupled rectangular co-ordinate state estimation with ecient data structure management.IEE Procceedings-C, 138(5):462468. Hagan, M. T. and Behr, S. M. (1987). The time series approach to short term load forecast- ing. IEEE Transactions on Power Systems, PWRS-2(3):785791. Hagan, M. T. and Menhaj, M. B. (1994). Training feedforward networks with the Marquardt algorithm. IEEE Transactions on Neural Networks, 4(6):989993. Haida, T. and Muto, S. (1994). Regression based peak load forecasting using a transforma- tion tecnique. IEEE Transactions on Power Systems, 9(4):17881794. Harris, J. H., Kellie, G. H., Prewett, J. N., and Jerwis, P. (1976). Two implementations of state estimators for power systems. Proceeding of the 1976 CIGRE, 32-06, pages 111. Harvey, A. and Koopman, S. J. (1993). Forecasting hourly electricity demand using time- varying splines. J. American Stat. Assoc, 88(424):12281236. Haykin, S. (1994). Neural Networks. A Comprehensive Foundation. Macmillan College Publishing Company Inc., New York. Hecht-Nielsen, R. (1987). Counterpropagation networks.Applied Optics, 26(3):49794984. Hippert, H. S., Pedreira, C. E., and Souza, R. C. (2001). Neural networks for short-term load forecasting: a review and evaluation. IEEE Transactions on Power Systems, 16(4):4455. 196 REFERENCIAS Ho, K. L., Hsu, Y. Y., and Yang, C. C. (1992). Short term load forecasting using a multi- layer network with an adaptive learing algorithm. IEEE Transactions on Power Systems, 7(1):141149. Hopeld, J. J. (1982). Neural network and physical systems with emergent collective com- putational abilities. Proc. Natl. Acad. Scie. USA, 79:25542558. Hopeld, J. J. (1984). Neurons with graded response have collective computational prop- erties like those of two-state neurons. Procceeding of the National Academy of Sciences, 81:30883092. Hopeld, J. J. and Tank, D. W. (1985). Neural computation decisions in optimization problems. Biol. Cybern., 52. Hsu, Y.-Y. and Kuo, H.-C. (1992). Fuzzy-set based contingency ranking.IEEE Transactions on Power System, 3(3):11891194. Huang, S. R. (1997). Short-term load forecasting using threshold autoregresive models.IEE Proceeding on Generation, Transmission and Distribution, 144(5):477481. Huber, P. J. (1981). Robust Statistics. John Wiley. Hyde, O. and Hodnett, P. F. (1997). An adaptable automated procedure for short-term electricity load forecasting. IEEE Transactions on Power Systems, 12(1):8493. Ineld, D. G. and Hill, D. C. (1998). Optimal smooting for trend removal in short term electricity demand forecasting. IEEE Transactions on Power Systems, 13(3):11151120. Iwamoto, S. and Tamura, Y. (1978). A fast load ow method retaining nonlinearity.IEEE Transactions on Power Apparatus and Systems, PAS-97(5):15861599. Jackson, J. E. (1991). A User± Guide To Principal Components. John Wiley and Sons. Jensen, C. A., El-Sharkawi, M. A., and II, R. J. M. (2001). Power system security assessment using neural networks: Feature selection using Fisher discrimination. IEEE Transaction on Power Systems, 16(4):757763. Jollife, I. T. (1986). Principal Component Analysis. Springer-Verlag. 197 REFERENCIAS Jordan, M. I. (1989). Serial order: A parallel, distributed processing approach. In Elman, J. L. and Rumelhart, D. E., editors,Advances in Connectionist Theory: Speech. Lawrence Erlbaum, Hillsdale. Joya, G., Atencia, M. A., and Sandoval, F. (2002a). Hopeld neuronal networks for opti- mization: Study of the dierent dynamics. Neurocomputing, 43:219237. Joya, G., García-Lagos, F., Atencia, M. A., and Sandoval, F. (2002b). Articial neu- ral networks for energy management system. applicability and limitations of the main paradigms. Approaches Connexionnistes en Sciences Economiques et de Gestion (AC- SEG 2002), pages 129143. Juberias, G., Yunta, R., Garcia-Moreno, J., and Mendivil, C. (1999). A new ARIMA model for hourly load forecasting. IEEE Transmission and Distribution Conference, New Or- leans, 1:314319. Khotanzad, A., Afkhami-Rohani, R., Lu, T. L., Abaye, A., Davis, M., and Maratukulam, D. J. (1997). ANNSTLF - a neural-network-based electric load forecasting system.IEEE Transactions on Neural Nets, 8(4):835846. Khotanzad, A., Afkhami-Rohani, R., and Maratukulam, D. (1998). ANNSTLF - articial neural network short-term load forecaster - generation three.IEEE Transactions on Power Systems, 13(4):14131422. Khotanzad, A., Hwang, R. C., Abaye, A., and Maratukulam, D. (1995). An adaptive modular articial neural network hourly load forecaster and its implementation at electric utilities. IEEE Transactions on Power Systems, 10(3):17161722. Kim, H. and Singh, C. (2002). Probabilistic security analysis using SOM and Monte Carlo simulation. Power Engineering Society Winter Meeting, 2:755760. King, D. D., El-Hawary, M. E., and El-Hawary, F. (1995). Optimal environmental dis- patching of electric power sytems via an improved Hopeld neural network model.IEEE Transactions on Power Systems, 3. Koglin, J. J. and Neisius, H. T. (1990). Treatment of topological erros in substations. Proceeding of the 1990 Power Systems Computation Conference, pages 10451053. 198 REFERENCIAS Kohonen, T. (1990). The Self-organizing Map. Proc. IEEE, 78(9):14641480. Lamedica, R., Prudenzi, A., Sforma, M., Caciotta, M., and Cencelli, V. O. (1996). A neural network based technique for short-term forecasting of anomalous load periods. IEEE Transactions on Power Systems, 11(4):17491756. Le, N. Q. and Outhred, H. R. (1977). Identication and elimination of bad data and line errors from power system state estimators. Proceeding of the 1977 IFAC Symposium (Melbourne), pages 459463. Lee, K. Y., Cha, Y. T., and Park, J. H. (1992). Short-term load forecasting using an articial neural network. IEEE Transactions on Power Systems, 7(1):124132. Lee, S. and Kil, R. M. (1991). A Gaussian potential function network with hierarchically self-organizing learning. Neural Networks, 4:207224. Lemaître, C. and Thomas, B. (1996). Two applications of parallel processing in power system computation. IEEE Transactions on Power Systems, 11(1):246253. Lerma, I. J. (1990). Application of Monte Carlo method to power system reliability calcu- lations. Proceedings of the 25th Intersociety Energy Conversion Engineering Conference. IECEC-90, 5:502507. Lo, K. L. and Abdelaal, A. K. I. (2000). Fuzzy logic based contingency analysis.International Conference on Electric Utility Deregulation and Restructuring and Power Technologies 2000,City University, London, pages 499504. Lo, K. L., Peng, L. J., Macqueen, J. F., Ekwue, A. O., and Cheng, D. T. Y. (1998). Fast real power contingency ranking using a Counterpropagation network.IEEE Transactions on Power Systems, 13(4):12591264. Luan, W. P., Lo, K. L., and Yu, Y. X. (2000). ANN-based pattern recognition technique for power system security assessment. International Conference on Electric Utility Dereg- ulation and Restructuring and Power Technologies 2000, City University, London, pages 197202. 199 REFERENCIAS Lugtu, R. L., Hackett, D. F., Liu, K. C., and Might, D. D. (1980). Power system state estimation: Detection of topological errors. IEEE PAS, PAS-99(6):24062412. Maghrabi, H., Raaee, J. A., and Mohandes, M. (1998). Contingency analysis of bulk pow- er system using neural networks. Proceeding of the International Conference on Power System Technology. POWERCON'98, 2:12511254. Mansour, A. E. and Eldin, H. A. N. (1987). Fast and robust bad data detection, identication and correction with subsequent direct recursive state estimation. Proceeding of the 1987 PSCC (Cascais), pages 516522. Marín, F. J., García-Lagos, F., Joya, G., and Sandoval, F. (2000). A new short-term load forecaster with articial neural network. Proceeding of the IASTED International Con- ference. Power and Energy Systems., Sep:177182. Marín, F. J., García-Lagos, F., Joya, G., and Sandoval, F. (2002). Global model for short- term load forecasting using articial neural networks. IEE Proceedings on Generation, Transmission and Distribution, 149(2):121125. Marín, F. J. and Sandoval, F. (1997). Short-term peak load forecasting: Statistical methods versus articial neural networks. in J. Mira, R. Moreno-Díaz and J. Cabestany (Eds.), Biological and Articial Computation: From Neuroscience to Technology, Spriger-Verlag, LNCS, 1240(2):13341343. Marín, J. (1997). Optimización de Redes Neuronales Articiles Mediante Algoritmos Genéti- cos. Aplicación a la Predicción de Carga. Tesis doctoral, Universidad de Málaga. Matos, M. A., Hatziargyriou, N. D., and Lopes, J. A. P. (2000). Multicontingency steady state security evaluation using fuzzy clustering techniques. IEEE Transactions on Power System, 15(1):177183. Mazon, A. J., Zamora, I., Gracia, J., Sagastabeitia, K. J., and Saenz, J. R. (2001). Selecting ANN structures to nd transmission faults.IEEE Computer Applications in Power, 14:44 48. 200 REFERENCIAS Mbamalu, G. A. N. and El-Hawary, M. E. (1993). Load forecasting via suboptimal sea- sonal autoregressive models and iteratively reweighted least squares estimation. IEEE Transactions on Power Systems, 8(1):343348. McMenamin, J. S. and Monforte, F. A. (1998). Short-term energy forecasting with neural networks. Energy J., 19(4):4361. Mili, L., Steeno, G., Dobraca, F., and French, D. (1999). A robust estimation method for topology error identication. IEEE Transactions on Power Systems, 14(4):14691476. Miranda, V. and Saraiva, J. T. (1992). Fuzzy modelling of power system optimal load ow. IEEE Transaction on Power Systems, 7(2):843 849. Mohammed, O., Park, D., Merchant, R., Dinh, T., Tong, C., Azeem, A., Farah, J., and Drake, C. (1995). Practical experiences with an adaptive neural network short-term load forecasting. IEEE Transactions on Neural Nets, 10(1):254265. Monticelli, A. (1993). Modeling circuit breakers in weighted least squares estimation.IEEE Transactions on Power Systems, 8(3):00. Monticelli, A. (2000). Electric power system state estimation. Proceeding of the IEEE, 88(2):262282. Monticelli, A., Garcia, A., and Saavedra, O. R. (1990). Fast decoupled load ow: Hypothesis, derivations, and testing. IEEE Transactions on Power Systems, 5(4):14251431. Moody, J. E. and Darken, C. J. (1989). Fast learning in networks of locally-tuned processing units. Neural Computation, 1:281294. Mori, H. (1991). Application of a revised Boltzmann machive to topological observability analysis. First Int. Forum on Application of Neural Network to Power Systems, pages 281287. Mori, H. and Yuihara, A. (1998). Contingency screening using interval analysis in power sys- tems. Circuits and Systems, 1998. ISCAS '98. Proceedings of the 1998 IEEE International Symposium on, 3:444 447. 201 REFERENCIAS Nakawaga, H., Yayashi, Y., and Iwamoto, S. (1991). Neural network application to state esti- mation. Compuation. First Intenational Forum on Application of N.N. to Power Systems, pages 188194. on a Common Format for the Exchange of Solved Load Flow Data, W. G. (1973). Common data format for the exchange of solved load ow data. IEEE Transactions on Power Apparatus and Systems, PAS-92(6):19161925. Papalexopoulos, A. D. and Hesterberg, T. C. (1990). A regression-based approach to short- term system load forecasting. IEEE Transactions on Power Systems, 5(4):15351547. Park, D. C., El-Sharkawi, M. A., II, R. J. M., Atlas, L. E., and Damborg, M. J. (1991a). Electric load forecasing using an articial neural network. IEEE Transactions on Power Systems, 6(2):442449. Park, J. H., Park, Y. M., and Lee, K. Y. (1991b). Composite modeling for adaptive short- term load forecasting. IEEE Transactions on Power Systems, 6(2):450457. Pereira, M. V. F., Maceira, M. E. P., Oliveira, G. C., and Pinto, L. M. V. G. (1992). Combining analytical models and Monte-Carlo techniques in probabilistic power system analysis. IEEE Transactions on Power Systems, 7(1):265272. Ramanathan, R., Engle, R., Granger, C. W. J., Vahid-Araghi, F., and Brace, C. (1997). Short-run forecasts of electricity loads and peaks. Int. J. Forecast, 13:161174. Refaee, J. A., Mohandes, M., and Maghrabi, H. (1999). Radial basis function networks for contingency analysis of bulk power systems. IEEE Transactions on Power Systems, 14(2):772778. Riedmiller, M. and Braun, H. (1993). A direct adaptive method for faster Backpropagation learning: the RPROP algorithm. IEEE International Conference on Neural Networks, 1:586 591. Robnik-Sikonja, M. and Kononenko, I. (1997). An adaptation of Relief for attibute estima- tion in regression. Proceeding of the 14th International Conference on Machine Learning ICML'97. 202 REFERENCIAS Rumelhart, D. E., Hinton, G. E., and Williams, R. J. (1986). Learning internal representa- tions by error propagation. Parallel Distributed Proccessing, 1:310362. Sadownik, R. and Barbosa, E. P. (1999). Short-term forecasting of industrial electricity consumption in Brazil. Int. J. Forecast, 18:215224. Sandoval, F., García-Lagos, F., and Joya, G. (2002). Design of articial neural networks using evolutionary computation. Approaches Connexionnistes en Sciences Economiques et de Gestion (ACSEG 2002), pages 181200. Santos, J. R., Expósito, A. G., and Ramos, J. L. M. (1999). Distributed contingency analysis: Practical issues. IEEE Transactions on Power Systems, 14(4):13491354. Saraiva, J. T., Miranda, V., and Pinto, L. M. V. G. (1996). Generation / transmission power system reliability evaluation by Monte-Carlo simulation assuming a fuzzy load description. IEEE Transaction on Power Systems, 11(2):690695. Sargunaraj, S., Gupta, D. P. S., and Devi, S. (1997). Short-term load forecasting for de- mand side management. IEE Proceeding on Generation, Transmission and Distribution, 144(1):6874. Senjyu, T., Takara, H., Uezato, K., and Funabashi, T. (2002). One-hour-ahead load fore- casting using neural network. IEEE Transactions on Power Systems, 17(1):113118. Sidhu, T. S. and Cui, L. (2000). Contingency screening for steady-state security analysis by using FFT and articial neural networks. IEEE Transactions on Power Systems, 15(1):421426. Simoes Costa, A. and Leao, J. A. (1993). Identication of topology errors in power systems state estimation. IEEE Transactions on Power Systems, 8(4):15311538. Singh, H. and Alvarado, F. (1995). Network topology determination using least absolute value state estimation. IEEE Transactions on Power Systems, 10(3):11591165. Singh, N. and Glavitsch, H. (1991). Detection and identication of topological errors in online power system analysis. IEEE Transactions on Power Systems, 6(1):324331. 203 REFERENCIAS Slutsker, I. W. and Mokhtari, S. (1995). Comprehensive estimation in power systems: State, topology and parameter estimation. Proceeding of the 1995 American Power Conference, pages 17. Soliman, S. A., Persaud, S., El-Nagar, K., and El-Hawary, M. (1997). Application of least absolute value parameter estimation based on linear programming to short-term load forecasting. Elect. Power and Energy Systems, 19(3):209216. Souza, J. C. S., Leite da Silva, A. M., and Alves da Silva, A. P. (1996). Data debugging for real-time power system monitoring based on pattern analysis. IEEE Transactions on Power Systems, 11(3):796803. Souza, J. C. S., Leite Da Silva, A. M., and Alves Da Silva, A. P. (1997). Data visualization and identication of anomalies in power systems state estimation using articial neural network. IEE Proceeding on Generation, Transmission and Distribution, 144(5):445455. Souza, J. C. S., Leite da Silva, A. M., and Alves da Silva, A. P. (1998). Online topology determination and bad data suppression in power system operation using articial neural networks. IEEE Transactions on Power Systems, 13(3):796803. Srinivasan, D., Liew, A. C., and Chang, C. (1994). Forecasting daily load curves using a hybrid fuzzy-neural approach. IEE Proceeding on Generation, Transmission and Distri- bution, 141(6):561567. Srinivasan, D., Tan, S., Chang, C., and Chan, E. K. (1999). Parallel neural network-fuzzy expert system strategy for short-term load forecasting: System implementation and per- formance evaluation. IEEE Transactions on Power Systems, 14(3):11001106. Srivastava, S. C. and Veankataraman, D. (1997). Short-term load forecasting using recurrent neural networks. Proceeding of the 4th Conference on Advances in Power System Control, Opearation and Management, APSCOM-97, Hong Kong, pages 145150. Swarup, D. S. and Satish, B. (2002). Integrated ANN. approach to forecast load. IEEE Computer Application in Power, pages 4651. Sympson, P. K. (1990). Articial Neural Systems. Fundations, Paradigms, Application, and Implementation. Pergamon Press. 204 REFERENCIAS Taylor, J. W. and Majithia, S. (2000). Using combined forecasts with changing wights for electricity demand proling. J. Oper. Res. Soc., 51(1):7282. Teixeira, M. A., Zaverucha, G., da Silva, V. N. A. L., and Ribeiro, G. F. (1999). Recurrent neural gas in electric load forecasting. International Joint Conference on Neural Networks, 5:34683473. Tibshirani, R. (1996). A comparison of some error estimates for neural network models. Neural Computation, 8:152163. Vaahedi, E., Fuchs, C., Xu, W., Mansour, Y., Hamadanizadeh, H., and Morison, G. (1999). Voltage stability contingency screening and ranking.IEEE Transaction on Power Systems, 14(1):256265. Vermaak, J. and Botha, E. (1998). Recurrent neural networks for short-term load forecasting. IEEE Transactions on Power Systems, 13(1):126132. Vinod Kumar, D. M., Srivastava, S. C., Shah, S., and Mathur, S. (1996). Topology processing and static state estimation using articial neural networks. IEE Proceeding in generation, transmission and distribution, 143(1):99105. Warwick, K., Ekwue, A., and Aggarwal, R., editors (1997). Articial Intelligence Tech- niques in Power Systems. IEE Power Engineering Series 22. The Institution of Electrical Engineers. Wilkosz, K. (1995). Critical evaluation of methods for power system topology verication. Procceeding of the IEEE/KTH Stockholm power Tech. Conference. Stockholm, Sweden, pages 152157. Wood and Wollenberg (1994). An Introduction to State Estimation in Power System, chap- ter 12, pages 391439. John Whiley. Wu, F. F. and Wen-Hsiung, E. L. (1989). Detection of topology errors by state estimation. IEEE Transaction on Power Systems, 4(1):176183. Yan, H. H., Chow, J. C., Kam, M., Fischl, R., and Sepich, C. R. (1991). Hybrid expert system neural network hierarchical architecture for classifying power system contingencies. 205 REFERENCIAS Proceedings of the First International Forum on Applications of Neural Networks to Power Systems, pages 7682. Yang, H. T. and Huang, C. M. (1998). A new short-term load forecasting approach using Self-organizing fuzzy ARMAX models. IEEE Transactions on Power Systems, 13(1):217 225. Yang, H. T., Huang, C. M., and Huang, C. L. (1996). Identication of ARMAX model for short term load forecasting: An evolutionary programming approach. IEEE Transactions on Power Systems, 11(1):403408. Yoh-Han, P. (1989). Adaptive pattern Recognition and Neural Networks. Addison-Wesley. Yu, Z. (1996). A temperature match based optimization method for daily load prediction considering DLC eect. IEEE Transactions on Power Systems, 11(2):728733. Zarco Periñán, P. J. and Gómez Espósito, A. (1999).Estimación de Estado y de Parámetros en Redes Eléctricas. Universidad de Sevilla. Secretariado de Publicaciones. Zivanovic, R. and Petroianu, A. (1994). Application of neural computing to the state esti- mation problem. ICPST'94. Bijing, China, pages 8792. 206