La Metodología Rough Set Frente Al Análisis Discriminante En Los Problemas De Clasificación Multiatributo
Enviado por dlloswemp • 7 de Enero de 2012 • 3.728 Palabras (15 Páginas) • 787 Visitas
La metodología Rough Set frente al Análisis Discriminante en los problemas de clasificación multiatributo
M.J. Segovia Vargas, J.A. Gil Fana, A. Heras Martínez, J.L. Vilar Zanón
Dpto. de Economía Financiera y Contabilidad I, Facultad de C. Económicas y
Empresariales, Universidad Complutense de Madrid, Campus de Somosaguas, 28223
Madrid, e-mail mjsegovia@ccee.ucm.es.
Resumen
Muchas decisiones financieras implican la clasificación de una observación
(empresas, títulos...) en una categoría o grupo, lo que ha propiciado la aplicación de
métodos de investigación operativa a los problemas financieros. Un caso particular de los
problemas de clasificación, es cuando el número de grupos se limita a dos. Existen
numerosos estudios financieros dedicados a los problemas de clasificación binaria:
clasificación de créditos entre fallidos y no, fusiones y adquisiciones, clasificación de bonos
o la predicción del fracaso empresarial. Se han empleado numerosos métodos estadísticos
para abordar los problemas mencionados. En la mayoría de las ocasiones, las variables
explicativas utilizadas no suelen cumplir las hipótesis estadísticas que requieren estos
métodos, lo cual ha motivado la búsqueda de otras herramientas que superen estos
inconvenientes como es la Teoría Rough Set.
Este trabajo describe una investigación empírica consistente en un estudio
comparativo de la utilización del Análisis Discriminante y de la Teoría Rough Set sobre un
sistema de información compuesto por 72 empresas españolas de seguros no-vida descritas
mediante 21 ratios financieros. Hemos comparado su efectividad aplicándolos a la
detección de la insolvencia como problema de clasificación multiatributo entre empresas
sanas y fracasadas y utilizando como atributos los ratios financieros.
Abstract
Many managerial decisions involve classifying an observation (firms, shares…) into
one of several groups, and this has led to apply methods of operational research to financial
problems. A special case of this problem is binary classification. Extensive literature has
been devoted to studying binary classification in financial field: credit scoring, merger and
acquisition, bond rating or business failure prediction. Most methods applied to manage the
mentioned problems are statistical. Very often, the variables employed do not satisfy
statistical assumptions, so other approaches have been proposed to avoid these
inconveniencies such as Rough Set Theory.
This paper presents a comparative study of the use of Discriminant Analysis and
Rough set Theory on an information system consisted of 72 Spanish non-life insurance
companies described by 21 financial ratios. We have compared them to predict business
failure as a multiattribute sorting problem into healthy or failed firms and using financial
ratios as attributes.
Palabras clave: clasificación multiatributo, insolvencia, rough set, análisis discriminante
2
1.- INTRODUCCIÓN
Con frecuencia los decisores se enfrentan a un grupo de datos formado por un
conjunto de objetos (observaciones, individuos, estados, empresas....) descritos por otro
conjunto constituido por los valores de determinados atributos para dichos objetos.
Normalmente los objetos se clasifican en clases o categorías en base al conocimiento de un
experto para un dominio determinado. Estos datos y su clasificación representarían la
experiencia pasada de un decisor (entendiendo experiencia en un sentido amplio) y
constituyen un sistema de información.
Es decir, un tipo de problemas de decisión con atributos múltiples son los problemas
de clasificación. Dentro de los problemas de clasificación existe una clase más especial que
es cuando la clasificación es binaria, es decir, en este caso la clasificación multiatributo
consiste en la asignación de cada objeto (descrito por un conjunto de valores de atributos) a
una clase o categoría previamente establecida. La predicción del fracaso empresarial es un
ejemplo claro de este tipo de problemas ya que pretendemos asignar empresas (nuestros
objetos), descritas por los valores de un conjunto de atributos (ratios financieros), a una
clase o categoría (sana o fracasada).
Se han aplicado numerosos métodos estadísticos para afrontar este problema. El
análisis discrimínate ha sido uno de los métodos pioneros para abordar esta cuestión
(Altman, 1968).
En general, la discriminación de tipo estadístico tiene gran aplicación cuando se
trata de clasificar personas, entidades o cosas como pertenecientes a dos o más poblaciones
dadas, en base a la observación de los valores que alcanzan unas variables, previamente
elegidas, de carácter comúnmente cuantitativo.
En el caso de las finanzas aparecen aplicaciones obvias, por ejemplo:
- Clasificar, a los solicitantes de un crédito, en clientes potencialmente buenos o
malos en función de determinados datos contables como pueden ser el grado de
endeudamiento o la liquidez de su negocio.
- Clasificar, a un grupo de empresas, en candidatas potenciales al fracaso o al éxito
en los negocios, según ciertos ratios contables que es el problema real al que nos vamos a
enfrentar.
El análisis discriminante puede ser una buena herramienta de trabajo en el
diagnóstico y pronóstico de crisis empresariales.
Según hemos anticipado, con frecuencia en el problema de predicción de crisis
empresariales se utilizan como variables explicativas los ratios financieros. Estas variables
no suelen cumplir las hipótesis estadísticas que requieren estos métodos. En consecuencia,
hemos buscado otra metodología que no requiera que los datos verifiquen ningún tipo de
hipótesis o que necesite especificar alguna información adicional respecto a los datos.
A comienzos de los ochenta, Pawlak propuso una nueva metodología para abordar
los problemas que hemos mencionado previamente, la Teoría Rough Set.
3
Esta metodología presenta, entre otras, estas ventajas: 1) es útil para analizar
sistemas de información que representan el conocimiento adquirido por la experiencia, 2)
elimina las variables redundantes obteniendo conjuntos mínimos de atributos, lo que reduce
el coste, en tiempo y dinero, del proceso de decisión, 3) se obtienen unas reglas
...