Ensayo Cadenas de Markov.
Jorge Iván SánchezEnsayo17 de Abril de 2016
933 Palabras (4 Páginas)654 Visitas
ENSAYO
APLICACIÓN DE LAS CADENAS DE MARKOV EN GOOGLE
Con el pasar de los años el hombre ha cambiado la forma de adquirir conocimiento, en sus inicios eran simples preguntas, pero luego eran tantos los cuestionamientos acerca de las cosas y el mundo que no bastaba con pequeñas respuestas; los libros ya no eran suficientes para adquirir el conocimiento que se quería y por esta razón, a medida que transcurría el tiempo se empezó a necesitar una fuente de información más grande para responder a todas las preguntas que se tenían; gracias a esta necesidad es que hoy en día se puede acceder a una gran cantidad de información de forma rápida y sencilla sin importar el sitio en el que las personas se encuentren, todo esto es gracias a la Internet, en la que se puede encontrar cualquier cosa que se nos ocurra utilizando un motor de búsqueda, uno de los más usados y conocidos actualmente es Google, en este se realiza una consulta acerca una tema específico y lo normal es que se obtenga una gran cantidad de resultados bien organizados; pero en realidad esto cómo funciona?, como hace Google para buscar lo que solicitamos? y como organiza los resultados obtenidos?, la respuesta a estas preguntas se obtienen con el vector de PageRank que es el corazón del motor de búsqueda de google.
El vector PageRank es el criterio en el que está basado el buscador Google, es el encargado de especificar las páginas web de acuerdo a su importancia, es decir, una página es importante cuando tiene muchos enlaces provenientes de otras páginas y de acuerdo a esto se da una lista ordenada de prioridad de unas páginas sobre otras; de una manera más clara, el criterio funciona por medio de votos que hacen unas páginas a otras, dependiendo la cantidad de votos de la página se define su importancia y calidad.
Además, este vector posee una característica de acuerdo al tiempo de navegación en internet, mientras más tiempo se navegue aumenta la posibilidad de encontrar las páginas con mayor PageRank.
Por otro lado, es importante mencionar que el vector PageRank utiliza una gran herramienta matemática llamada Cadenas de Markov, debido a que el cálculo de este equivale al cálculo del vector estacionario de una cadena de Markov ergódica, por tanto, es necesario comprender y entender en qué consisten para un mejor entendimiento del criterio ya mencionado.
Las Cadenas de Markov son un proceso estocástico, que se aplica cuando existe una concatenación de sucesos, y la probabilidad de cada uno de esos sucesos depende de la probabilidad del evento inmediatamente anterior. Estas cadenas, se pueden mostrar como grafos orientados (es decir, que es importante tomar un punto de partida y otro de llegada en cada arista). [1]
Además de esta definición es importante explicar y conocer el concepto de una matriz de transición. Se considera una cadena de Markov estacionaria y E= {0,…..,N} el conjunto donde toma sus valores. La matriz P dada por P (i,j)= P (X1=j| X0=i) con i, j [pic 1][pic 2] E, se llamara matriz de probabilidad de transición. Esta matriz cumple con las siguientes propiedades: pij [pic 3][pic 4]0 para todo i, j [pic 5][pic 6] E y [pic 7][pic 8] para toda i [pic 9][pic 10]E. [2]
Después de tener una definición clara acerca de las cadenas de Markov y su relación directa con la matriz de transición, se comienza a dar explicación de cómo funcionan en el cálculo del vector PageRank, que es la base fundamental del buscador Google como ya se había dicho inicialmente, en este caso lo que se hace es asignar una matriz que corresponde al flujo de internet, esta se obtiene de un grafo orientado en el cual los estados de la cadena pertenecen a las páginas y las flechas corresponden a los votos de una página a otra; obteniendo de esta manera una matriz estocástica en la que la suma de sus filas es igual a 1. Pero al tener esta matriz aún no se ha logrado calcular el PageRank, para ello se necesita calcular la probabilidad de estado estable que permite establecer la prioridad o importancia debido a la cantidad de solicitudes que ha tenido la página. Por tanto el PageRank que toma el buscador Google es el resultado de la probabilidad de estado estable.
...