ESTUDIS D'INFORMÀTICA
Enviado por Jordi Centro • 6 de Noviembre de 2017 • Tarea • 3.312 Palabras (14 Páginas) • 215 Visitas
- UOC
ESTUDIS D'INFORMÀTICA
Estadística Tardor 2010
- PAC – 1
- No doneu només el resultat dels exercicis, fa falta explicar el motiu dels raonaments que utilitzeu.
- Doneu els resultats numèrics arrodonint a dos decimals.
Cognoms i Nom:
Qüestió 1 (12.5%)
a) Consulteu el Pla d'Estudis de la vostra titulació i el Pla Docent de l'assignatura i esbrineu quines assignatures estan directament relacionades amb l'Estadística (no oblidar-vos de les optatives i els treballs finals de carrera). Trobeu informació de l'assignatura “Mineria de dades”.
L'assignatura Estadística està directament relacionada amb d'altres assignatures del Pla d'Estudis, com ara: Mineria de Dades, Modelatge i Simulació a la Investigació Operativa, TFC Simulació de Xarxes i Sistemes Informàtics i Bases de Dades.
Assignatura Mineria de dades:
Mineria de Dades és una assignatura d'aplicació dels coneixements previs que heu après a Estadística i Bases de Dades i de presentació d'alguns de nous. Es presenten un conjunt de mètodes procedents de la Intel·ligència Artificial, que formen el nucli essencial de la disciplina coneguda com Data Mining.
Contingut de l’assignatura extret de l’Enginyeria Tècnica d'Informàtica de Gestió:
Mòdul 1: El procés de Mineria de Dades
1. Descoberta de coneixement a partir de dades
2. Les fases del procés d'extracció de coneixement
3. Les eines de Mineria de Dades
4. Cas d'estudi de tot el curs: Hyper-Gym
Mòdul 2: Preparació de dades
1. Preliminars: repàs de conceptes estadístics
2. Preliminars: tipus d'atributs
3. Operacions de preparació de dades
4. Tractament de la manca de dades
5. Reducció de dimensionalitat
6. Mètodes de reducció de casos
Mòdul 3: Classificació: arbres de decisió
1. Introducció: l'estructura dels arbres de decisió
2. Mètodes de construcció d'arbres de decisió per classificació: ID3 i C4.5
3. Construcció d'arbres de decisió per regressió i classificació: CART
4. Construcció d'arbres de decisió per predicció numèrica: CHAID
5. Mètodes de construcció d'arbres de decisió multivariants: LMDT
6. Ponderació final dels arbres de decisió
Mòdul 4: Classificació: xarxes neuronals
1. Què són les xarxes neuronals?
2. Algoritmes d'entrenament de xarxes neuronals
3. Ponderació final de les xarxes neuronals
Mòdul 5: Mètodes d'agregació
1. La similaritat, base per a l'agrupació d'objectes
2. Espai, distància i semblança
3. Mètodes d'agregació basats en semblança i mètodes probabilistes
4. Interpretació dels models obtinguts
5. Ponderació dels mètodes d'agregació
Mòdul 6: Regles d'associació
1. Què són les regles d'associació?
2. Construcció de regles d'associació simples
3. Ponderació de les regles d'associació
Mòdul 7: Xarxes bayesianes
1. Què són les xarxes bayesianes
2. Mètodes de construcció de xarxes bayesianes a partir de dades
3. Classificació amb xarxes bayesianes
Mòdul 8: Avaluació de models
1. Avaluació de models classificatoris
2. Validació creuada ("K Cross-Validation")
3. Comparació de rendiments
4. Altres formes d'estimar la qualitat de models predictius
5. Cost
Mòdul 9: Cas d'Estudi
1. El cas dels pous de petroli
2. Preparació de dades
3. Obtenció de models
4. Avaluació i comparació
b) En l'adreça oer.uoc.edu teniu a la vostra disposició un repositori de material docent de matemàtiques.
Una vegada us hàgiu familiaritzat amb aquesta web, digueu de quin tipus són les següents variables:
1) Tipus.
La variable tipus és una variable categòrica o qualitativa, la qual defineix la característica principal del contingut a mostrar.
2) Taxonomia.
La taxonomia és un sistema de classificació enumerada, per tal d’indexar el contingut del repositori. Aquest tipus de dades vendria a ser qualitativa, però codificada, per facilitar-ne l’estudi. Per tant es tracta d’una variable qualitativa.
3) Nombre d'entrades del repositori amb títol “enquesta”.
És un tipus de variable numèrica discreta, on s’engloben totes les entrades que pertanyen a una mateixa categoria, en aquest cas, aquelles que contenen la paraula “enquesta”.
Feu clic en “Comunitats”. Veureu que, actualment, només hi ha recursos d'Estadística i Probabilitats, els quals us poden ser útils en aquesta assignatura. De fet cliqueu sobre aquests recursos i en el camp “buscar per” poseu enquestes. Classifiqueu-les segons la variable tipus i representeu gràficament la seva taula de freqüències.
Tipus | Freqüència absoluta | Freqüència relativa - % | Freqüència absoluta acumulada | Freqüència relativa acumulada - % |
Resum | 3 | 0.1765 – 17.65% | 3 | 0.1765 - 17.65% |
Exercici | 14 | 0.8235 – 82.35% | 17 | 1.0000 - 100% |
Totals | 17 | 1.0000 - 100.00% |
[pic 1]
Qüestió 2 (12.5%)
Hem mesurat la velocitat de baixada (en KB/s) de 92 arxius allotjats en un servidor en un determinat moment del dia. Els resultats són:
145 | 110 | 190 | 155 | 150 | 190 | 155 | 116 | 120 |
135 | 160 | 160 | 130 | 175 | 153 | 138 | 121 | 108 |
150 | 150 | 116 | 150 | 130 | 102 | 123 | 112 | 180 |
215 | 130 | 165 | 140 | 150 | 95 | 120 | 150 | 155 |
145 | 180 | 125 | 122 | 155 | 157 | 190 | 115 | 175 |
133 | 170 | 115 | 155 | 150 | 140 | 135 | 140 | 150 |
138 | 148 | 155 | 150 | 142 | 164 | 155 | 155 | 170 |
135 | 170 | 150 | 125 | 118 | 170 | 180 | 108 | 130 |
145 | 190 | 185 | 125 | 160 | 110 | 130 | 155 | 136 |
140 | 118 | 131 | 125 | 145 | 145 | 195 | 125 | 160 |
120 | 155 |
Es demana:
...