Directorio de algoritmos de red inteligente
1.1 Ejemplos de aplicaciones web inteligentes 3
1.2 Elementos básicos de las aplicaciones inteligentes 4
1.3 ¿Qué aplicaciones se beneficiarán de la inteligencia? Cinco
Red Social 6
1.3.2 Mashup 7
1.3.3 Portal 8
1.3.4 Wiki 9
1.3.5 Sitio web para compartir archivos 9
1.3.6 Juego en línea 11
1.4 ¿Cómo crear aplicaciones inteligentes? 11
1 . 4 . 1 Consulte funciones y datos 12
1.4.2 Obtenga más datos 12
1.5 Aprendizaje automático, minería de datos y más 16
1.6 Ocho malentendidos comunes en aplicaciones inteligentes 17
1.6.1 Malentendido 1: Los datos son confiables18
1.6.2 Malentendido 2: El cálculo se puede completar inmediatamente19.
1.6.3 Malentendido 3: No es necesario considerar el tamaño de datos de 19.
1.6.4 Malentendido 4: No considerar la escalabilidad de la solución19
1.6.5 Malentendido 5: Usar el mismo método en todas partes19
1.6Mito 6: Siempre podrás conocer el tiempo de cálculo20.
1.6.7 Mito 7: Los modelos complejos son mejores 20
1.6.8 Mito 8: ¿Existen modelos sesgados 20
1.7 Resumen 20
1.8 Cita 21
2 Buscar 22
2.1 Buscar con Lucene 23
2.1.1 Comprender el código de Lucene 24
2.1 .2 Pasos básicos para la búsqueda 31
2.2 ¿Por qué la búsqueda es algo más que una simple indexación? 33
2.3 Mejorar los resultados de búsqueda mediante el análisis de enlaces 35
2 3 1 ranking de página 35 Introducción
2.3.2 Calcular el vector de PageRank 37
2 3 . 3 alfa: El impacto de saltar entre páginas 38
2.3.4 Comprender el método de potencia 40
2.3.5 Puntuación de índice integral y puntuación de PageRank 45<. /p>
2.4 Mejora de los resultados de búsqueda en función de los clics de los usuarios 47
0 clics de los usuarios 48
2.4.2 Uso del clasificador Naive Bayes 50
2.4 .3 Integrar el índice de Lucene, el PageRank y los clics de los usuarios 54
2.5 Clasificación de documentos no vinculados, como Word y PDF 58
2.5.1 Introducción al algoritmo DocRank 58
p >2 . 5 . 2 El principio de clasificación de documentos 60
2.6 Cuestiones relacionadas con la implementación a gran escala 65
2.7 ¿Obtienen los usuarios los resultados que desean? Precisión y recuperación 67
2.8 Resumen 69
2.9 Cómo hacer 70
2.10 Referencia 72
3 Sistemas recomendados 73
3.1 Tienda de música en línea: conceptos básicos 74
3.1.1 Conceptos de distancia y similitud 75
3.1.2 Cálculo de similitud cercana 80
3.1.3 ¿Cuál es la mejor fórmula de cálculo de similitud? 83
3.2 Cómo funcionan los motores de recomendación 84
Recomendaciones basadas en usuarios similares 85
3.2.2 Recomendaciones basadas en proyectos similares 94
3.2.3 Recomendaciones basadas en contenido 98
3.3 Recomendar amigos, artículos e informes de noticias 104
3 3 1 MyDiggspace com 105 Introducción
3.3.2. Encuentra amigos 106
3 . 3 Funcionamiento interno de Digg Delphi 108
3.4 Películas recomendadas 114 Me gusta Netflix com.
3.4.1 Introducción y recomendación de conjuntos de datos de películas 114
3.4.2 Estandarización de datos y coeficiente de correlación 117
3.5 Implementación y evaluación a gran escala 123< / p>
3.6 Resumen 124
3.7 Tareas pendientes 125
3.8 Referencia 127
4 Agrupación: Agrupación de cosas 128
4.1 Requisitos del cluster 129
4.1.1 Grupo de usuarios del sitio web: caso de estudio 129
4.1.2 Agrupación con orden SQL según la cláusula 131.
4.1.3 Agrupación 132 por ordenación de matrices.
4.2 Descripción general de los algoritmos de agrupamiento 135
4.2.1 Clasificación de los algoritmos de agrupamiento según la estructura de agrupamiento 136
4.2.2 Agrupación según el tipo y la estructura de datos Algoritmo clasificación 137
4.2.3 Clasificación del algoritmo de clustering según el tamaño de los datos 137.
4.3 Algoritmo basado en enlaces 138
4.3.1 Diagrama de árbol: estructura básica de datos de agrupamiento 139.
4.3.2 Descripción general de los algoritmos basados en enlaces 141
4.3.3 Algoritmo de enlace único 142
4.3.4 Algoritmo de enlace promedio 144
4.3.5 Algoritmo de árbol de expansión mínimo 147
4.4 Algoritmo k-means 149
4.4.1 Satisface el algoritmo k-means 150.
4. 4. Principios internos de 2K-means 151
4.5 Agrupación de enlaces robustos (ROCK) 153
4.5.1 Introducción a las rocas 154
4.5.2 ¿Por qué el rock and roll es tan poderoso? 154
4.6 DBSCAN 159
4.6.1 Introducción al algoritmo de densidad 159
4 6 2 El principio de DBS puede 162
4.7.1 Complejidad computacional 166
4.7.2 Tamaño alto 167
4.8 Resumen 168
4.9 Tareas pendientes 169
4.10 Referencia 171
5 Categoría: Poner las cosas donde deben estar 172
5.1 Clasificación de la demanda 173
5.2 Descripción general del clasificador 177
5.2.1 Algoritmo de clasificación estructural 178
5.2.2 Algoritmo de clasificación estadística 180
5.2.3 Ciclo de vida del clasificador 181
5.3 Clasificación automática de correo electrónico y filtrado de spam 182
5.3.1 Clasificación Naive Bayes 184
Clasificación basada en reglas 197
5.4 Fraude detección mediante redes neuronales 210
5.4.1 Casos de uso para la detección de fraude en datos de transacciones 210
5.4.2 Descripción general de las redes neuronales 212
5.4.3 Disponible detectores de fraude de redes neuronales 214
5.4.4 Análisis de detectores de fraude de redes neuronales 218
5.4.5 Creación de una clase base para redes neuronales generales 226
5.5 Son ¿Sus resultados son creíbles? 232
5.6 Clasificación de grandes conjuntos de datos 235
5.7 Resumen 237
5.8 Lista de tareas pendientes 239
5.9 Referencias 242 p> p>
6 Carteras de clasificadores 244
6.1 Valor crediticio: un estudio de caso de carteras de clasificadores 246
6.1.1 Resumen de datos 247
6.1 .2 Generación de datos artificiales de preguntas reales 250
6.2 Evaluación de crédito utilizando un único clasificador 255
6.2.1 Línea base Naive Bayes 255
Línea base del árbol de decisión 258
Línea base de la red neuronal 260
6.3 Comparación de varios clasificadores en el mismo conjunto de datos 263
Prueba de McNemar 264
6.3 .2 Prueba de proporción de diferencias 266
6.3.3 Prueba Q de Cochran y prueba f 268
6.4 Empaquetado: Agregación guiada (agregación guiada) 270
Ejemplo de bolsa de instalación 272
6.4.2 Detalles inferiores del clasificador de ensacado 274
Conjunto de clasificadores 276
6.5 Impulso: un método de mejora iterativo 279
6.5.1 Ejemplo de clasificador mejorado 280
6.5.2 Detalles inferiores del clasificador mejorado 282
6.6 Descripción general 286
6.7 Elementos a realizar 288
6.8 Referencias 292
7 Colección de tecnología inteligente: Portal de noticias inteligente 293
7.1 Descripción general de funciones 295
7.2 Obtener y limpiar contenido 296
7.2.1 Obtener en su lugar, prepárate, ¡adelante! 296
7.2.2 Revisión de conocimientos de preparación de búsqueda 298
7.2.3 Conjuntos de datos de noticias capturados y procesados 299
7.3 Búsqueda de noticias 301
7.4 Asignación de categorías de noticias 304
7.4.1 Problemas de secuencia 304
7.4.2 Clasificación con nuevos procesadores 309
7.4.3 Clasificadores 310
p>7.4.4 Estrategia de clasificación: más allá de la clasificación subyacente 313
7.5 Crear agrupaciones de noticias utilizando la clase de procesador de noticias 316
7.5.1 Agrupar todos los artículos 317
7.5.2 Agregar artículos 321 en la categoría Noticias
7
.6 Presentación dinámica de contenido basada en calificaciones de los usuarios 325
7.7 Resumen 328
7.8 Lista de tareas pendientes 329
7.9 Referencias 333
Apéndice a Introducción a BeanShell 334
A.1 ¿Qué es BeanShell? 334
A.2 ¿Por qué utilizar BeanShell? 335
A.3 Ejecución de BeanShell 335
A.4 Referencias 336
Apéndice b Adquisición de red 337
B.1 Descripción general del rastreo de componentes animales 337
B.1.1 Pasos para obtener 338
B.1.2 Nuestro rastreador simple 338
B.1.3 Rastreador web de código abierto 339
B.2 Referencias 340
Apéndice C Revisión de conocimientos matemáticos 341
C.1 Vectores y matrices 341
C.2 Medición de distancia
p>C.3 Métodos matriciales avanzados 344
C.4 Referencias
Apéndice d Procesamiento del lenguaje natural 345
D.1 Referencias 347 p>
Apéndice e Red neuronal 348
E.1 Referencia 349
Índice 350