Red de conocimiento informático - Aprendizaje de programación - Programación de navajas de bolsillo

Programación de navajas de bolsillo

Si has estudiado estadística durante varios años, probablemente ni siquiera podrás memorizar la definición clásica de estadística. Aquí no me confundo con el corte de porcelana, así que ¿para qué molestarse? ¿Le puedo ayudar en algo? ¿Qué pasó con remolcar el barco? ⒄?怼⒎怼ㄊ?loyal

Después de este proceso, el estado y el papel de muchas disciplinas en el ámbito de las estadísticas quedarán claros de un vistazo. El tema que tomé hoy fue "El campo de la estadística". Para ser honesto, este tema es un poco arrogante. Las personas calificadas para escribir este tipo de temas deberían haber pasado al menos varias décadas en el campo de la estadística.

Desafortunadamente, siempre he defendido que "la gente no debe ser salvaje, es una pérdida de juventud". Sin suficiente entusiasmo y espíritu de lucha es imposible conseguir nada. ¿No podría Ann ser ambiciosa cuando era joven? Esto no viene al caso.

1. Recopilar datos

En términos generales, la fuente de datos no son más que experimentos y encuestas. A menudo, cuando hablamos de estadísticas, no parecemos prestar mucha atención a la recopilación de datos. Sin embargo, el diseño experimental y las técnicas de encuesta (incluido el muestreo) son conocimientos muy útiles. En lo que respecta a nuestra escuela de estadística pura, el estatus del diseño experimental no parece ser demasiado alto, pero los requisitos en bioestadística, estadística médica y otros campos que conozco son particularmente altos. Los estudiantes interesados ​​en estadística biomédica deben prestar atención a este curso. Algunos términos como diseño ortogonal, experimento de bloques aleatorios y experimento de cuadrado latino se abordarán más adelante. El análisis de varianza es generalmente el método de análisis estadístico más básico después del diseño experimental. Las encuestas, por un lado, se apoyan en teorías estadísticas (ley de los grandes números, estadística matemática, teoría del muestreo, etc.). ), por otro lado, implica tecnología práctica. Todos los estudiantes que han realizado encuestas deben comprender el "trabajo duro" de las encuestas. Por supuesto, si contamos con la guía de las estadísticas, también descubriremos algunas técnicas que hacen que las personas sean más inteligentes. Por ejemplo, los oyentes (sujetos de la encuesta) generalmente no informan sobre el consumo de drogas (no están dispuestos a decirle al entrevistador que consumen drogas) y dejan el suspenso aquí por el momento, si no se conoce la respuesta de antemano, puede que sea así; Es difícil imaginar que este asunto tenga algo que ver con el lanzamiento de la moneda.

Para nuestra Escuela de Estadística (conocida por sus sólidas capacidades en materia de estadísticas económicas), la contabilidad económica nacional y las estadísticas económicas y sociales también son dos cursos importantes desde la perspectiva de la recopilación de datos. Para dedicarse a las estadísticas económicas, es necesario conocer los entresijos de los datos económicos. De lo contrario, no sabrá dónde se calculan los indicadores estadísticos, cuál es su importancia y cómo se puede hablar de estadísticas económicas.

2. Organiza tus datos

Los datos no significan que puedas analizarlos inmediatamente después de recopilarlos. Cualquiera con experiencia práctica sabe que siempre habrá emergencias en el proceso de recopilación de datos, pero la lluvia es algo que tu madre no puede hacer. Los camaradas que sean holgazanes y no rellenen el cuestionario no pueden ser arrestados ni torturados. Necesito recordarte que debes estar mentalmente preparado. No importa cuán perfecta sea la teoría que te dieron tus maestros y profesores en la escuela, a menudo te toparás con un muro en la realidad. Si los elementos de la encuesta se dejan en blanco, los llamamos valores faltantes y, si se completan al azar, pueden convertirse en valores atípicos o atípicos. Para dichos datos, debemos realizar algún procesamiento por adelantado antes del análisis estadístico posterior; de lo contrario, tendrá algunos efectos adversos en los resultados estadísticos. Estas razones se pueden entender pensando con los dedos de los pies (no con las rodillas). Por supuesto, hay muchas otras cosas involucradas en la disposición de los datos, como la recodificación o algún tipo de cálculo integral. No los discutiré en detalle aquí porque todos son contenido muy antiguo. Permítanme presentarles las técnicas relativamente modernas de estadística que conozco, para que puedan comprender nuestro conocimiento de vanguardia. Con respecto al procesamiento de valores perdidos, se han desarrollado tecnologías de interpolación relativamente completas, que incluyen interpolación media, interpolación de plataforma caliente, interpolación de plataforma fría, interpolación del vecino más cercano, algoritmo EM, Bootstrap, Jackknife, MCMC (Cadena de Monte-Carlo Markov) y otros conocimientos. Creo que si nos fijamos en el desarrollo de las estadísticas modernas, estos términos no le resultarán desconocidos. Para los valores atípicos en los datos, también debe pensar en ellos primero y no eliminarlos fácilmente. La posibilidad de que un millonario surja de un pobre pueblo de montaña no es necesariamente nula, pero puede haber información esclarecedora escondida en los valores atípicos (por ejemplo, el rendimiento académico de un compañero de clase es tan alto que se convierte en un "valor atípico". No podemos tratarlo como un "valor atípico". Se le "elimina" de la clase y se debe utilizar su experiencia de aprendizaje en su lugar).

3. Analizar datos

Es innegable que la mayor parte de la demanda de estadísticas de la sociedad actual radica en este ámbito. El tigre de papel de la estadística matemática disuadirá a muchos camaradas con poca capacidad matemática. Muchos términos estadísticos, como el valor p, el intervalo de confianza y la estadística chi-cuadrado, confundirán a muchas personas (una vez se lo expliqué a un camarada). mucho tiempo x El coeficiente de correlación con la variable y, la otra parte no entendió si era vida o muerte, me volví loco), si introduce algunos métodos de análisis estadístico ligeramente avanzados, como el modelado de ecuaciones estructurales, podrá perderse en las nubes. Sin embargo, los golpes del análisis estadístico parecen no tener fin. Finalmente descubrieron que el software estadístico era de poca utilidad y su compra costaba mucho dinero. Lo que es aún más aterrador es que todos están en inglés... Creo que deben estar pensando, Dios, si hay una vida futura, yo... debo aprender estadística...

Como estadístico, no seas demasiado orgulloso. En primer lugar, es posible que no sepa cómo utilizar métodos de análisis estadístico. En segundo lugar, incluso si lo tienes, es posible que no puedas utilizarlo en el lugar correcto. Ésta es un área que apenas puedo cubrir, porque cientos de años de desarrollo han dificultado resumir completamente los métodos estadísticos. La clasificación más sencilla es la estadística descriptiva y la estadística inferencial (de hecho, según el libro de C. R. Rao, también debería incluirse el análisis estadístico exploratorio, todos deberíamos saber que los datos son datos); Necesitamos procesar y refinar la información en función de los datos originales, para que las personas puedan tener una comprensión general de un conjunto de datos (muestra), como el PIB de un país. Es imposible que la Oficina Nacional de Estadísticas revele a la gente cuántos huevos compró la familia Zhang, cuánto produce la Red Star Factory en un año, etc. , sino publicar un total para que la gente tenga una comprensión general de la fuerza nacional de China. La estadística inferencial requiere algo de teoría estadística avanzada y el apoyo más importante es la estadística matemática, por lo que todos deben aprender bien este curso. Ya sabes, la estadística matemática no es nada difícil en comparación con los cursos de matemáticas del departamento de matemáticas. Las estadísticas inferenciales se pueden dividir en estadísticas paramétricas y estadísticas no paramétricas dependiendo de si se requieren suposiciones sobre la distribución. Este último apareció relativamente tarde, por lo que puede que no sea tan bueno como el primero en teoría y aplicación. La comparación entre los dos es suficiente para escribir un artículo extenso, así que lo dejaré así. Sin embargo, pase lo que pase, desde estadísticas paramétricas hasta estadísticas no paramétricas, su pensamiento estadístico definitivamente sufrirá un cambio importante. Si lo aprendes con suficiente profundidad, incluso podrás relacionar con él las ganancias y pérdidas de la vida. Bromas aparte, a veces las estadísticas realmente pueden darnos una perspectiva de la vida.

Me temo que los términos relacionados no se pueden enumerar en una o dos páginas: análisis de correlación (incluido el análisis de correlación canónica), análisis de regresión (incluida la regresión de búsqueda de proyecciones y la regresión cuantil), análisis de correspondencia, análisis de confiabilidad, Análisis de supervivencia, análisis de conglomerados, análisis discriminante, análisis factorial, análisis de ruta, análisis de componentes principales. Si solo conoce el método de mínimos cuadrados ordinarios (OLS) y no conoce el término mínimos cuadrados parciales (PLS), solo significa que todavía está vagando en un mundo antiguo y necesita trabajar más duro.

En cuanto a los métodos de análisis de datos, por supuesto, primero debemos sentar una base sólida y dominar esos métodos básicos. Si queremos lograr algo en el campo de los métodos, regresemos a casa y leamos varias veces la teoría de la probabilidad y la estadística matemática, y luego comencemos a leer libros de texto y artículos extranjeros. Me encuentro con esta situación todo el tiempo y aquí hay una forma de hacerlo. Creo que los primeros artículos en el extranjero datan de las décadas de 1960 y 1970, mientras que los primeros artículos en China suelen ser del siglo XXI. Se puede ver que existe una enorme brecha entre la investigación de métodos nacionales y extranjeras. Las personas inteligentes encontrarán el "mercado" aquí, así que no intentaré engañarlos. Será perjudicial para el desarrollo a largo plazo de las estadísticas nacionales.

Otro punto que es necesario recordar es que los métodos de análisis estadístico a menudo tienen supuestos o premisas teóricas, por lo que debes prestarles atención en las aplicaciones prácticas. Primero, compruebe si los datos cumplen con nuestras condiciones teóricas. No los analice tal como están, incluso si el software estadístico le dará resultados hermosos "sin pensar". El software estadístico a veces puede ser bastante dañino, así que no confíe en él por completo.

4. Visualización de datos

Creo que no hay gente perezosa en el mundo, por lo que la expresión de datos también debe ser una ciencia. Si muestra a otros el valor p obtenido por el software estadístico en la vida real, es probable que le den una paliza si se atreve a decirles a los demás que la posición de la piedra en el mapa de grava del análisis de conglomerados indica el tamaño de la raíz característica; entonces la probabilidad de ser aplanado se aproximará uniformemente a 1.

Las estadísticas se utilizan para ilustrar problemas, no para asustar a la gente. Para expresar los resultados de nuestro análisis a otros, se requiere una cierta cantidad de "conversión". No subestimes la presentación de los datos. Algunos métodos estadísticos están en "rojo" porque la gente encuentra explicaciones inteligentes para los resultados de sus análisis.

Lo anterior es una expresión estadística, y también debemos prestar atención a las cuestiones de apariencia y forma. Si los datos de la tabla no están alineados a la derecha (o los puntos decimales no están alineados), o los gráficos son llamativos o rústicos, entonces la validez de las estadísticas se verá comprometida, aunque esto sea sólo una "cuestión superficial". Después de estudiar estadística durante tanto tiempo, debes saber que el título del gráfico debe escribirse debajo del gráfico y el título de la tabla debe escribirse encima de la tabla. Al leer artículos, preste más atención a cómo se expresan los demás.

Entonces, aquí se introducen las estadísticas en sí desde el proceso. Permítanme hablar brevemente sobre la tendencia de desarrollo de las estadísticas que he visto: por un lado, es la tendencia a combinar disciplinas. Es difícil basarse en una sola disciplina. El impulso para el desarrollo de las estadísticas proviene cada vez más de otras disciplinas. Si estas disciplinas no hubieran planteado "dificultades" a las estadísticas, el desarrollo de las estadísticas podría haberse detenido hace mucho tiempo. La medicina le preguntará, ¿cómo diseñar experimentos que no sólo puedan obtener resultados estadísticos significativos sino también ahorrar costos? La psicología te preguntará, la inteligencia emocional humana es una variable oculta, ¿cómo se debe medir? El Instituto de Finanzas le preguntó cómo lidiar con la heterocedasticidad de los datos de series temporales en el mercado de valores. La Marketing Society le pregunta: ¿cómo extraer información útil sobre productos a partir de los datos masivos de los supermercados? Las facultades de derecho te preguntarán: ¿cuál es la probabilidad de que alguien mate a alguien? La Sociedad de Periodismo y Comunicación te pregunta ¿qué tan alto es el verdadero índice de apoyo a un candidato? Espera... Por otro lado está la tendencia de aplicación generalizada de las computadoras. También me gustaría subrayar que en el futuro los ordenadores desempeñarán un papel cada vez más importante en las estadísticas. Es absolutamente imposible alcanzar al Mercedes Benz 3.2. Cuando se trata de computadoras, las habilidades de programación son las más importantes. Esta frase es para aquellos estudiantes que quieren pasar a la vanguardia de la era estadística. Los métodos estadísticos se están desarrollando tan rápidamente que muchos programas estadísticos no pueden seguir el ritmo. Por lo tanto, si domina la tecnología de programación informática, no tiene por qué estar restringido por el software estadístico.

Estudié en la Escuela de Estadística de la Universidad Renmin de China durante cuatro años y tenía muchos sentimientos y quejas. No hay nada bueno que decir sobre la vida. Será mejor que aprendas a ser autosuficiente lo antes posible. Tienes más de 18 años. Escuche "Sailor" de Zheng Zhihua cuando tenga tiempo.

Hablemos de aprendizaje:

En primer lugar, no esperes que tu profesor te enseñe todos los conocimientos, pero también entiende que lo que aprendes es muy incompleto. A diferencia de la escuela secundaria, la universidad no es sólo un lugar para enseñar, sino también un lugar para la colisión y el intercambio de ideas. Si todavía estás anotando cada palabra que dice el profesor en clase, es posible que no entiendas qué es la universidad. Un profesor no puede enseñar el complejo sistema de estadística en unas pocas clases. El profesor puede decirte de qué se trata la estadística y el resto depende de ti trabajar duro.

En segundo lugar, estudiar libros no es difícil. Quizás esta sea una de las diferencias entre la universidad y la escuela secundaria. Reprobar una pregunta en la escuela secundaria podría afectar los puntajes de tus exámenes, y la universidad no es el lugar para avergonzarse. Si este camino no funciona, puedes tomar otro. Si no es bueno en los puntos, no es necesario que lea detenidamente dónde se utilizan los puntos en el libro. En resumen, debe tener sus propias ventajas y luego prestar atención a cultivar sus propias ventajas para desarrollarse lo más rápido posible. Pero dicho esto, no dejes que te engañe. No estoy diciendo que puedas abandonar algunos cursos a voluntad. Todavía es necesario sentar las bases. En estas condiciones, puedes elegir la dirección en la que eres bueno.

Nuevamente, no ignore los ricos recursos de la biblioteca, que incluyen no solo libros sino también una gran cantidad de recursos electrónicos. Presta atención a Internet. La escuela compró una gran cantidad de bases de datos de tesis, lo cual es realmente una lástima. Puede ponerse en contacto con las publicaciones estadísticas allí lo antes posible, lo cual es muy beneficioso para escribir artículos y ampliar sus conocimientos.

Por último, no tengas miedo de las personas mayores. Todos saben que el canibalismo es ilegal, por lo que puedes pedir consejo, aprender de los demás y evitar desvíos. Desafortunadamente, ningún mayor me dijo esto, así que siempre tuve miedo de que los mayores me comieran...

Además, debes usar bien el inglés. No te dije que aprendieras bien inglés.

Además, no te tumbes en el suelo estudiando día y noche. (Por supuesto, no seas como yo y nunca asistas al autoestudio).